Langsung ke konten utama

Big Data Solution

 


Dari mana ‘Big Data’ berasal?

Istilah ‘Big Data’ telah digunakan sejak awal 1990-an. Meskipun tidak diketahui secara pasti siapa yang pertama kali menggunakan istilah tersebut, sebagian besar sesepuh ahli teknologi informasi menyebut  John R. Mashey (yang pada saat itu bekerja di Silicon Graphics) yang membuat istilah tersebut populer.

Pada hakikatnya, Big Data bukanlah sesuatu yang benar-benar baru. Selama berabad-abad, orang telah mencoba menggunakan analisis data dan teknik analisis untuk mendukung proses pengambilan keputusan mereka. Orang Mesir kuno sekitar 300 SM sudah mencoba untuk menangkap semua ‘data’ yang ada di perpustakaan Alexandria.

Selain itu, Kekaisaran Romawi biasa menganalisis statistik militer mereka dengan cermat untuk menentukan distribusi optimal bagi pasukan mereka.

Namun, dalam dua puluh tahun terakhir, volume dan kecepatan data yang dihasilkan telah berubah di luar ukuran pemahaman manusia.

Jumlah total data di dunia adalah 4,4 zettabytes pada tahun 2013, dan terus meningkat tajam menjadi 44 zettabytes pada tahun 2020. Sebagai perbandingan, 44 zettabytes setara dengan 44 triliun gigabyte.

Bahkan dengan teknologi tercanggih saat ini, tidak mungkin untuk menganalisis semua data ini. Kebutuhan untuk memproses kumpulan data yang semakin besar (dan tidak terstruktur) ini adalah bagaimana analisis data tradisional berubah menjadi ‘Big Data’ dalam dekade terakhir.

Untuk menggambarkan perkembangan ini dari waktu ke waktu, evolusi Big Data secara kasar dapat dibagi menjadi tiga fase utama. Setiap fase memiliki karakteristik dan kemampuannya sendiri. Untuk memahami konteks Big Data saat ini, penting untuk memahami bagaimana setiap fase berkontribusi pada makna kontemporer Big Data.

Big Data fase 1.0 – (periode: 1970 s.d 2000)

Analisis data Big Data berasal dari domain manajemen basis data yang sudah lama ada. Itu sangat bergantung pada penyimpanan, ekstraksi, dan teknik optimasi yang umum dalam data yang disimpan dalam Relational Database Management Systems (RDBMS).

Manajemen basis data dan datawarehouse dianggap sebagai komponen inti Big Data Fase 1 ini.

Ini memberikan dasar analisis data modern seperti yang kita kenal sekarang, menggunakan teknik terkenal seperti Query basis data, pemrosesan analitik online, dan standard reporting tools.

Big Data fase 2.0 – (periode: 2000 s.d 2010)

Sejak awal 2000-an, Internet dan Web mulai menawarkan pengumpulan data unik dan peluang analisis data. Dengan perluasan lalu lintas / traffic website dan toko online, perusahaan seperti Yahoo, Amazon, dan eBay mulai menganalisis perilaku pelanggan dengan menganalisis tingkat klik, data lokasi berdasarkan IP Address, dan log pencarian.

Ini membuka kemungkinan dunia baru analisis data sudut pandang Big Data, lalu lintas traffic web berbasis protokol HTTP memperkenalkan peningkatan besar-besaran dalam data semi-terstruktur dan tidak terstruktur. Selain tipe data terstruktur standar, organisasi sekarang perlu menemukan pendekatan dan solusi penyimpanan baru untuk menangani tipe data baru ini (Log) agar dapat menganalisisnya secara efektif. Kedatangan dan pertumbuhan data media sosial (friendster, facebook, dkk) sangat memperparah ledakan data dan kebutuhan akan alat, teknologi serta teknik analitik yang mampu mengekstrak informasi yang memiliki nilai berarti dari data Log yang tidak terstruktur ini.

Big Data fase 3.0 – (periode: 2010 s.d saat ini(2022))

Meskipun konten tidak terstruktur (unstructured data) berbasis web masih menjadi fokus utama bagi banyak organisasi dalam analisis data pada Big Data mereka (khususnya analisis data media dan sosmed yang paling “laku” di indonesia), perlu diketahui juga Big Data saat ini memungkinkan untuk mengambil data (ingest/collecting data) yang bersumber dari perangkat sensor (semisal : Kamera, GPS, Termostat) dan tentu dari smartphone juga, yang mana smartphone saat ini umumnya sudah memiliki sensor lengkap dalam satu perangkat.

Perangkat smartphone ini tidak hanya memberikan kemungkinan untuk menganalisis data perilaku (seperti klik dan kueri penelusuran), tetapi juga memberikan kemungkinan untuk menyimpan dan menganalisis data berbasis lokasi (data GPS). Dengan kemajuan smartphone ini, dimungkinkan untuk melacak pergerakan, menganalisis perilaku fisik, dan bahkan data terkait kesehatan (jumlah langkah yang Anda ambil per hari). Data ini memberikan berbagai peluang baru, mulai dari transportasi, hingga desain kota dan perawatan kesehatan.

Secara bersamaan, munculnya perangkat berkemampuan internet berbasis sensor meningkatkan penghasil data yang belum pernah ada sebelumnya, biasanya dalam bentuk Log. Dikenal sebagai ‘Internet of Things’ (IoT), SmartTV, termostat, perangkat yang dapat dikenakan (semisal : Smartwatch), dan bahkan lemari es (kulkas) sekarang dapat menghasilkan data setiap hari, melalui sensor-sensor yang tertanam pada setiap perangkat-perangkat tersebut.

Dan perlombaan untuk mengekstrak informasi yang luar biasa besar ini menjadi wawawasan yang bernilai, dari berbagai sumber data baru saja dimulai.