- freepik.com
Mengenal Teknologi Big Data, Teknologi Analisa Data Dengan Jumlah Sangat Besar
tvOnenews.com - Big Data adalah sebuah istilah umum yang mengacu pada teknologi dan teknik untuk memproses dan menganalisa sekumpulan data yang memiliki jumlah yang sangat besar.
Istilah teknologi big data mengacu pada kumpulan data besar yang hampir tidak mungkin dikelola dan diproses menggunakan tools intelijen bisnis tradisional karena jumlahnya yang sangat besar.
Big data terdiri dari data terstruktur, semi terstruktur dan data tidak terstruktur.
Mengolah big data tentu memiliki banyak tantangan yang akan dihadapi mulai dari bagaimana data itu diambil, disimpan, hingga masalah keamanan data tersebut.
Sebenarnya apa yang dimaksud teknologi big data?. Tidak ada definisi yang baku mengenai istilah big data. Namun secara garis besar big data adalah sekumpulan data yang memiliki jumlah yang sangat besar atau struktur yang kompleks sehingga teknologi pemrosesan data tradisional tidak lagi dapat mengolahnya dengan baik.
Istilah big data sering juga digunakan untuk menyebut suatu bidang ilmu atau teknologi yang berkaitan dengan pengolahan dan pemanfaatan data tersebut.
Teknologi big data memiliki 4 karakteristik pilar yang biasa disebut 4V.
1. Volume
Yaitu mengacu pada ukuran data yang perlu diproses. Diketahui saat ini satuan volume data di dunia telah melampaui zettabyte (1021 byte), bahkan telah banyak perusahaan atau organisasi yang perlu mengolah data sampai ukuran petabytes perharinya.
2. Velocity
Adalah ukuran kecepatan data yang bisa dihasilkan. Data yang dihasilkan dengan kecepatan tinggi membutuhkan teknik pemrosesan yang berbeda dari data transaksi data biasa.
3. Variety
Tipe data yang membutuhkan kemampuan pemrosesan dan algoritma khusus. Contoh data dengan variasi tinggi adalah pemrosesan data sosial media, terdiri dari data teks, gambar, suara, dan video.
4. Veracity
Adalah akurasi atau konsistensi data. Data dengan tingkat akurasi tinggi akan memberikan hasil analisis yang berkualitas. Sebaliknya, data dengan akurasi yang rendah mengandung banyak bias, noise dan abnormalitas.
Jika tidak diolah dengan benar, data ini akan menghasilkan ouput yang kurang bermanfaat, bahkan dapat memberikan gambaran bias atau kesimpulan yang keliru. Veracity sendiri merupakan tantangan yang cukup berat dalam pengolahan Big Data.
Contoh Teknologi Big Data
1. Apache Hadoop
2. Apache Hive
3. Apache Spark
Selain 3 contoh teknologi big data tersebut, sebenarnya masih sangat banyak teknologi dan framework big data lain yang bersifat open source seperti HBase, Cassandra, Presto, Storm, Flink, NiFi, Sqoop, Flume, Kafka dan lain sebagainya. (udn)