Apa Itu Big Data?

Data besar adalah pengukuran data yang telah tumbuh begitu besar sehingga database normal tidak dapat menampung dan bekerja dengan sejumlah besar informasi. Data datang dalam tiga ukuran: kecil, sedang dan besar; tak satu pun dari pengukuran ini ketat; sebaliknya, masing-masing lebih bergantung pada kemudahan penggunaan dan jenis mesin apa yang dapat menangani informasi tersebut. Mesin khusus, jauh lebih besar dan kompleks daripada yang digunakan untuk database biasa, diperlukan untuk data besar. Jenis data ini biasanya ditemukan di lembaga pemerintah dan ilmiah, tetapi beberapa situs web yang sangat besar juga berisi informasi dalam jumlah besar ini.

Data datang dalam tiga ukuran standar, tetapi tidak ketat. Data kecil dapat ditampung di satu komputer atau mesin, seperti laptop. Data medium dapat ditampung pada array disk dan paling baik dikelola oleh database. Basis data, tidak peduli seberapa besar, tidak mampu bekerja dengan data besar, dan sistem khusus banyak digunakan sebagai gantinya. Meskipun tidak ada pedoman ketat untuk apa itu big data, biasanya dimulai di sekitar tingkat terabyte (TB) dan naik ke tingkat petabyte (PB).

Mencoba untuk bekerja dengan data besar pada database yang tidak khusus untuk jumlah data ini akan menyebabkan beberapa masalah besar. Basis data tidak mampu menangani jumlah informasi, sehingga beberapa data harus dihapus. Ini seperti mencoba memasukkan 100 gigabyte (GB) pada komputer dengan ruang hard drive hanya 50 GB; itu tidak bisa dilakukan. Data yang tersisa akan sulit untuk dikontrol dan dikelola, karena fungsi apa pun akan membutuhkan waktu lama untuk diselesaikan dan database harus ditutup untuk pengiriman baru.

Meskipun dimungkinkan untuk tetap membeli mesin dan menambahkan data baru ke database, ini menciptakan masalah yang berat. Hal ini dikarenakan software database hanya dibuat untuk bekerja dengan medium data. Kumpulan data yang lebih besar menyebabkan kesalahan dan masalah administratif, karena perangkat lunak tidak dapat memindahkan atau bekerja dengan data besar tanpa mengalami masalah.

Data besar tidak ditemukan oleh sebagian besar organisasi atau situs web. Badan pertahanan dan militer menggunakan jumlah informasi ini untuk membuat model dan menyimpan hasil pengujian, dan banyak lembaga ilmiah besar membutuhkan mesin khusus ini untuk alasan yang sama. Beberapa situs web yang sangat besar membutuhkan mesin data yang besar, tetapi situs web tidak biasa seperti agensi di pasar ini. Organisasi-organisasi ini perlu menyimpan semua data mereka, karena membantu menganalisis data masa depan dengan lebih baik dan membuat prediksi.