Big Data yang Tak Pernah Berdusta

Oleh :
Akhmad Idris
Dosen di STIBA Satya Widya Surabaya dan Penulis Buku “Wasiat Nabi Khidir untuk Rakyat Indonesia”

Pada dasarnya manusia sangat pandai berpura-pura, sehingga yang hatinya terluka tetap bisa tersenyum ceria; yang di depan memeluk mesra ternyata dari belakang diam-diam menghunus belati dengan tega. Bahkan yang seolah benar-benar cinta justru yang paling dalam menorehkan luka. Tak hanya dalam urusan rasa, manusia juga mahir dalam menyelewengkan data.

Rentetan kejadian tentang pemalsuan surat hasil rapid test hingga pembuatan sertifikat vaksin abal-abal adalah bukti tak terbantahkan ihwal kemahiran manusia dalam berdusta. Oleh sebab itu, di hadapan angket maupun survei, jawaban yang diberikan belum tentu terjamin kebenarannya. Masih ada kemungkinan dusta dan pura-pura dari setiap jawaban yang muncul, baik atas dasar keuntungan; pencitraan; maupun sejenisnya. Namun ada satu keadaan yang membuat manusia tak bisa berpura-pura dan cenderung berkata dengan apa adanya, yakni kala berada di hadapan mesin pencari.

Segala yang ditanyakan cenderung memang benar-benar menyimpan tanda tanya di dalam hatinya. Setiap yang dinyatakan cenderung memang sungguh-sungguh ungkapan yang dirasakan dan ingin disampaikan. Penyebabnya sederhana, di hadapan lembaran survei, manusia diperintah?kebanyakan mengisi karena terpaksa.

Sementara di hadapan mesin pencari, manusia lah yang merasa memerintah, sehingga pernyataan maupun pernyataan diungkapkan secara sukarela?atas kemauannya sendiri. Segala pernyataan dan pertanyaan manusia di seluruh dunia yang diungkapkan tanpa dusta akan direkam oleh mesin pencari dan menghasilkan sebuah ‘ucapan’ tanpa dusta yang bernama Big Data.

Big Data, Dusta, dan yang Bisa Dipercaya

Big Data atau yang juga biasa disebut dengan istilah mahadata secara umum diartikan sebagai data yang memiliki karakteristik 3V, yaitu volume; velocity; dan variety. Maksudnya, big data merupakan himpunan data dengan volume yang sangat besar, bergerak sangat cepat, dan memiliki tingkat heterogenitas yang sangat tinggi. Agar bisa lebih mudah dimengerti, Seth Stephens-Davidowitz (2018) dalam Everybody Lies memberikan contoh big data lewat interaksi antarpengguna media sosial. Dari setiap interaksi pengguna media sosial di seluruh belahan dunia, terdapat gambar dan teks untuk mengekspresikan keinginan.

Mulai dari ungkapan sedih, marah, hingga bahagia. Bejibun gambar dan teks manusia di seluruh dunia?yang tak karuan jumlahnya?itulah yang bisa disebut dengan big data.

Di era yang serba digital seperti saat ini, manusia menjadi makhluk yang sangat bergantung terhadap keberadaan internet. Tak peduli urusan remeh maupun penting, manusia akan menyelesaikannya di hadapan mesin pencari. Jika mau mengamati riwayat pencarian paling populer di mesin pencari, maka akan ditemui keberagaman topik sehari-hari yang ‘dikeluhkesahkan’ oleh manusia di hadapan mesin pencari.

Misalnya saja cara ampuh menghilangkan jerawat dalam satu hari, lalu tips ampuh untuk mendapatkan pacar yang sempurna, hingga topik-topik aktual seperti benarkah jahe merah dapat membunuh virus Corona?. Kebiasaan ini sejatinya memanjakan para ‘penambang data’ untuk mencuplik sebuah fenomena tertentu dengan memanfaatkan big data.

Para ‘penambang data’ tentu saja lebih percaya dengan yang ditunjukkan oleh data daripada kata-kata yang beredar di kalangan umat manusia. Seseorang bisa saja dengan penuh keyakinan berkata bahwa ia telah melupakan dan mengabaikan sang mantan, namun riwayat pencarian seseorang di akun media sosialnya lah yang lebih bisa disebut dengan kebenaran.

Memang cukup mengejutkan saat melihat fakta bahwa manusia lebih bisa jujur, terbuka, dan tidak membohongi diri ketika di hadapan sebuah mesin pencarian. Dengan kata lain, yang bisa dipercaya adalah setiap hal yang manusia lakukan, bukan yang manusia katakan. Manusia bisa saja menyembunyikan berbagai hal lewat kefasihan berbicara, namun manusia tidak bisa menyembunyikan setiap hal yang telah dilakukan dan direkam oleh mesin pencari maupun media sosial yang ia gunakan. Singkat kata, big data adalah ‘ucapan’ yang tak pernah berdusta. Ia ‘berbicara’ apa adanya, bukan ada apanya.

Data yang Berkualitas

Ketersediaan data yang berlimpah memang baik, namun data yang baik tak hanya dinilai dari keberlimpahannya. Sebagaimana yang diungkapkan oleh Seth Stephens-Davidowitz, bahwa kualitas big data tak hanya dari volumenya (jumlah data) yang sangat besar, tetapi juga dari tipe data yang lebih baik; pengumpulan data yang tepat; juga tawaran bentuk informasi baru. Lebih dari itu, big data menawarkan data yang lebih apa adanya (jujur) karena data yang baik tidak bertujuan untuk menguntungkan semua pihak maupun satu di antara dua belah pihak. Data yang baik bertujuan untuk menghadirkan hal yang sebenar-benarnya, entah hal itu berujung merugikan semuanya maupun salah satunya.

Pada dasarnya big data hanya sebatas menyajikan ‘ucapan’ yang tanpa dusta, sementara untuk menghasilkan sebuah informasi yang valid berdasarkan big data tersebut masih membutuhkan beberapa uji tambahan. Misalnya saja kajian big data yang dilakukan oleh Badan Pusat Statistik (2020) terhadap statistik perhotelan. BPS dalam analisisnya memanfaatkan big data yang bersumber dari situs online pemasaran akomodasi dengan menggunakan metode web scraping. Selanjutnya, data yang telah terkumpul harus melalui preprocessing terlebih dahulu guna memperoleh data bersih yang telah siap untuk dianalisis. Hasil analisis ini perlu dilakukan uji validasi agar menghasilkan informasi yang benar-benar valid. Uji validasi yang dilakukan oleh BPS adalah membandingkan hasil analisis yang memanfaatkan big data dengan data dari google trends dan juga hasil survei perhotelan yang dilakukan oleh pihak BPS sebelumnya.

Lalu, Big Data itu untuk Apa?

Akhirnya, tibalah di ujung pertanyaan dari uraian tentang kejujuran big data. Dengan segala kelebihan yang dimiliki oleh big data, memangnya big data bisa berguna untuk apa? Jawabannya padat saja, data sangat dibutuhkan untuk merumuskan kebijakan yang tepat, mulai dari kebijakan di tingkat yang paling rendah hingga tingkat yang paling tinggi.

Misalnya saja kebijakan pemilik warung kelontong yang hendak melakukan belanja bulanan, hingga kebijakan pemimpin Negara yang hendak menentukan strategi mengatasi pandemi. Tanpa data, pemilik warung kelontong hanya akan membuang-buang uang untuk belanjaan yang hampir tidak pernah dilirik oleh pembeli. Begitu juga pemimpin Negara yang hanya akan mendapatkan caci maki rakyatnya jika merumuskan kebijakan tanpa berdasarkan data.

Mengutip ungkapan dari Steven Levit, kombinasi antara keingintahuan; kreativitas; dan data (yang sudah seharusnya tanpa dusta) akan secara dramatis meningkatkan pemahaman tentang dunia.

——– *** ———

Rate this article!
Tags: