Tuesday, March 31, 2026

Data Adalah Jejak Masa Lalu Yang Ditapaki Di Masa Kini

ged pollo

oleh: grefer pollo

 

Sebuah pertanyaan tajam dan menyentuh salah satu problem klasik dalam Epistemologi dan Metodologi Penelitian: apakah “data” benar-benar merepresentasikan realitas, atau hanya bayangan yang sudah basi?

 

Data itu bukan realitas ia adalah jejak masa lalu

Kata Data berasal dari bahasa Latin dan merupakan bentuk jamak (plural) dari datum. Secara harfiah berarti: “hal-hal yang diberikan”.

Perkembangan dalam bahasa modern baik dalam bahasa Inggris dan Indonesia modern, “data” sering diperlakukan sebagai kata tunggal massal (collective noun). Contoh: “Data ini sudah lengkap.” Sedangkan “datum” jarang dipakai.

Data selalu bersifat retrospektif. Ia menangkap apa yang sudah terjadi, bukan apa yang sedang terjadi, apalagi yang akan terjadi. Dalam bahasa Karl Popper, pengetahuan ilmiah selalu sementara terbuka untuk dibantah.

Masalahnya:

  • Manusia berubah (psikologi, preferensi, ekonomi, sosial)
  • Lingkungan berubah (teknologi, budaya, krisis)

Jadi ketika data dipresentasikan ia bukan lagi cermin realitas, tapi arsip sejarah mikro.

 

Jeda waktu adalah potensi pembusukan makna

Semakin lama jarak antara pengambilan dan presentasi data, semakin besar risiko:

  • Data decay (peluruhan relevansi)
  • Context drift (perubahan konteks)
  • Behavioral shift (perubahan perilaku manusia)

Contoh empiris:

  • Data perilaku konsumen sebelum pandemi COVID-19 menjadi hampir tidak relevan setelahnya.
  • Algoritma media sosial harus terus di-update karena preferensi manusia berubah dalam hitungan minggu.

Artinya, validitas data bukan hanya soal metode, tapi juga soal waktu.

 

Valid tapi tidak relevan: paradoks data modern

Dalam Validitas Internal dan Validitas Eksternal:

  • Data bisa valid secara metodologis
  • Tapi tidak lagi relevan secara kontekstual

Ini paradoks. Data bisa “benar”, tapi tetap “menyesatkan”.

 

Ilusi objektivitas: manusia berubah lebih cepat dari angka

Data sering dianggap objektif. Tapi:

  • Pengumpulan data dipengaruhi bias
  • Interpretasi dipengaruhi kepentingan
  • Presentasi dipengaruhi narasi

Seperti sebuah kritikan yang pernah dilontarkan: Pengetahuan (termasuk data) selalu terkait dengan kekuasaan. Jadi, data bukan netral. Ia adalah konstruksi.

 

Apakah data bisa dipercaya?

Jawabannya: bisa, tapi bersyarat keras. Data layak dipercaya jika:

  1. Time-sensitive awareness: tahu kapan data itu diambil
  2. Context-aware: memahami apakah konteks masih sama
  3. Continuously updated: bukan snapshot tunggal
  4. Triangulasi:  dibandingkan dengan sumber lain

Tanpa itu data berubah dari alat pengetahuan menjadi alat ilusi.

Data bukan kebohongan. Tapi kepercayaan buta pada data yang usang, itulah kebohongan yang sebenarnya.

 

Sudut pandang ekstrem

Pemikiran radikal:

  • Data adalah “mayat realitas”
  • Analisis adalah “autopsi”
  • Presentasi adalah “cerita tentang masa lalu yang dianggap masih hidup”

Kita masuk ke level yang lebih “keras”: bukan lagi kritik, tapi rekayasa epistemik bagaimana membuat data tetap hidup, dan bagaimana tahu kapan ia mati.

 

Bagaimana membuat data tetap relevan (melawan “kematian waktu”)

A. Beralih dari “data sebagai arsip” kepada data sebagai aliran

Kunci utamanya adalah transformasi dari batch ke Streaming Data.

Bukan: kumpulkan simpan analisis (lambat)

Tetapi: kumpulkan analisis langsung update terus-menerus

 

B. Real-time analytics: melawan keterlambatan makna

Dengan Real-time Analytics, kita mengurangi jarak antara realitas dan interpretasi.

Bukti empiris:

a. Real-time analytics memberi “insight langsung terhadap apa yang sedang terjadi  sekarang”.

b. Memungkinkan keputusan cepat, prediksi lebih akurat, dan respons instan

c. Mengurangi risiko dibanding mengandalkan data historis

 

C. Teknik konkret (berbasis riset & praktik industri)

1. Sliding window (jendela waktu)

  • Data hanya diambil dari periode terbaru (misal 5 menit terakhir, 1 hari terakhir)
  • Riset terbaru menunjukkan teknik ini meningkatkan timeliness + akurasi sekaligus

Makna: Kita sengaja “melupakan masa lalu” agar tetap relevan.

 

2. Concept drift detection

Gunakan model yang bisa mendeteksi perubahan pola perilaku.

Fakta riset: Streaming data harus mampu menghadapi “evolving data distributions (concept drift)”. Contoh:

  • Model perilaku user hari ini ≠ minggu lalu
  • Sistem harus adaptif, bukan statis

3. Event-driven system

  • Data diproses saat event terjadi (klik, transaksi, dll)
  • Digunakan dalam bidding iklan real-time dalam milidetik

Ini ekstrem: Data diproses bahkan sebelum manusia sadar kejadian itu terjadi.

 

D. Sebuah paradoks penting

Real-time bukan solusi absolut. Riset menunjukkan:

  • Implementasi buruk sama dengan keputusan buruk
  • Perbedaan definisi “real-time” bisa menyebabkan kerugian besar

Artinya, kecepatan tanpa pemahaman = kesalahan yang dipercepat.

 

Bagaimana mendeteksi data sudah “expired”

Sekarang bagian paling praktis dan paling sering diabaikan.

 

A. Indikator 1: Time lag vs decision cycle

Bandingkan waktu data diambil dan waktu keputusan dibuat

Jika data lebih tua dari siklus perubahan realitas maka sudah expired.

Contoh: Data perilaku user 3 bulan lalu untuk produk digital: hampir pasti usang

 

B. Indikator 2: Concept drift (perubahan pola)

Gunakan deteksi statistik: apakah distribusi data berubah? Apakah pola prediksi menurun?

Jika ya, maka data lama tidak lagi representatif

 

C. Indikator 3: Penurunan performa model

Jika model akurasi menurun dan error naik maka itu adalah sinyal kuat data sudah tidak relevan.

Dalam riset anomaly detection, performa model sangat bergantung pada “timeliness vs accuracy trade-off”.

 

D. Indikator 4: Context shift (perubahan dunia)

Ini yang sering gagal dideteksi mesin. Contoh:

  • Sebelum vs sesudah COVID-19
  • Perubahan regulasi
  • Tren sosial baru

Secara filosofis, dunia berubah, tapi dataset tetap diam.

Tidak ada data yang benar-benar “up-to-date”. Yang ada hanya: data yang belum terlalu usang

 

Ilusi “sekarang = memahami”

Real-time data memberi kita kesan bahwa karena kita melihat sesuatu sekarang, maka kita memahaminya.

Padahal data real-time hanya menunjukkan apa yang terjadi, bukan mengapa terjadi. Ia menangkap gejala, bukan struktur. Dalam kerangka Epistemologi, mengetahui waktu kejadian ≠ mengetahui makna kejadian. Contoh: Dashboard menunjukkan penurunan penjualan saat ini.

Tapi:

  • Apakah karena harga?
  • Perubahan budaya?
  • Atau noise sesaat?

Real-time mempercepat observasi, tapi tidak otomatis memperdalam pemahaman.

 

Overreaction: kecepatan menciptakan reaktivitas

Manusia tidak didesain untuk mengambil keputusan dalam aliran data konstan. Akibatnya:

  • Keputusan dibuat terlalu cepat
  • Noise dianggap sinyal
  • Fluktuasi kecil direspons berlebihan

 

Ilusi visibilitas total

Dashboard real-time memberi kesan bahwa “Jika sesuatu penting, pasti terlihat di data.”

Ini berbahaya. Karena:

  • Tidak semua hal bisa diukur
  • Tidak semua yang penting muncul sebagai data
  • Banyak variabel laten (emosi, budaya, niat)

Apa yang terlihat dalam sistem pengetahuan bukan realitas utuh, tapi hasil seleksi kekuasaan.

Artinya, yang tidak masuk dashboard sering dianggap tidak ada

 

Ilusi kontrol melalui prediksi instan

Real-time analytics sering digabung dengan prediksi bahwa rekomendasi otomatis dan adaptive systems. Ini menciptakan perasaan bahwa “Kita tidak hanya melihat tapi kita mengendalikan.”

Padahal model berbasis data masa lalu (meski cepat) dan dunia tetap mengandung ketidakpastian radikal.

 

Compression of time hilangnya refleksi

Real-time data menghapus jeda. Padahal:

  • Jeda = ruang berpikir
  • Jeda = tempat evaluasi

Tanpa jeda:

  • Tidak ada kritik
  • Tidak ada revisi mendalam
  • Hanya respons berantai

Ironinya, semakin cepat kita bereaksi, semakin sedikit kita benar-benar memahami.

 

Ilusi kontrol organisasi

Dalam organisasi, real-time dashboard sering dipakai sebagai simbol:

  • transparansi
  • akuntabilitas
  • kontrol manajemen

Tapi realitanya:

  • Karyawan mulai “bermain untuk metrik”
  • Fokus pada apa yang diukur, bukan yang penting
  • Muncul gaming system

Fenomena ini dikenal dalam ekonomi sebagai Goodhart's Law: “When a measure becomes a target, it ceases to be a good measure.”

 

Kecanduan data (data addiction)

Real-time data menciptakan loop (siklus yang berulang) psikologis:

  • cek dashboard terus-menerus
  • mencari kepastian instan
  • takut “ketinggalan sinyal”

Mirip:

  • notifikasi media sosial
  • dopamine loop

Ini bukan lagi kontrol atas sistem tapi sistem mulai mengontrol pengambil keputusan.

Sintesis: bentuk baru dari ilusi kontrol

Jika kita ringkas secara tajam:

Dulu (Batch Data)

Sekarang (Real-time Data)

Ilusi: kita memahami masa lalu

Ilusi: kita mengendalikan masa kini

Lambat tapi reflektif

Cepat tapi reaktif

Keterbatasan terlihat

Keterbatasan tersembunyi

 

Real-time data tidak menghilangkan ketidakpastian. Ia hanya membuat kita merasa lebih nyaman di dalamnya.

Kita tidak benar-benar mengontrol realitas dengan real-time data kita hanya mengurangi rasa cemas karena tidak tahu.

0 comments:

Post a Comment