Data
didefinisikan sebagai sekumpulan fakta mentah yang dapat diukur atau dihitung
yang biasanya disimpan dalam basis data.
Jenis data bermacam-macam seperti angka, kata-kata, gambar, suara, atau bentuk lain yang direkam untuk analisis dan fungsi lainnya.
Dalam konteks komputasi dan
teknologi informasi, data merupakan informasi yang diolah oleh sistem komputer
untuk menghasilkan informasi yang bermanfaat.
Metode
berbasis data merupakan sebuah pendekatan yang menggunakan data sebagai dasar
untuk membuat keputusan, memecahkan masalah, atau mengembangkan model.
Untuk melakukan pendekatan diperlukan kemampuan pengumpulan, analisis, dan interpretasi data sehingga dapat dipergunakan dalam keperluan strategis.
Masa kini
banyak bidang kerja dan pelayanan yang membutuhkan pendekatan berbasis data
ini.
Selain
berbagai keuntungan, ada sisi lain yang perlu dipertimbangkan berkaitan dengan
metode berbasis data (data-driven methods)
Berikut
ini beberapa pertimbangan itu.
Kualitas
Data
Karena
hasil analisis sangat bergantung pada kualitas data yang digunakan maka, data
yang tidak lengkap, bias, atau tidak akurat dapat menghasilkan kesimpulan yang
salah.
Overfitting
Overfitting
yaitu keadaan terlalu pas. Jadi ketika model terlalu cocok dengan data
pelatihan sehingga tidak dapat memprediksi data baru dengan baik.
Pengumpulan,
penyimpanan, dan pemrosesan data dalam jumlah besar membutuhkan dukungan infrastruktur
teknologi yang cenderung mahal dan kompleks, serta tenaga ahli yang terlatih.
Kerahasiaan
dan Privasi
Penggunaan
data pribadi atau sensitif perlu aturan karena menyangkut kerahasiaan data dan
keamanan.
Pemahaman
Konteks
Data-driven
methods seringkali mengabaikan konteks atau faktor eksternal yang tidak
tercermin dalam data. Hal ini dapat menyebabkan kesimpulan yang tidak akurat.
Kebergantungan
pada Algoritma
Algoritma
(upaya dengan urutan operasi yang tersusun secara logis dan sistematis untuk
menyelesaikan suatu masalah demi menghasilkan suatu hasil tertentu) yang
digunakan untuk analisis data bisa memiliki asumsi atau batasan tertentu yang
tidak selalu sesuai dengan semua jenis data atau masalah.
Interpretabilitas
Sejumlah
metode berbasis data kemungkinan akan mengalami kesulitan untuk
diinterpretasikan sehingga sulit untuk
memahami bagaimana keputusan atau prediksi dibuat.
Bias
dalam Data
Data
yang digunakan bisa saja mencerminkan bias yang ada dalam masyarakat atau
sistem yang memberikan data tersebut.
Karena
itu, model yang dibangun berdasarkan data itu sangat mungkin akan mencerminkan
dan memperkuat bias tersebut.
Batas masa berlaku
sebuah data
Berapa lama sebuah data bisa digunakan? Sebuah data diketahui batas usia
manfaatnya atau biasa disebut "data validity period" atau "data
shelf life," bervariasi tergantung pada konteks dan jenis data tersebut.
Berikut beberapa faktor yang mempengaruhi masa berlaku data:
- Jenis Data:
- Data Transaksional: memiliki
masa usia manfaat yang cenderung lebih pendek. Data ini berkaitan dengan transaksi
harian seperti penjualan atau pembelian.
- Data Historis: usia manfaat dari data
ini menurun seiring waktu meskipun oleh karena sifat historisnya, data
ini memiliki tren jangka panjang.
- Data Pribadi: karena sifat privasinya,
data ini mudah berubah dan cenderung sering diperbarui. Misalnya, alamat rumah,
kantor, atau nomor telepon.
- Kegunaan Data:
- Analisis Prediktif: karena
alasan proyeksi atau prediktif, maka data yang lebih baru biasanya lebih
relevan.
- Pelaporan dan Kepatuhan: data seperti ini terkadang perlu disimpan untuk jangka
waktu tertentu namun, bisa jadi tidak relevan untuk analisis sehari-hari
setelah periode tertentu.
- Aturan dan Kebijakan:
- Regulasi Data: data-data tertentu tunduk
pada regulasi yang mengatur berapa lama data tersebut harus disimpan.
Misalnya, regulasi perlindungan data pribadi mungkin mengharuskan
penghapusan data setelah periode tertentu.
- Kebijakan Internal: beberapa
organisasi memiliki kebijakan internal yang mengatur masa penyimpanan
data berdasarkan kebutuhan internal dan persyaratan hukum.
- Perubahan Konteks:
- Perubahan Teknologi: teknologi
yang berkembang dengan cepat, dapat saja mengakibatkan beberapa data
tidak relevan lagi di masa kini.
- Perubahan Pasar atau Lingkungan: pasar yang cepat berubah termasuk lingkungannya memberi dmapak kepada relevansi data. Misalnya bandingkan data sebelum dan setelah pandemi covid 19.
- Keusangan Data:
- Data yang tidak dapat atau tidak sempat diperbarui dapat
menjadi usang. Misalnya, data demografis atau data-data zaman dulu yang
berusia lebih dari beberapa tahun mungkin tidak akurat lagi.
Interpretasi dan analisis
Interpretasi dan analisis terhadap sebuah data membuat data tersebut menjadi
sebuah informasi yang bermanfaat Proses untuk menjadi informasi seperti di
bawah ini:
- Pengumpulan Data: diambil dari data yang
relevan dari berbagai sumber. Jebis data bisa berupa angka, teks, gambar,
atau bentuk lainnya.
- Pembersihan Data: langkah di atas
menghasilkan data yang sifatnya mentah. Sangat mungkin mengandung
kesalahan, duplikasi, atau data yang tidak lengkap. Proses ini bertujuan
untuk memperbaiki atau menghapus data yang tidak akurat atau tidak
relevan.
- Pengorganisasian Data: Setelah langkah
kedua di atas, dilakukan pengorganisasian data ke dalam format yang dapat
dianalisis. Ini bisa mencakup pengelompokan data ke dalam kategori,
pembuatan tabel, atau penyimpanan dalam basis data.
- Analisis Data: hal ini bisa menggunakan metode
statistik atau teknik analisis data lainnya.
- Visualisasi Data: interpretasi akan lebih
mudah jika divisualisasikan dalam bentuk grafik, diagram, atau peta.
Visualisasi menolong pemangku kepentingan data untuk mengenali pola atau
tren yang mungkin tidak terlihat dalam data mentah.
- Interpretasi Data: interpretasi melibatkan
pemberian makna pada hasil analisis dan visualisasi.
- Pelaporan dan Pengambilan Keputusan: hasil interpretasi akan menolong dalam pengambilan Keputusan
atau langkah perencanaan strategis, atau tindakan lainnya.
Data tidak valid
Beberapa penyebab umum sehingga data tidak valid sebagai berikut.
- Data Tidak Lengkap
- Kesalahan Pengumpulan Data
- Bias dalam Pengumpulan Data
- Data Tidak Akurat
- Data Tidak Konsisten
- Data Usang
- Kesalahan Penyimpanan dan Pemrosesan
- Interpretasi yang Salah
- Masalah Teknis
- Kekurangan Metadata (metadata:
sekumpulan data yang berisi informasi dari suatu data sehingga data
tersebut mudah untuk dikelola kembali. Bentuk metadata dari sebuah dokumen
akan berbeda dengan dokumen lainnya)
0 comments:
Post a Comment