Thursday, July 4, 2024

Berbasis Data..?

 

ged grefer pollo

oleh: grefer pollo


Data didefinisikan sebagai sekumpulan fakta mentah yang dapat diukur atau dihitung yang biasanya disimpan dalam basis data.

Jenis data bermacam-macam seperti angka, kata-kata, gambar, suara, atau bentuk lain yang direkam untuk analisis dan fungsi lainnya. 

Dalam konteks komputasi dan teknologi informasi, data merupakan informasi yang diolah oleh sistem komputer untuk menghasilkan informasi yang bermanfaat.

Metode berbasis data merupakan sebuah pendekatan yang menggunakan data sebagai dasar untuk membuat keputusan, memecahkan masalah, atau mengembangkan model.

Untuk melakukan pendekatan diperlukan kemampuan pengumpulan, analisis, dan interpretasi data sehingga dapat dipergunakan dalam keperluan strategis. 

Masa kini banyak bidang kerja dan pelayanan yang membutuhkan pendekatan berbasis data ini.

Selain berbagai keuntungan, ada sisi lain yang perlu dipertimbangkan berkaitan dengan metode berbasis data (data-driven methods)

Berikut ini beberapa pertimbangan itu.

Kualitas Data

Karena hasil analisis sangat bergantung pada kualitas data yang digunakan maka, data yang tidak lengkap, bias, atau tidak akurat dapat menghasilkan kesimpulan yang salah.

Overfitting

Overfitting yaitu keadaan terlalu pas. Jadi ketika model terlalu cocok dengan data pelatihan sehingga tidak dapat memprediksi data baru dengan baik.

 Kompleksitas dan Biaya

Pengumpulan, penyimpanan, dan pemrosesan data dalam jumlah besar membutuhkan dukungan infrastruktur teknologi yang cenderung mahal dan kompleks, serta tenaga ahli yang terlatih.

Kerahasiaan dan Privasi

Penggunaan data pribadi atau sensitif perlu aturan karena menyangkut kerahasiaan data dan keamanan.

Pemahaman Konteks

Data-driven methods seringkali mengabaikan konteks atau faktor eksternal yang tidak tercermin dalam data. Hal ini dapat menyebabkan kesimpulan yang tidak akurat.

Kebergantungan pada Algoritma

Algoritma (upaya dengan urutan operasi yang tersusun secara logis dan sistematis untuk menyelesaikan suatu masalah demi menghasilkan suatu hasil tertentu) yang digunakan untuk analisis data bisa memiliki asumsi atau batasan tertentu yang tidak selalu sesuai dengan semua jenis data atau masalah.

Interpretabilitas

Sejumlah metode berbasis data kemungkinan akan mengalami kesulitan untuk diinterpretasikan  sehingga sulit untuk memahami bagaimana keputusan atau prediksi dibuat.

Bias dalam Data

Data yang digunakan bisa saja mencerminkan bias yang ada dalam masyarakat atau sistem yang memberikan data tersebut.

Karena itu, model yang dibangun berdasarkan data itu sangat mungkin akan mencerminkan dan memperkuat bias tersebut.

 

Batas masa berlaku sebuah data

Berapa lama sebuah data bisa digunakan? Sebuah data diketahui batas usia manfaatnya atau biasa disebut "data validity period" atau "data shelf life," bervariasi tergantung pada konteks dan jenis data tersebut.

Berikut beberapa faktor yang mempengaruhi masa berlaku data:

  1. Jenis Data:
    • Data Transaksional: memiliki masa usia manfaat yang cenderung lebih pendek. Data ini berkaitan dengan transaksi harian seperti penjualan atau pembelian.
    • Data Historis: usia manfaat dari data ini menurun seiring waktu meskipun oleh karena sifat historisnya, data ini memiliki tren jangka panjang.
    • Data Pribadi: karena sifat privasinya, data ini mudah berubah dan cenderung sering diperbarui. Misalnya, alamat rumah, kantor, atau nomor telepon.
  2. Kegunaan Data:
    • Analisis Prediktif: karena alasan proyeksi atau prediktif, maka data yang lebih baru biasanya lebih relevan.
    • Pelaporan dan Kepatuhan: data seperti ini terkadang perlu disimpan untuk jangka waktu tertentu namun, bisa jadi tidak relevan untuk analisis sehari-hari setelah periode tertentu.
  3. Aturan dan Kebijakan:
    • Regulasi Data: data-data tertentu tunduk pada regulasi yang mengatur berapa lama data tersebut harus disimpan. Misalnya, regulasi perlindungan data pribadi mungkin mengharuskan penghapusan data setelah periode tertentu.
    • Kebijakan Internal: beberapa organisasi memiliki kebijakan internal yang mengatur masa penyimpanan data berdasarkan kebutuhan internal dan persyaratan hukum.
  4. Perubahan Konteks:
    • Perubahan Teknologi: teknologi yang berkembang dengan cepat, dapat saja mengakibatkan beberapa data tidak relevan lagi di masa kini.
    • Perubahan Pasar atau Lingkungan: pasar yang cepat berubah termasuk lingkungannya memberi dmapak kepada relevansi data. Misalnya bandingkan data sebelum dan setelah pandemi covid 19.
  1. Keusangan Data:
    • Data yang tidak dapat atau tidak sempat diperbarui dapat menjadi usang. Misalnya, data demografis atau data-data zaman dulu yang berusia lebih dari beberapa tahun mungkin tidak akurat lagi.

 

Interpretasi dan analisis

Interpretasi dan analisis terhadap sebuah data membuat data tersebut menjadi sebuah informasi yang bermanfaat Proses untuk menjadi informasi seperti di bawah ini:

  1. Pengumpulan Data: diambil dari data yang relevan dari berbagai sumber. Jebis data bisa berupa angka, teks, gambar, atau bentuk lainnya.
  2. Pembersihan Data: langkah di atas menghasilkan data yang sifatnya mentah. Sangat mungkin mengandung kesalahan, duplikasi, atau data yang tidak lengkap. Proses ini bertujuan untuk memperbaiki atau menghapus data yang tidak akurat atau tidak relevan.
  3. Pengorganisasian Data: Setelah langkah kedua di atas, dilakukan pengorganisasian data ke dalam format yang dapat dianalisis. Ini bisa mencakup pengelompokan data ke dalam kategori, pembuatan tabel, atau penyimpanan dalam basis data.
  4. Analisis Data: hal ini bisa menggunakan metode statistik atau teknik analisis data lainnya.
  5. Visualisasi Data: interpretasi akan lebih mudah jika divisualisasikan dalam bentuk grafik, diagram, atau peta. Visualisasi menolong pemangku kepentingan data untuk mengenali pola atau tren yang mungkin tidak terlihat dalam data mentah.
  6. Interpretasi Data: interpretasi melibatkan pemberian makna pada hasil analisis dan visualisasi.
  7. Pelaporan dan Pengambilan Keputusan: hasil interpretasi akan menolong dalam pengambilan Keputusan atau langkah perencanaan strategis, atau tindakan lainnya.

 

Data tidak valid

Beberapa penyebab umum sehingga data tidak valid sebagai berikut.

  1. Data Tidak Lengkap
  2. Kesalahan Pengumpulan Data
  3. Bias dalam Pengumpulan Data
  4. Data Tidak Akurat
  5. Data Tidak Konsisten
  6. Data Usang
  7. Kesalahan Penyimpanan dan Pemrosesan
  8. Interpretasi yang Salah
  9. Masalah Teknis
  10. Kekurangan Metadata (metadata: sekumpulan data yang berisi informasi dari suatu data sehingga data tersebut mudah untuk dikelola kembali. Bentuk metadata dari sebuah dokumen akan berbeda dengan dokumen lainnya)

Continue reading Berbasis Data..?