Apa itu Data Cardinality?

posted Mar 22, 2012, 8:16 PM by Webmaster BelajarSQL.com   [ updated May 15, 2015, 10:48 AM ]

Data Cardinality

Cardinality / Kardinalitas adalah ukuran keunikan data pada kolom tertentu dari suatu table database. 

Pengukuran kardinalitas didasarkan pada perbandingan jumlah row yang unik pada kolom terhadap jumlah keseluruhan row. Semakin rendah nilai perbandingannya maka data semakin tidak unik, demikian juga sebaliknya.

Sebagai contoh, pada suatu table master produk maka kolom kode produk yang sangat unik pada tiap row memiliki ukuran cardinality yang besar atau tinggi. Karena jika dibandingkan dengan jumlah row yang ada maka nilainya adalah 1 atau 100%. 

Pada contoh lainnya, kolom jenis kelamin pada table master karyawan memiliki keunikan yang rendah karena dari ribuan row data karyawan kita mencatat 2 nilai jenis kelamin saja (laki-laki atau perempuan).

Cardinality Value (Nilai Kardinalitas)

Dengan penjelasan di atas, maka cardinality dapat dikategorikan berdasarkan tingkat nilainya,  yaitu :
  1. Low-cardinality
    adalah kondisi dimana tingkat keunikan data sangat rendah dibandingkan jumlah row secara keseluruhan.

    Sebagai contoh, gambar berikut menunjukkan kolom jenis_kelamin yang hanya memiliki dua nilai pada seluruh row yang ada.


  2. Normal-cardinality
    adalah kondisi dimana tingkat keunikan data terdistribusi secara normal atau proporsi sebaran yang merata dibandingkan jumlah row secara keseluruhan.

    Sebagai contoh, gambar berikut menunjukkan kolom nama_depan_karyawan yang terlihat cukup memiliki sebaran yang merata dibandingkan seluruh row yang ada. 


  3. High-cardinality
    adalah kondisi dimana tingkat keunikan data sangat tinggi dibandingkan jumlah row secara keseluruhan. 

    Sebagai contoh, gambar berikut menunjukkan kolom nama_depan_karyawan yang tidak memiliki perulangan (sangat unik). 


Pentingnya Cardinality

Pengkategorian tingkat cardinality di atas sangat penting, karena dapat memberikan arahan kepada para perancang data model dalam menentukan strategi yang baik, baik itu  perancangan untuk sistem transaksional maupun data warehouse. 

Salah satu strategi yang terkait data cardinality ini adalah dalam menentukan normalisasi table dan penggunaan index.

Sumber Referensi


Comments