Selasa, 19 November 2013

Data Warehouse 5

Data Quality

Definisi data quality tergantung pada bagaimana data yang akan digunakan.

Pengaruh Data Quality
Kualitas data quality memungkinkan organisasi untuk :
meningkatkan pengambilan keputusan dan analisis data-mining
melakukan cross-product dan cross-department marketing
meningkatkan customer support dan customer retention
mengembangkan strategi pembelian perusahaan.
menghindari rasa malu yang disebabkan oleh data yang buruk.

4 (Empat) Proporsi Nilai dari Data Quality
Data Quality menjamin keunggulan kompetitif yang sebelumnya tidak tersedia dan kemampuan strategis.
Data Quality meningkatkan produktivitas
Data Quality mengurangi biaya
Data Quality menghindarkan dari terkontaminasinya data.

Karakteristik data quality yang baik
1.Addressability
2.Domain integrity
3.Accurate
4.Entity intergrity
5.Adhere to business rules
6.Satisfy business needs
7.Integrity
8.Consistent
9.Redudancy harus intentional
10.Complete
11.Cardinality 

4 tahap untuk mencapai high data quality
1.Data Investigation (PARSING, LEXICAL ANALYSIS, PATTERN INVESTIGATION)
2.Data Standardization
3.Data Integration
4.Data Survivorship & Formatting

Data quality tools
Data Quality tools membantu tim atau organisasi atau perusahaan  dalam tugas mereka untuk menemukan
dan mengoreksi kesalahan data yang ada pada sumber sistem atau data warehouse
Examples of data quality tools include the following :
DataFlux. Data Quality Workbench
Pne Cone System.  Content Tracker
Prism. Quality Manager
Vality Technology. Integrity Data Reengineering

Initiative for improve :
menentukan fungsi bisnis awal penting untuk dipertimbangkan.

mengidentifikasi kriteria untuk memilih elemen data penting, misalnya:
menghentikan usaha pengolahan atau menyebabkan tidak dapat diterima, 
hasil dalam penyalahgunaan substansial sumber daya, 
menciptakan risiko hukum yang signifikan bagi bisnis.

designate the critical data elements

mengidentifikasi kekhawatiran kualitas data untuk elemen data yang penting dan penyebabnya.

menentukan standar kualitas yang akan diterapkan untuk setiap elemen data penting.

merancang sebuah metode pengukuran untuk setiap standar

mengidentifikasi dan menerapkan data yang cepat-hit inisiatif peningkatan kualitas.

menerapkan metode pengukuran untuk data quality baseline.

menilai pengukuran, data yang menyangkut kualitas, dan penyebabnya. ini meliputi:
kejelasan dan pemahaman tentang definisi data, formulir bisnis, prosedur, dan alur kerja