Membuktikan Kausalitas (Hubungan Sebab Akibat)

Rahmat.. proof to me did our last year investment increase our market share? I want to valid proof showing investment and increase of market share has causality effect.

Benarlah apa yg diajarkan di kelas data science bulan lalu yang sampai sekarang saya masih ingat. Yang paling penting dari data science itu adalah pertanyaanya! Pertanyaan bos saya itu juga menurut saya mahal dan jawabannya tidak mudah. Saya segera mencari statistical tools yg ada di kepala saya untuk menjawab pertanyaan tersebut tapi so far belum ada yg cocok. Better saya cari dulu bagaimana seharusnya kerangka berpikir untuk membuktikan hubungan kausalitas.

Jika mendengar kausalitas saya terus saja teringat sebuah kalimat correlation doesn’t imply causation. Ini adalah ilmu sejak kuliah namun saya belum  bertanya lebih lanjut.. lalu apa yg bisa membuktikan kausalitas? Nah ternyata tidak mudah membuktikan adanya kausalitas. Sebaliknya jika kita mampu membuktikan kausalitas maka kita bisa bercerita lebih banyak.

  • Supportive hubungan suatu variabel yg membuat variabel lain meningkat. Contohnya efek pemberian pupuk jenis tertentu dalam meningkatkan produksi panen padi atau pemberian jenis obat tertentu dalam menyembuhkan penyakit tertentu.
  • Prevention bisa juga kita mengatakan bahwa kita bisa menghindari terjadinya hal buruk atas tindakan tertentu. Misalnya penambahan rem jenis tertentu mengurangi angka tabrakan pada mobil atau motor.
  • Preparation  berguna untuk mempersiapkan diri atas konsekuensi tertentu. Misalnya banjir atau bencana

Dari ketiga hal diatas kasus saya sepertinya lebih cocok pada kondisi pertama yakni investasi dalam menaikkan market share. Hubungannya supportive,  oleh karena itu pendekatan rancangan percobaan (experimental design) sepertinya akan lebih cocok.

Hal-hal yg saya harus perhatikan adalah sebagai berikut:

  1. Kekuatan hubungan. Karena ini adalah kasus non-laboratorium saya tidak bisa mengkondisikan faktor-faktor yg terlibat selayaknya lab namun hubungan antar target bisa saya gambarkan dengan menggunakan korelasi.
  2. Replication. Naah ini dia juga yg lumayan njelimet bagaimana melakukan pengulangan jika kondisinya tidak seragam. Let me know jika ada ide ya guys!
  3. Specificity. Jika tidak ada penjelasan lain mungkin memang itulah penyebabnya.
  4. Temporality. Hubungannya akan lebih kelihatan jika akibat muncul setelah sebabnya.. (yg ini masih bingung nih)
  5. Gradient. Jika ada pola kenaikan atau penurunan yg jelas maka most likely ada kausalitas. Kayaknya kita bisa minta tolong regression untuk membuktikan ini.
  6. Plausability. help me with this.. hahaha
  7. Coherence. Jika sudah ada teori yg pernah menunjukkan adanya hubungan kausalitas maka data kita mungkin akan memperkuat teori tsb.

Kayaknya saya juga perlu untuk menambahkan beberapa catatan berikut sebelum melakukan perhitungan.

Periksa Metrik

  • Gunakan original metrik, hindari indexing dan rasio.
  • Lanjutkan dengan menghitung korelasi antar variabel.
  • Pastikan sample nya cukup untuk menarik kesimpulan.
  • Pastikan tidak ada outlier

 

Pastikan Hubungan

Dari scatter plot, perhatikan hubungan antar variable nya (gradientnya). Perhatikan juga urutan kejadiannya, karena bisa jadi akibatnya tidak terjadi pada waktu yg dekat. Sebaiknya di cek dengan lag pada time series analysis.

 

Validasi Penjelasan

Ada dua langkah yg kita bisa lakukan disini yakni eksperimen dan konsistensi. Dua hal ini adalah hal paling meyakinkan yg bisa kita lakukan, susunlah hipotesis dan buatlah sebuah pembuktian atas hipotesis tersebut. Sebaiknya kita gunakan vairable kontrol agar kita bisa membandingkan efek dari faktor yg kita berikan.

Source:

https://statswithcats.wordpress.com/2015/01/01/how-to-tell-if-correlation-implies-causation/ 

 

 

Advertisements