Apakah Prabowo-Sandi masih mungkin menang Pilpres 2019, Atau memang sudah saatnya mengakui kemenangan Jokowi-Amin?

Pertama, mari kita terima hasil quick count dari Lembaga survey dan ambil itu sebagai angka prediksi proporsi suara. Saya akan ambil angka QC per provinsi (1), angka-angka ini anda bisa temukan di tirto.id. Lalu saya juga menggunakan data DPT tahun 2018 per provinsi (2) dan terakhir saya menggunakan data real count dari kawalpemilu.org (3) yang akan terus saya update untuk memperbaiki prediksi hasil akhir pilpres. Metode yang saya gunakan adalah sebagai berikut:

1.Semua data real count yang sudah masuk di aggregate di level provinsi dan dibuat proporsi untuk masing-masing calon.

2.Gunakan proporsi dari langkah pertama untuk dikalikan dengan jumlah DPT masing-masing provinsi.

3.Masukkan angka hasil survey provinsi yang kemungkinan akan sangat berpengaruh pada hasil akhir.

4.Lakukan what if analysis untuk simulasi daerah mana yg mungkin akan merubah peta suara.

Karena semua survey sudah memprediksi 01 Jokowi-Amin yang menang, maka akan lebih menarik untuk membahas sebaliknya. Ok lets get started, jika mengikuti proporsi suara per provinsi yang sudah masuk sampai saat ini (kisaran 7-8%) maka prediksi saya Jokowi-Amin (51.38%) dan Prabowo-Sandi (48.62%). Hal ini cukup mengejutkan saya karena ternyata prosentase suara Jokowi-Amin menurut survey rata-rata 54-55%, saya melihat ada beberapa catatan penting disini (so far).

Original

Pertama pergeseran lumbung suara besar Jokowi di tahun 2014 yakni di daerah Sumut dan Sulawesi Selatan dimana total kedua daerah tsb menyumbang 16jt suara. Begitupula dengan daerah-daerah Sulawesi yang tadinya menjadi lumbung suara karena keberadaan pak JK.

Kedua penguatan lumbung suara Prabowo. Saya melihat hampir tidak ada provinsi yang berbalik dari mayoritas Prabowo menjadi mayoritas Jokowi. Semakin kuatnya basis-basis Prabowo akan membuat selisih suara semakin kecil.

Apakah Prabowo-Sandi masih bisa menang? Jawabannya masih, namun dengan beberapa catatan.

Saya coba melihat daerah-daerah yang masih bisa berubah proporsi suaranya karena ada indikasi dari beberapa Lembaga survey proporsinya berubah signifikan.

Pertama Sulawesi Utara dimana angka proporsi sekarang 82%:18% sedangkan menurut Charta Politika 73%:27%

Kedua DKI Jakarta dimana proporsi sekarang 52%:48% sedangkan menurut Charta Politika 49%:51%.

Apakah itu sudah cukup? Ternyata belum. Untuk memenangkan pertarungan ini Prabowo-Sandi harus berjuang memastikan di Jawa Tengah mereka mendapatkan 30% suara, begitupula di Jawa Timur minimal harus mendapatkan 40% suara.

Dengan semua Analisa dan asumsi diatas komposisi akhir pilpres 2019 bisa menjadi 49.90% : 50.10%.

WhatIf

Analisa ini hanya merupakan exercise pribadi saya untuk menelaah dinamikan politik yang sekarang sangat HANGAT. Masih ada beberapa variable seperti tingkat golput per provinsi yang belum saya masukkan, mungkin diupdate berikutnya. Saya sangat terbuka untuk diskusi dari semua pihak untuk lebih menajamkan prediksi, karena saya yakin masih banyak factor yang belum diperhitungan dalam analisis ini.

Salam

Data Type: Discrete vs Continues

Minggu lalu saya diminta oleh rekan saya untuk membantu sebuah unit baru di kantor saya. Unit ini kedepannya akan sangat intense menggunakan data sebagai bagian dari pekerjaannya. Saya diberikan sebuah set data untuk kemudian di analisa untuk membuktikan bahwa konsep-konsep statistika dapat diaplikasikan dalam pekerjaan mereka. Setelah menyiapkan beberapa halaman slide, saya pun datang dan menjelaskan bagaimana langkah-langkah yang saya lakukan sampai menghasilkan model sesuai dengan harapan mereka. Ternyata… sebagian besar dari audiens masih sangat awam dengan jargon-jargon statistika. Hal ini membuat saya kembali berpikir bahwa kembali menguatkan konsep dasar tidak akan pernah menjadi kesia-siaan. Baiklah, mari kita mulai dengan discrete dan continues.

Sederhananya variabel discrete adalah variabel yang berasal dari operasi menghitung. Jumlah gelas di dalam lemari, jumlah buah di dalam keranjang. Hitungan sederhana seperti 1,2,3 dst. Tidak ada angka desimal di dalam variabel discrete.07778a4906f57221506f44beef50cf6d

Sedangkan variabel continues adalah variabel yang memiliki selisih antara dua variabel 0 hanya jika variabel tersebut dikurangi dengan dirinya sendiri. Ciri-cirinya adalah adanya angka decimal 1.991, 1.9999992 dst. Contohnya adalah berat badan, tinggi badan, interval waktu dll.

cant-lose-weightPenentuan variabel ini sangat berpengaruh terhadap analisa data yang akan anda lakukan kedepannya. Jika anda mempunyai variable discrete akan lebih cocok jika anda menggunakan median untuk ukuran pemusatan dan untuk variabel continues akan lebih tepat jika anda menggunakan rata-rata. Jika anda masih bingung dengan ukuran pemusatan mungkin anda ingin membaca tulisan saya tentang Ukuran Penyebaran Data.

Biasanya saat anda melakukan import data kedalam software anda akan diminta untuk mendifinisikan variabel yang anda masukkan. Nah dengan mendefinisikan data anda dengan tipe data yang tepat anda tidak akan mengurangi masalah yang mungkin anda hadapi pada langkah-langkah berikutnya.

 

Tipe-tipe data yg wajib diketahui analyst pemula

lrdatahd

Tidak ada salahnya kita terkesa dengan berbagai jenis analisa keren dan sophisticated kayak regression, naive bayes, decision tree dkk. Namun sebaiknya sebelum kita lompat kearah situ mari kita melihat hal-hal basic yg mungkin terlewat, terutama bagi rekan-rekan yang baru saja berkecimpung di dunia data.

Pada postingan saya sebelumnya, saya sudah menjelaskan jenis2 data berdasarkan sifatnya (nominal, ordinal, interval dan rasio) nah sekarang kita sedikit mundur ke belakang utk mengenal dan mengetahui tipe data. Disini saya levih menekankan definisi yang digunakan di dunia database.

Memang sudah tdk dapat dipungkiri lagi bahwa sebagian besar data kita tersimpan dalam sebuah ekosistem database dimana didalamnya ada kolom (field) dan baris (record). Ekosistem ini sangat efisien sehingga dari awal pembuatan database ini perlu diketahui apa saja tipe data dari kolom-kolom yang disimpan.

1. Character/ String/ varchar

Tipe data jenis ini dicirikan dengan adanya HURUF, ANGKA dan KARAKTER, operasi matematika yang bisa dilakukan adalah COUNT. Jika kita petakan ke jenis data di area statistika maka yang masuk kategori ini adalah nominal dan ordinal.

2. Integer dan float

Integer atau yang lebih dikenal dengan bilangan bulat adalah tipe data yang dihasilkan dari operasi COUNT yang menandakan banyaknya benda. kita bisa melakukan operasi hampir semua operasi matematika untuk tipe data ini. Sedangkan FLOAT adalah tipe data yang mengandung angka desimal. Kedua tipe data ini dapat dikategorikan menjadi jenis data RASIO dan INTERVAL.

3. Boolean

Seringkali dalam query kita mema=bandingkan antara dua value atau lebih dengan menggunakan IF..THEN..ELSE… atau menggunakan >, = dkk. Nah hasil dari pembandingan ini disimpan dalam bentukan BOOLEAN. Tipe data ini hanya memiliki dua nilai yakni TRUE dan FALSE.

Dengan mengetahui tipe-tipe data ini kita dapat mendesign sebuah  analisa data sesuai dengan tipe data yang kita miliki. Seringkali kita menemukan tipe data yang tidak sesuai dengan kebutuhan kita, akhirnya harus melakukan transformasi yang sangat banyak untuk itu. Memang tidak salah akhirnya pekerjaan data analyst, statistician dan data scientist 90% nya dihabiskaan hanya untuk data preparation.. Nasiiiib…

Step by Step Menampilkan Grafik dari Google SpreadSheet

Karena penasaran dengan cara orang-orang menampilkan chart-chart yang interaktif di websitenya. Maka saya coba cari artikel tentang how to nya. Setalah mencoba sendiri, saya tampilkan hasil coba-coba saya. Lets check it out 🙂

  1. Buatlah file seperti halnya anda membuat file di Ms Excel.

table spreadsheet

2. Kemudian block file yang anda inginkan untuk disajikan dalam bentuk grafik, dan pilih chart editor. Setelah itu pilih jenis chart sesuai dengan kebutuhan anda.

Pilih chart editor

3. Setelah anda memilih chart yang dinginkan, pilih insert dan anda akan melihat hasil chart pada google spreadsheet anda. Pilih Publish chart.

pilih menu pojok

4. Setelah memilih publish chart, anda akan menemukan tampilan link dan embedded. Agar chart langsung tampil pada page anda pilih embedded dan copy link nya.

copy link chart embedded

5. Karena saya menggunakan wordpress maka penjelasan berikutnya menyesuaikan dengan domain blog masing-masing. Pada menu wordpress saat anda membuat new post akan ada menu insert link. Pilih insert link dan paste link yang anda copy sebelumnya dari google spreadsheet.

Copy URL dan Link Text

6. Setelah anda selesai semua langkah di atas. Anda bisa lihat hasilnya seperti chart dibawah ini. Mudah bukan??