Cara Mudah Menggabungkan Beberapa File txt/csv Besar (Tanpa CoPas)

Seperti anda semua ketahui bahwa jumlah row/baris ms excel itu terbatas sekitar 1jt row. Buat anda yang sering bekerja dengan data yang besar maka ms excel akan sangat kewalahan untuk menampung data yang anda miliki, padahal kita biasanya menggunakan excel untuk melakukan manipulasi dan pengolahan data.

Jika anda menggunakan excel untuk menggabungkan 2 atau lebih file dengan total row lebih dari 1 jt row maka hal itu tidak mungkin anda lakukan. Mungkin anda berpikir untuk mencari software-software kecil yang anda gunakan untuk membantu pekerjaan anda.

Kondisi yang lain, mungkin anda dapat menggunakan ms excel untuk menggabungkan data, namun jumlah file yang anda miliki misalkan 100 file txt atau csv. Mungkin anda akan mati kebosanan untuk melakukannya. Berikut saya berikan langkah sederhana untuk menggabungkan file txt atau csv tanpa menggunakan software tambahan lain.

Pertama nyalakan COMMAND PROMPT dengan mengetik cmd pada kolom pencarian.

cmd1

Arahkan ke direktori pada folder yang berisi file yang anda ingin gabungkan.

cmd3

dapat dilihat bahwa kita memiliki 14 file yang akan digabungkan.

cmd0

Pada command prompt masukan script copy /b *.csv gabung.csv dimana copy /b adalah script default, *.csv berarti menggabungkan semua file yang ada di folder tersebut. Sedangkan gabung.csv adalah nama file hasil penggabungan.

cmd4

Pada folder yang sama akan muncul 1 file bernama gabung.csv

cmd5

Sebelum anda menggunakan file tersebut jika pada file asli anda memiliki header pada datanya, maka anda perlu menghilangkan header tersebut dari file hasil gabungan.

cmd6

Cukup dengan sort datanya dan delete semua row yang berisi header.

cmd7

Setelah langkah terakhir anda lakukan, maka file gabung.csv anda sudah dapat anda gunakan.

 

Bagaimana mengetahui trend data di excel?

Sebelum anda melakukan analisa data yang kompleks, langkah pertama yang anda perlu lakukan adalah mengetahui TREND data yang anda miliki. Dibandingkan melihat dalam bentuk tabular/tabel, akan jauh lebih mudah untuk memunculkannya dalam bentuk grafik.

Selain itu excel memiliki sebuah fitur untuk memunculkan trend dengan sangat mudah, ditambah lagi dengan adanya fitur forecasting atau pendugaan. Adapun langkah [ertama yang anda lakukan adalah membuat grafik line sederhana.

Trendline1

Langkah kedua adalah klik kanan pada grafik garis yang sudah terbentuk dan pilih ADD Trendline

Trendline2

Langkah ketiga adalah memilih jenis pendekatan trend yang paling sesuai dengan karakteristik data. Terdapat 6 pilihan yakni:

  1. Exponential : Cocok untuk data yang karakternya meningkat atau menurun secara berpangkat misalkan 1, 4, 16 dst.
  2. Linear : merupakan pendekatan yang paling populer dimana sebaran data didekati dengan menggunakan garis lurus yang mewakili data. Pendekatan linear cukup sederhana dan paling mudah untuk di interpretasikan.
  3. Logaritmik : jika data pertama dan data kedua memiliki hubungan logaritmik maka tentu saja pendekatan ini akan lebih sesuai.
  4. Polinomial: Jika data anda memiliki puncak dan lembah yang banyak dan tingkat akurasi adalah hal yang anda utamakan maka anda dapat menggunakan polinomial dimana merupakan kombinasi dari exponential dan linear. Khusus untuk polinomial dapat dipilih sampai pangkat ke-sekian
  5. Power: hanya digunakan jika data anda meningkat secara drastis
  6. Moving average: jika data anda bergerask sesuai dengan rata-rata periode sebelumnya, maka anda dapat menggunakan moving average pada data anda.

Trendline3

Langkah terakhir: Setelah anda memilih salah satu pendekatan, anda dapat memilih memunculkan formula trend yang anda pilih dengan memilih display equation on chart. 

Mungkin anda memiliki pertanya bagaimana mengetahui trendline yang anda pilih adalah yang paling baik? Untuk itu kita dapat menampilkan R-squared yang menunjukkan seberapa besar trend yang kita buat merepresentasikan keseluruhan data.

Trendline4

Selain itu kita dapat melakukan forecasting dengan menggunakan trendline yang kita pilih. Untuk meramal kedepan kita dapat menggunakan forward dan untuk masa lalu kita dapat menggunakan backward. Workshet yang saya gunakan dalam tutorial ini dapat di download disini

 

Korelasi tidak bermakna sebab-akibat

Anda mendatangi sebuah seminar, dimana anda disajikan berbagai macam informasi. Lalu anda terpaku pada sebuah grafik yang menurut anda cukup menarik. Coba anda lihat sendiri apakah grafik dibawah ini cukup menarik..

aaeaaqaaaaaaaanoaaaajdu3njk4mjvjltbmogqtndmwmi04mgjjltzkytaxnja0mjhkmw

Wow…ini sangat menarik. Apa hal pertama yang anda lihat? Lihatlah garis biru dan merah yang berdampingan dan saling mengikuti satu sama lain. Apakah anda sejenak berpikir kedua hal tersebut saling berpengaruh satu sama lain? Tunggu dulu! Coba anda perhatikan keterangan grafik diatas. Beneran nih??? Penjualan es krim dan kebakaran hutan?? Logika saya tiba-tiba macet dan berpikir ulang mengenai sebab-akibat, bagaimana mungkin es krim menyebabkan kebakaran hutan??.

Percaya atau tidak kita sering melakukan ini dalam kehidupan sehari-hari, kejadian banjir jakarta disebabkan oleh hujan di bogor, jalanan macet disebabkan oleh banyak angkot, hidup saya menderita karena jokowi jadi presiden. Cukup familiar?? Contoh-contoh diatas memang menggelitik rasa penasaran kita mengenai apa penyebab suatu hal terjadi. Logika jika ini terjadi maka itu terjadi adalah logika sebab akibat. Namun kita harus sangat berhati-hati untuk menghubungkan dua kejadian yang seakan-akan berhubungan namun kenyataannya keduanya hanya semata-mata akibat dari suatu SEBAB yang sama-sama tidak atau belum kita ketahui.

Kembali ke ES KRIM dan KEBAKARAN HUTAN, dengan menggunakan logika sederhana kita mengetahui bahwa keduanya tidak berhubungan, namun ada hal yang menghubungkannya. Kita bisa menggambarkannya sebagai berikut:

Kebakaran hutan—>Suhu tinggi–>Musim Kemarau–>Suhu tinggi—> Makan Es krim–>Penjualan es krim meningkat

Terlihat lebih masuk akal kan?

Kenyataannya memang antara penjualan es krim dan kebakaran hutan mempunyai korelasi yang sangat tinggi let’s say 90% namun demikian tidak serta merta kita bisa menyimpulkan  or berspekulasi bahwa penjualan es krim yang menyebabkan kebakaran hutan atau kebakaran hutan yang membuat penjualan es krim meningkat.

Lalu bagaimana membuktikan bahwa dua variabel punya hubungan sebab akibat? Nah disinilah anda membutuhkan pemodelan regresi dan rancangan percobaan.  Kemampuan metode ini dalam memisahkan faktor-faktor yang benar-benar berpengaruh (secara signifikan) terhadap faktor-faktor lain (termasuk didalamnya adalah error-galat) memberikan kita bantuan apakah sebuah faktor benar-benar memiliki hubungan berpengaruh atau hanya sekedar kebetulan semata.

Sepertinya berikutnya bagus juga untuk membedah rumus korelasi dan rumus anova/regresi untuk menemukan bagaimana metode ini dapat memisahkan faktor kebetulan ini. 🙂

Coba kita lihat rumus korelasi berikut:

korelasi-5

Jika kita bedah rumus korelasi diatas kita hanya melihat jika ada dua variabel X dan Y maka besarnya r hanya ditentukan seberapa besar perubahan X dan Y bergerak pada suatu rentang tertentu. Disini kita hanya dapat menyimpulkan bahwa X dan Y berubah searah (+) atau berlawanan (-) dan jika jarak antara data X dan Y cukup dekat maka korelasinya kuat sedangkan jika jarak antara X dan Y berjauhan maka korelasinya lemah. Jika pertanyaan kita adalah jika X bergerak satu satuan, berapa satuankah Y bergerak? Karena jika pergerakan X tidak membuat Y bergerak sama sekali artinya X tidak mempengaruhi Y.  Dengan perhitungan korelasi, kita tidak mendapatkan informasi pergerakan Y saat X bergerak. Jadi jelas sudah konsep korelasi tidak bisa menjawab kausalitas (Sebab- akibat). Sudah cukup jelas??

Like & share –>jika artikelnya cukup berguna

Komentar–> jika ada yang kurang jelas 🙂

 

Fun Fact Factory

Sebagai seorang quant (orang yg bekerja denhan angka) kerjaan rutin saya adalah membuat sebuah analisa,  laporan,  dashboard  insight..  Dan teman sepermainannya. Intinya menghasilkan informasi bagi para pengambil keputusan aka decission maker. Well… Intinya mereka bertanya.. Terserah Kamilah bagaimanalah caranya menjawab, yang pasti adalah DEADline nya… Setelah tak terhitung request informasi yg masuk saya melihat beberapa pola yg muncul dr para bos ini. Mereka sangat suka data…  Tapiii tidak semua pertanyaan yg disampaikan berguna utk bisnis. Cuma pengen tahu saja kira2. Jadilah tim report ini menjadi pabrik permen informasi, enak dilidah tapi gak mengenyangkan. 

Dari sekian banyak informasi yang diminta (seringkali berulang)  selalu ada informasi2 yang cukup berharga… Informasi ini jika sampai ditangan yang tepat maka akan menjadi senjata ampuh untuk memajukan bisnis. Rekan2 programmer saya sih udah gak akan sempat mikirin yanag kayak gini, jadilah ex data analis yang jadi project manager ini menjadi pengumpul remah2 ini. Hal yg ditanyakan berulang dibuatkan otomasinya…  Kirim via email..  Schedule kan! Cara yang lain adalah bikinin dashboardnya…  Modal dikit belilah semacam tableau, datazen atau bikin sendiri pake goohle chart klo mau gratisan. Percaya deh…  Anda akan membuat atasan anda senyum2 sendiri dan anda masih ounya waktu buat sekedar baca2 buku yg mungkin udah dari setahun lalu gak tersentuh. 

Ability to see pattern in randomness

life_is_random

Dulu sekali, disalah satu stasiun televisi swasta menayangkan sebuah acara dimana beberapa orang ‘sakti’berkumpul untuk menangkap hantu. Kami yang saat itu masih anak-anak sangat menggandrungi acara ini, apalagi saat salah seorang dari pemburu tersebut membuat lukisan dengan mata tertutup, lalu muncullah gambar makhluk-makhluk aneh dengan ajaibnya.

Beda halnya dengan salah satu karakter novel kesukaan saya Sherlock Holmes, berkali-kali membaca dan menonton film dan serialnya selalu membuat saya berdecak kagum. Kemampuannya dalam memecahkan kasus-kasus kriminal membuat pembaca tenggelam dalam alur cerita yang dituliskan oleh Sir Arthur Conan Doyle.

Lalau apa hubungannya antara pemburu hantu dan Sherlock Holmes? Keduanya memiliki sebuah kesamaan yakni kemampuan melihat sesuatu yang tidak bisa dilihat oleh orang kebanyakan. Walau dalam kasus pemburu hantu saya juga masih ragu apa itu rekayasa atau bukan, tapi ya sudahlah anggap saja mereka bisa lihat.period. Kemampuan ini yang membuat mereka special dan berbeda dengan orang lain yang akhirnya membuat mereka terkenal dan dibayar mahal.

Menurut saya apa yang kita lakukan dalam menganalisa data adalah mencoba melihat pola-pola yang tidak terlihat dari sekumpulan data atau kejadian yang seakan-akan acak dan chaos. Dalam era social media ini, perusahaan selalu mencoba untuk lebih baik dari perusahaan lain dengan berbagai cara, salah satu nya adalah membuat produk yang berbeda dan lebih baik dari pesaingnya. Semakin banyak kita tahu tentang informasi lebih dari pesaing kita, maka semakin besar peluang kita menang.

Di zaman dimana semua aktifitas kita terekam lewat sebuah alat yang bernama smartphone ini, maka tidak ada lagi batasan antara kita dengan perusahaan penghasil produk. Tergantung apakah mereka mampu menemukan pola/pattern yang kita hasilkan. Dapatkah mereka memberikan sebuah penawaran/solusi/produk/jasa yang sesuai dengan kebutuhan kita.

Pertanyaan untuk kita adalah apakah anda mampu melihat pola yang teratur dalam sebuah kejadian acak?

Kotak ajaib bernama SPSS

Mas datanya mau diolah pake analisa apa? Pake spss aja mas… #zzz buat anak kuliahan yang sedang mengolah data skripsi nya..  Software yang satu ini memang paling ngetop dan sakti banget. Tinggal klak klik dikit trus run aja udah keluar outputnya…  Canggih banget..  Terus langsung pake langkah sakti ambil alpha 5% atau tinggal liat aja bintang2 nya… Analisanya pokoknya ikut skripsi yang lama aja… 

Pola ini adalah pola yg paling sering saya lihat saat ada klien baru atau teman yg minta bantuan utk menganalisis datanya. Seakan2 sebuah software dapat menjadi kotak ajaib yang mengerti kemauan sang mahasiswa. Jebakan inilah yg nantinya akan membuat skripsi anda beranak pinak di dalam folder komputer anda.  Mungkin namanya agak beda2 tapi yg paling umum skripsi_print.doc skripsi_revisi.doc skripsi_printlagi.doc atau skripsi_print_cbdl_mdh2n_diterima.doc.. Hehe

Maksud saya,  lebih baik anda coba sedikit membaca tulisan tentang how to nya menggunakan software tertentu bukan cm SPSS,  baca help nya,  yg paling penting baca dan pelajari buku basic statistik nya. Klo mau cepat ya cari orang yg ngerti. Trust me,  dari pada dengerin dosen ngomel krn kita ngasal mending belajar dikit..  Palingan revisi sekali dah sidang. Salam lulus cepat! 

Story Telling dengan Data??

data-storytelling-lifecycle-via-infogr-am-sept-2014

Pada postingan sebelumnya saya pernah menuliskan bagaimana teknik penyajian dengan stroy telling atau tutur cerita adalah salah satu cara paing efektif untuk menyampaikan informasi dengan baik. Dengan cara ini orang yang menjadi audiens akan lebih PERHATIAN, MENYIMAK, dan MENGINGAT informasi yang kita sampaikan dengan lebih baik.

Saya adalah orang data dan saya suka bercerita. Saya bercerita dengan data. Ini adalah gaya komunikasi yang saya gunakan dan saya sangat menyukainya. Ingin tahu apa saja yang diperlukan untuk membuat sebuah story telling dengan data? Let’s get started.

Bagi anda yang bekerja di perusahaan yang berbasis teknologi, tentunya anda akan menemukan sebuah divisi khusus yang mengelola data dan infrastrukturnya. Umumnya disebut divisi IT, sebagian perusahaan malahan sudah memiliki divisi yang jauh lebih spesifik yang mengelola jenis data yang sekarang sedang ng-trend yakni BIG DATA.

Apapun jenis perusahaan tempat anda bekerja, baik anda di unit operasional maupun unit bisnis anda akan sering diminta melakukan analisa bisnis baik rencana, monitoring maupun laporan akhir. Hasil laporan yang anda buat kemudian akan disampaikan pada atasan anda, atau atasan dari atasan anda. Disinilah DATA STORY berperan. Anda bisa memilih untuk menampilkan datanya dalam bentuk tabel seperti ini?6-12-chart_4Atau anda menampilkan dengan beberapa grafik seperti ini?

figure-2

Apapun pilihan anda dalam menampilkan presentasi anda, pastikan anda membuatnya dengan cara yang benar. Btw, untuk kedua cara penyajian data diatas apa insight yang bisa anda dapatkan? Well, jujur saja saya sendiri kesulitan setengah mampus untuk membaca apa sebenarnya tujuan dari si pembuat grafik/tabel.

Pada data story salah satu hal yang perlu kita tekankan adalah KESEDERHANAAN (SIMPLICITY). Data seperti halnya dengan sumber informasi lain, seperti quote atau informasi dari ahli hanyalah ALAT untuk kita bercerita. Intinya adalah TUJUAN/MAKSUD kita agar bisa tersampaikan dengan baik. Thats all. Semakin banyak data yang anda tampilkan TIDAK membuat anda semakin PINTAR atau semakin JAGO, sebaliknya hal tersebut hanya menunjukkan anda TIDAK TAHU YG ANDA INGIN SAMPAIKAN.

Ada istilah sink or swim ini adalah istilah yang digunakan untuk menggambarkan bahwa dengan jumlah informasi yang begitu banyak, dapatkah anda menggunakan kemampuan anda untuk swimming diantara lautan informasi ini ataukah anda adalah orang-orang yang  sinking karena tidak mampu menggali dan memanfaatkan data dan informasi yang begitu banyak sehingga seakan-akan tenggelam dalam lautan data/informasi ini. Bagaimana dengan anda? Sudah bisa berenang atau masih kesusahan berjuang kepermukaan?

harrypotter5posterarticle-2559322-06775c8100000514-99_634x705

Apa cerita kesukaan anda? Harry Potter? Sherlock Holmes? Secara pribadi saya suka sherlock holmes, alasannya banyak kejutan-kejutan tidak terduga (UNEXPECTED) yang saysa temukan sepanjang cerita. Tentu saja kejadian itu begitu kuat teringat didalam ingatan. Dengan cara yang sama, kita berusahan menampilkan sesuatu yang UNEXPECTED di dalam data story kita. Kita lakukan berbagai analisa dari yang sederhana sampai yang complicated untuk menampilkan hal-hal yang tidak kasat mata. Sesuatu yang tidak disadari dan hanya bisa ditampilkan dengan menggali data. Cerita yang didalamnya ada hal yang UNEXPECTED akan sangat menarik untuk disimak, other way akan sangat membosankan.

Pernahkah anda menyimak sebuah presentasi dimana pada akhir sesi presentasi anda bukannya anda mendapatkan informasi malahan anda semakin bingung? Anda tidak menemukan kejelasan dalam presentasi tersebut. Dalam sebuah penyampian cerita anda harus konkrit (CONCRETE) artinya harus jelas, solid dan tidak membingungkan. Hal yang paling penting dari sebuah cerita adalah pesan yang akan disampaikan. Pesan inilah yang harus secara jelas dan solid tersirat dan tersurat dalam sebuah presentasi. Hindari penggunaan aksesoris yang berlebihan sehingga membuat tujuan utama dari presentasi tersebut menjadi blur dan tidak jelas.

honesty

Jika anda pernah membaca atau mendengar How To Lie With Statistics, maka anda pasti tahu apa yang akan saya bicarakan berikut ini. Ya, masalah kredibilitas (CREDIBILITY). Seorang Data analyst atau siapapun yang melakukan pengolahan data wajib mempunyai kredibilitas dalam menyajikan datanya. Tanpa sikap ini maka apapun yang akan disampaikan berikutnya tidak lebih dari omong kosong. Data tidak pernah berbohong, manusialah yang berbohong. Namun ditangan yang tepat data akan menjadi sesuatu yang luar biasa yang bisa menjadi pembeda antara kesuksesan dan kegagalan. Kebenaran dan kenyataan yang terkandung didalam data inilah yang perlu digali dan ditemukan oleh orang-orang yang kredibel. Sifat data analyst atau pengolah data inilah yang akan menentukan kredibilitas dari cerita atau informasi yang anda akan dapatkan.

Karena sekarang lagi ngetrend kpop, maka saya coba kasih contoh yang kekinian. Pernah lihat drama korea? Salah satu yang ngetrend dulu adalah Endless Love… sampai-sampai sebuah tabloid membuat sebuah grafik trendline jumlah air mata pemirsa yang terkuras untuk tiap episodenya… what?? Untuk yang sekarang silahkan pilih sendiri jenis film atau drama yang anda suka… Apa kesamaan dari semua film-film tersebut? Ssatu yang menurut saya selalu ada selain aktor-aktor ganteng dan selalu kaya dan cewek cantik yang urakan dan miskin.. hehe.. adalah EMOSI... Saat emosi pemirsa terlibat, maka semua urusan mengenai perhatian dan pengingatan akan menjadi mudah.. Emosi membuat keterikatan dan membuat proses mengingat menjadi lebih mudah dan kuat karena tidak hanya otak yang mengingat, namun seluruh anggota badan.

Dalam presentasi kita harus membuat sebuah alur cerita dan alur tutur yang membangkitkan emosi dari audiens kita. Pilihlah contoh-contoh atau pilihan-pilihan gambar yang punya koneksi dengan audiens, pilihan warna-warna yang mewakili simbol-simbol emosi tertentu dan yang paling penting tampilkan data dan informasi yang membuat audiens kita ‘WOW’. Memang membangun emosi audiens ini membutuhkan keterampilan berbahasa dan gesture yang tepat. Sekali anda bisa menguasainya anda dapat membuat audiens anda melakukan hal-hal yang anda inginkan. Thats the point.

Hal terakhir yang menurut saya perlu ditambahkan dalam ramuan data story kita adalah STRUCTURE. Saat anda punya banyak informasi yang sangat ingin anda sampaikan namun anda punya waktu yang sangat terbatas maka pastikan bahwa story anda tersusun dengan STRUCTURE yang membentuk alur cerita. Hindari lompatan logika dan lompatan kesimpulan yang akan membuat alur cerita menjadi kacau.

Hope this blogs post find you in great condition.. 🙂

 

~• Peluang (“Probability”) •~

By prof khairil notodiputro
Guru besar statistika IPB

Dalam matematika, peluang (p) merupakan ukuran kemungkinan terjadinya suatu kejadian. Karena p merupakan ukuran kemungkinan suatu kejadian maka kisaran nilai p, yaitu dari 0 sampai dengan 1, akan mencerminkan seberapa besar kemungkinan kejadian itu untuk terjadi. Semakin besar niai p dari suatu kejadian maka semakin besar pula peluangnya untuk terjadi. Begitu pula sebaliknya jika nilai p semakin kecil. Selanjutnya, karena p berkisar dari 0 sampai dengan 1 maka kejadian dengan peluang p=0 merupakan kejadian yang mustahil terjadi. Misalnya mustahil sepeda akan berubah menjadi sapi. Demikian pula suatu kejadian dengan peluang p=1 merupakan kejadian yang pasti terjadi. Misalnya setiap mahluk yang bernyawa pasti mati pada suatu saat.

Pertanyaannya adalah, bagaimana kita bisa mengetahui besarnya peluang terjadinya suatu kejadian? Atau bagaimana kita bisa mengukur besarnya p?

Besarnya p bisa ditentukan berdasarkan frekuensi relatifnya (“relative frequency”). Misalnya jika dari pengalaman 1000 kali penerbangan yang dilakukan oleh maskapai X ternyata terjadi 700 kali keterlambatan “take off”.  Ini bermakna bahwa jika kita pada suatu saat akan terbang dengan maskapai X maka peluang untuk terlambat “take off” adalah sebesar p=0.7.

Selanjutnya karena frekuensi relatif itu dasarnya adalah pengalaman yang sudah terjadi maka wajar dipertanyakan “bagaimana menentukan peluang p jika belum ada pengalaman dengan kejadian itu?” Dalam hal ini kita bisa menggunakan peluang subjektif (“subjective probability”).

Sebagai misal, si A akan mencalonkan diri menjadi kepala daerah X di tahun 2017. Si A belum pernah bersaing dalam pilkada sehingga peluangnya untuk menang tidak dapat ditentukan berdasarkan frekuensi relatifnya. Kita hanya bisa menentukan peluang menang pilkada bagi si A menggunakan peluang subjektif. Jika si A memiliki prestasi bagus (misal mampu memberantas korupsi di lingkungannya, membebaskan daerahnya dari banjir dan kemacetan lalu lintas, menggusur lokasi prostitusi, dsb) serta disenangi oleh sebagian besar masyarakatnya dan didukung oleh partai yang punya suara besar di parlemen, maka peluang si A untuk menang pilkada di tahun 2017 akan cukup besar.

Lebih lebih lagi jika si A dinyatakan bersih dari indikasi korupsi oleh KPK, ditambah lagi penantang berat dari si A juga sudah tidak akan mencalonkan diri dalam pilkada daerah X pada tahun 2017, maka peluang si A untuk menang akan semakin besar. Kawan saya tadi secara SUBJEKTIF mematok peluang si A untuk memenangi pilkada di daerah X pada tahun 2017 adalah sebesar p=0.90.

Itulah pengertian peluang secara matematika dan dalam kehidupan sehari-hari. Semoga bermanfaat..

Percayakah anda 9 dari 10 wanita menggunakan *******?

iklanKalau saya sih lebih percaya 9 dari 10 iklan lebih banyak ngibulnya dari pada benernya. Atau saya lebih percaya dari 10 kali anggota DPR ngomong 9 kali mereka berbohong, 1 kalinya bercanda…hehe. Tapi bukan itu intinya. Tapi apakah arti sebenarnya dari angka 9 dari 10? Let see.

Jika anda adalah penikmat acara televisi tanah air, maka saya dapat memastikan anda juga penikmat iklan tv. Bagaimana tidak dari setiap 5 menit tayangan acara, maka 2-3 menit lainnya adalah iklan tv. Ya.. iklan merupakan porsi terbesar dari pemasukan televisi sekaligus cara yang paling ampuh bagi pemilik produk untuk menginformsikan kepada pemirsa tentang produk mereka. Berbagai jenis iklan digunakan untuk menanamkan ke benak pemirsa agar kemudian dapat menggunakan produknya.

Di datatalker, saya tidak akan membahas lebih jauh mengenai jenis iklannya tapi bagaimana data disalahgunakan oleh pihak-pihak yang semata-mata mengharapkan keuntungan dengan mengabaikan kebenaran.

Klaim 9 dari 10 wanita telah memilih produk A. Apa yang terlintas di benak anda? Bagi pemirsa yang awam konsep statistika/matematika maka secara sadar maupun tidak sadar akan cenderung berpikir 90% wanita di Indonesia menggunakan produk A. Benarkah demikian?? Ini yang tidak pernah atau tidak mau ditunjukkan dengan jujur oleh pembuat iklan:

  1. Klaim 9 dari 10 wanita Indonesia menggunakan produk A adalah TIDAK TEPAT.
  2. Klaim tersebut adalah hasil SURVEY, dimana hasil survey tergantung dari metode surveynya. Jika menggunakan diambil secara acak dari POPULASI dan metodenya BENAR, maka klaim tersebut dapat dibenarkan. Jika TIDAK maka klaim tersebut hanyalah KEBOHONGAN.
  3. Letak KESALAHAN FATALNYA adalah klaim wanita Indonesia (seluruh), padahal hanya sebagian wanita yang ikut survey dan TIDAK MEWAKILI seluruh WANITA (Populasi).

Menurut saya kalimat yang disampaikan haruslah tidak ambigu misalnya, 9 dari 10 wanita yang kami survey (purposive/random sampling) menggunakan produk A. Tapiii… apakah terdengar menarik?? Sepertinya kebohongan yang cantik lebih dipilih daripada kebenaran dengan muka pasaran.

Visualisasi Distribusi Peluang

Saat mendengar istilah peluang (Eng: Probability) mungkin bagi beberapa orang akan terbayang hal yang berbeda, bagi kalian yang pernah mengambil mata kuliah statistika dasar maka konsep ini seharusnya bukan hal yang asing lagi. Pada dasarnya peluang adalah kemungkinan sebuah kejadian terjadi, dapat dihitung dengan rasio sebuah kejadian terhadap seluruh kemungkinan kejadian.

Untuk memvisualisasikan munculnya semua kombinasi kejadian terhadap semesta kejadian kita memerlukan sebuah teknik visualisasi yang mudah untuk dimengerti. Pernah lihat grafik seperti ‘lonceng’ seperti ini?

student_t_density_plot_1

Grafik ini adalah grafik dari Probability Density Function (PDF). Grafik PDF ini mengikuti sifat dari PDF yakni antara lain:

  • Karena random variabel yang digunakan sifatnya kontinu maka grafik PDF yang ada juga merupakan kontinu sepanjang random variabel yang ada
  • Area yang berada di bawah kurva memiliki nilai maksimal 1
  • Jika kita memiliki 2 titik (a, b) dimana a<b, maka peluang untuk kejadian tersebut adalah luasan daerah dibawah kurva antara a dan b
  • Peluang P(X=a)=0, artinya peluang satu titik (contoh a) adalah 0 (nol).

Bagaimana membaca grafik PDF ini? Kita bisa ambil contoh dengan grafik dibawah ini. Pada grafik diatas menggambarkan PDF dari cacat produksi lampu. Sigma (σ) disini adalah nilai yang didapat dari  tingkat kecacatan produk yang dihasilkan dalam sebuah proses produksi. Untuk lebih jelas dapat dilihat tabel berikut:

six_sigma_normal_distribution_2

six_sigma_level_yield_table

Misalkan kita punya pertanyaan berapa peluang cacat produksi lampu tersebut lebih besar dari 690.000 ppm (part per million), maka kita mendapatkan sigma level nya adalah 1, dengan mengambil seluruh area dibawah kurva (dari -1σ sampai 1σ) dimana yield (success) 30.85% dan tingkat kecacatan 69.15%.

Dengan adanya penjelasan visualisasi fungsi peluang ini harapannya kita dapat mengaplikasikan konsep peluang kedalam aktifitas sehari-hari. Jika perusahaan anda mempunyai toleransi kecacatan produk sampai hanya 1 sigma, artinya anda mentolerir hampir 70% produk anda terbuang percuma. Namun jika anda ingin untung tentunya anda akan mengontrol proses produksi anda seefisien dan seefektif mungkin. Dengan menetapkan standar Qulaty Control (QC) yang baik, maka anda akan memperkecil kerugian dari terbuangnya bahan baku dari produk yang cacat.

Aplikasi penggunaan PDF ini sangat banyak, jika ada yang ingin share lebih banyak silahkan masukkan ke kolom komentar. 🙂