Akibat regresi linear

Beberapa hari yg lalu saya tampil di depan rekan2 kerja saya dalam rangka sharing session yang biasanya dilaksanakan setiap jumat. Saya diminta utk menjelaskan apa saja6yg sudah dipelajari dari lynda.com. Itu lho situs belajar mandiri dari linkedin… Sebagai bentuk pertanggungjawaban sudah dapat akses premium jadilah hari itu saya maju.

Di lynda.com saya ambil beberapa course dasar seperti statistics foundation, data science dan juga business analytics. Saya semakin sadar bahwa gap skill yg saya miliki dibandingkan dengan ekspertis di luar sana. Fine. Dengan segala keterbatasan yang ada saya buat sebuah presentasi yg berjudul unboxing hubungan antar data. Isinya pokoknya menjelaskan kembali konsep korelasi dan juga regresi. Ternyataaaa hampir semua yg duduk menyaksikan gelisah berharap presentasi saya segera selesai… Hahaha. Walaupun demikian ada juga yg bertanya ttg konsep p-value. Damn!!

Finally presentasi berjalan dengan kegelisahan para hadirin…. Walaupun seminggu ini saya terus2an di godain dengan celetukan… Wooi datanya bisa diberesin tuh sama si rahmat pake regresi…. Wakakakak. Damn again!!

Advertisements

Presentasi data: Two long tail perspective…

Kerap kali saat anda sudah punya data dab anda punya kemampuan untuk melakukan penelitian, anda kesulitan untuk menyampaikan informasi kepada publik lewat susunan cerita yang menarik. Diskusi sore ini bersama big bos, saya menemukan sebuah pola pikir yang sangat menarik. Berawal dari saking banyaknya data yang kami miliki, kami kesulitan merangkai semua data itu menjadk sebuah cerita yang utuh. Hingga akhirnya muncul celetukan, pakai saja analisis two tail… Dalam hati.. Whaat? Baruu denger saya.

Pikiran saya langsung tertuju pada grafik sebaran normal dengan dua ekor dikiri dan dikanan. Bell Curve. Ternyata apa yg saya pikirkan terlalu rumit… Ternyata analisa ini sangat simpel namun dengan mengambil konsep sebaran data.

Kita pasti tahu bell curve… Nah dua tail atau ekor grafik ini menggambarkan posisi yang ekstrim dari data… Ekstrim besar dan ekstrim kecil… Misalkan kita menganalisis data sales maka salah satu opsi dalam menyampaikan informasi adalah dengan mengambil detail dari kedua tail. Ekstrim kanan menggambarkan sales yang penjualannya sangat tinggi, lets say top 95 percentile… Sedangkan di kiri kita ambil contoh untuk sales yg tidak achieve… Misalkan bottom 10 percentile. Dengan menggali detail kenapa kedua sales ini berada di sisi ekstrim sangatlah penting. Kita ingin agar sales yg ada dibagian tengah dapat mencontoh strategi sales yang berhasil dan menjauhi sales yg tdk achieve.

Harapan kita adalah nilai tengah dari sales yg skrg berkumpul ditengah dapat bergeser ke arah kanan yg secara total akan menaikkan sales performance secara keseluruhan.

Mengenal data geocode/spasial

Saat saya menyusun skripsi S1, saya mempertimbangkan untuk mengambil judul yang berkaitan dengan bionformatika namun apadaya ilmu saya masih sangat dangkal dan referensi yang saya miliki benar-benar terbatas. Akhirnya pilihan saya adalah topik yang lebih membumi yakni mengenai spasial analysis. Singkat cerita setelah masuk ke dunia kerja, saya menemukan ternyata banyak sekali informasi spasial yang digunakan. Tampilan grafiknya pun sudah cakep-cakep, jauh sekali dengan saat zaman saya kuliah dimana petanya pun hitam putih dan lokasi hanya ditunjukkan dengan titik dan warna.

maps_build9

contoh map dari tableau

Kombinasi antara informasi non spasial dengan informasi spasial benar-benar memberikan dampak yang besar dalam cara berpikir kita. Bagi ada yang sudah familiar dengan software-software visual analytic atau business intelligence tidak akan asing lagi menampilkan data dengan map chart, namun tulisan saya ini bermaksud memperkenalkan jenis data ini kepada mereka yang baru mengenal dunia visual analytic.

Hal pertama yang perlu kita tahu adalah konsep latitude dan longitude. Saya kutip saja nih pengertiannya:

Latitude adalah garis yang horisontal / mendatar. Titik 0 adalah sudut ekuator, tanda + menunjukan arah ke atas menuju kutub utara, sedangkan tanda minus di koordinat Latitude menuju ke kutub selatan.

Longitude adalah garis lintang . Angka dari sudut bundar bumi horisontal. Titik diawali dari 0 ke 180 derajat, dan 0 ke-180 ke arah sebaliknya.

link lengkapnya

Data long-lat inilah yang menjadi petunjuk kita untuk menemukan lokasi sebuah tempat di permukaan bumi. Baiklah supaya lebih konkrit saya telah mengunduh data sample di disini untuk kita visualkan.

Disini kita akan menggunakan software ms excel yang semua orang bisa menggunakannya. Setelah anda mengunduh datanya, kalian bisa membuat visualisasi seperti ini.map_excel_jadi

Beneran ini cuma bermodal ms excel 2016. Keren kan?? Coba bayangkan kalian bikin presentasi dengan menggunakan chart keren ini…Ada yang butuh tutorial untuk bikin map kayak gini? Let me know…

First Step in Data Analysis

Saat ini sudah bukan zamannya lagi kita banyak alasan bahwa kita tidak bisa melakukan analisa data karena TIDAK PUNYA DATA, sebaliknya kita malah sekarang masuk ke tahap BINGUNG karena TERLALU BANYAK data yang kita miliki. Konsekuensi yang sering kita temui adalah “apakah kita menggunakan data yang benar untuk mendukung pengambilan keputusan kita?

Empat hal yang perlu anda perhatikan saat memulai analisa data adalah:

  • Tanyakan pertanyaan yang TEPAT
  • Temukan data yang TEPAT untuk menjawab pertanyaan
  • Gunakan tools dan software analisa yang TEPAT untuk mengekstrak informasi dari data
  • Gunakan pengetahuan terkait anda untuk mempertajam kesimpulan

 

 

RFM modelling,  know your customer 

Untuk perusahaan manapun customer,  pelanggan atau nasabah adalah bagian terpenting dari perusahaan. Tidak perlu analisa tingkat tinggi untuk mengetahui bahwa customer yang loyal memberikan keuntungan yang paling tinggi. Lebih-lebih lagi customer yang loyal memberikan value atau nilai bagi perusahaan.

Bagaimana caranya membedakan customer yang loyal dan tidak?  Cara yang paling umum digunakan adalah dengan mengukur seberapa besar profit yang dihasilkan per customer nya. Jika anda punya data ini maka anda sudah memiliki cukup modal untuk analisa segmentasi. Menurut pengalaman saya, bagian yang paling susah adalah mendapatkan data yang sesuai keinginan dan sesuai dengan kebutuhan. Bagian analisa nya sendiri tinggal mengikuti tutorial di artikel. 

So,  back to the business. Jika hanya menggunakan komponen keuangan/ monetary maka value dr informasi yang kita dapatkan hanyalah terbatas pada uang yg dihasilkan. Kita kehilangan informasi mengenai apakah customer tsb melakukan transaksi sekali dalam jumlah besar atau berkali-kali namun dalam jumlah kecil. Nah disinilah kita membutuhkan berapa kali frekuensi transaksi dalam periode tertentu dilakukan. Satu hal lagi yang perlu kita tambahkan adalah mengenai kapan terakhir kali mereka bertransaksi untuk mengetahui apakah customer kita masih terus menggunakan produk atau layanan yang kita miliki. 

Analisa ini cukuplah mudah untuk dikerjakan dan juga cukup mudah untuk diterjemahkan sehingga unit terkait dapat segera mengambil keputusan terkait program marketing atau promosi lainnya. Dengan menambahkan informasi dari model RFM ini perusahaan sudah menggunakan konsep analitik paling dasar dalam pengambilan keputusan customer nya. Langkah pertama ini sangat penting menjadi bagian dari budaya perusahaan, seiring dengan perkembangan bisnis. Kebutuhan analisis yang lebih tinggi otomatis akan semakin dibutuhkan, namun dengan mematangkan konsep dasar ini akan menjadi fondasi yang kuat untuk kedepannya. 

Fun Fact Factory

Sebagai seorang quant (orang yg bekerja denhan angka) kerjaan rutin saya adalah membuat sebuah analisa,  laporan,  dashboard  insight..  Dan teman sepermainannya. Intinya menghasilkan informasi bagi para pengambil keputusan aka decission maker. Well… Intinya mereka bertanya.. Terserah Kamilah bagaimanalah caranya menjawab, yang pasti adalah DEADline nya… Setelah tak terhitung request informasi yg masuk saya melihat beberapa pola yg muncul dr para bos ini. Mereka sangat suka data…  Tapiii tidak semua pertanyaan yg disampaikan berguna utk bisnis. Cuma pengen tahu saja kira2. Jadilah tim report ini menjadi pabrik permen informasi, enak dilidah tapi gak mengenyangkan. 

Dari sekian banyak informasi yang diminta (seringkali berulang)  selalu ada informasi2 yang cukup berharga… Informasi ini jika sampai ditangan yang tepat maka akan menjadi senjata ampuh untuk memajukan bisnis. Rekan2 programmer saya sih udah gak akan sempat mikirin yanag kayak gini, jadilah ex data analis yang jadi project manager ini menjadi pengumpul remah2 ini. Hal yg ditanyakan berulang dibuatkan otomasinya…  Kirim via email..  Schedule kan! Cara yang lain adalah bikinin dashboardnya…  Modal dikit belilah semacam tableau, datazen atau bikin sendiri pake goohle chart klo mau gratisan. Percaya deh…  Anda akan membuat atasan anda senyum2 sendiri dan anda masih ounya waktu buat sekedar baca2 buku yg mungkin udah dari setahun lalu gak tersentuh. 

Ability to see pattern in randomness

life_is_random

Dulu sekali, disalah satu stasiun televisi swasta menayangkan sebuah acara dimana beberapa orang ‘sakti’berkumpul untuk menangkap hantu. Kami yang saat itu masih anak-anak sangat menggandrungi acara ini, apalagi saat salah seorang dari pemburu tersebut membuat lukisan dengan mata tertutup, lalu muncullah gambar makhluk-makhluk aneh dengan ajaibnya.

Beda halnya dengan salah satu karakter novel kesukaan saya Sherlock Holmes, berkali-kali membaca dan menonton film dan serialnya selalu membuat saya berdecak kagum. Kemampuannya dalam memecahkan kasus-kasus kriminal membuat pembaca tenggelam dalam alur cerita yang dituliskan oleh Sir Arthur Conan Doyle.

Lalau apa hubungannya antara pemburu hantu dan Sherlock Holmes? Keduanya memiliki sebuah kesamaan yakni kemampuan melihat sesuatu yang tidak bisa dilihat oleh orang kebanyakan. Walau dalam kasus pemburu hantu saya juga masih ragu apa itu rekayasa atau bukan, tapi ya sudahlah anggap saja mereka bisa lihat.period. Kemampuan ini yang membuat mereka special dan berbeda dengan orang lain yang akhirnya membuat mereka terkenal dan dibayar mahal.

Menurut saya apa yang kita lakukan dalam menganalisa data adalah mencoba melihat pola-pola yang tidak terlihat dari sekumpulan data atau kejadian yang seakan-akan acak dan chaos. Dalam era social media ini, perusahaan selalu mencoba untuk lebih baik dari perusahaan lain dengan berbagai cara, salah satu nya adalah membuat produk yang berbeda dan lebih baik dari pesaingnya. Semakin banyak kita tahu tentang informasi lebih dari pesaing kita, maka semakin besar peluang kita menang.

Di zaman dimana semua aktifitas kita terekam lewat sebuah alat yang bernama smartphone ini, maka tidak ada lagi batasan antara kita dengan perusahaan penghasil produk. Tergantung apakah mereka mampu menemukan pola/pattern yang kita hasilkan. Dapatkah mereka memberikan sebuah penawaran/solusi/produk/jasa yang sesuai dengan kebutuhan kita.

Pertanyaan untuk kita adalah apakah anda mampu melihat pola yang teratur dalam sebuah kejadian acak?

Reporting with No Ending

​Saat ini adalah zaman reporting. Betapa tidak hampir semua pekerjaan di semua perusahaan mewajibkan karyawannya utk membuat lawan laporan yang kemudian akan dibaca oleh atasannya.  Atasannya akanmembuat juga laporan berdasarkan laporan bawahan utk atasannya lagi..  Begitu seterusnya sampai diatas mereka hanya bisa melapor kepada Tuhan. 

Dalam membuat laporan,  komponen yang tdk terpisahkan adalah data dan informasi. Baik data yg sdh tersedia di database atau data yg anda kumpulkan di lapangan. 

Utk staff yang memang tugasnya membuat laporan bagian pekerjaan yg paling membuat stress bukanlah banyaknya laporan melainkan laporan yang berubah ubah formatnya. Seakan2 informasi yang baru sejam yg lalu dibuat telah masuk waktu expired. Blm lagi kalau laporan yang dibuat membutuhkan data yg tdk tersedia di sistem. Alamak! Berasa ingin lompat dr jendela kantor. Sayangnya langsung nyebur neraka.. Huff. 

Akhir2 ini saya sudah mulai bisa membuat sebuah sistem pelaporan yang cukup membuat pinggang saya bisa bersandar lega…  Ingat yabg dibuat itu sistem nya..  Bukan hanya laporan aja. Penambahan data atau sekedar update tanggal tidak lagi bikin sakit kepala. Bagi yang masih sakit kepala monggo dikomen 🙂 

Company Journey to analytics

big-data-analytics-framework

Gembar gembor big data dan data science mulai membuat ruang diskusi yg bertema komputer,  data dan statistik menjadi lumayan gaduh. Vendor pun dengan manisnya merayu perusahaan2 yang haus growth dengan janji manis bahwa produk mereka akan membuat perusahaan anda menjadi yang paling maju diantara perusahaan lain. Dengan gelontoran miliaran rupiah akan men-generate profit triliun an.

In fact thats too much! Pada kenyataannya apa yg kita butuhkan sebenarnya ada disekitar kita. Data,  tools,  dan talented people hamoir semuanya tersedia di organisasi anda. Apakah anda cukup pintar utk menemukan mereka? Pada dasarnya yang paling diperlukan adalah orang yang mau bersusah payah mencoba dalam keterbatasan yg dimiliki. Jika anda memiliki tim seperti itu maka anda akan dimanjakan dengan output super cepat saat mereka diberikan mainan yg lebih canggih. Tambahkan kedalam ramuan itu seorang leader yg mengerti sedikit teknis dan cakap dalam komunikasi maka saya jamin perusahaan anda berada di jalur kesuksesan.