Dapatkah analitik membantu dunia pendidikan?

Dilihat dari sudut pandang bisnis, dunia pendidikan bisa disebut salah satu sektor industri dimana terdapat input dan output yg selalu diukur apakah output yg dihasilkan sudah sesuai dengan kriteria passing grade. Analogi siswa sebagai produk dr sebuah pabrik yg dinamakan sekolah masih relevan walaupun tidak bisa dan tidak seharusnya disamakan for the sake of argument mari kita terima saja dulu.

Dalam proses memproduksi produk pabrik memperhatikan hal2 yg akan menaikkan kualitas dan juga yg menurunkan kualitas. Penyempurnaan proses ini lah yg membuat semakin lama produk yg dihasilkan semakin baik. Hal2 yg diukur ini dinamakan metrik atau measurment. Dengan menggunakan indikator dr metrik2 ini maka kita akan mempunyai visibility terhadap keadaan yg terjadi di pabrik.

Ok, lets back to school. Dunia pendidikan dimana sekolah menjadi ujung tombak dunia pendidikan selama ini mengumpulkan metrik2 seperti absensi, keaktifan, nilai ulangan, nilai tugas kelompok, tugas individu dan metrik2 lainnya. Sekolah dapat (harus) memanfaatkan data2 ini untuk menggerakkan kualitas lulusan dengan menerapkan langkah2 strategis lalu kemudian mengukur dan mengevaluasi metrik2 ini sampai tujuamnya tercapai.

Analitik selama berpuluh tahun telah membantu dunia manufaktur untuk meningkatkan kualitasnya.. saatnya dunia pendidikan mengadopsi analitik yg tidak hanya sekedar deskriptif namun juga predictive dan prescriptive. Untuk ini sepertinya saya perlu bekerja sama untuk membuat semacam quick win. Mampukah? Bisakah?

Advertisements

Overfitting: To good to be true alias model jago kandang

Model dalam statistika digunakan untuk memprediksi suatu nilai dengan memasukkan nilai-nilai lain kedalam sebuah formula dengan harapan nilai yang dihasilkan dari model tersebut dekat dengan nilai aktualnya. Sebagaimana kita ketahui bahwa dalam membuat sebuah model, kita membagi data menjadi dua bagian yakni data training dan data testing. Biasanya saya membaginya 70% training dan 30% testing.

fittings

Setelah kita mendapatkan model dengan mempertimbangkan kelayakan model/ goodness of fit maka kita melakukan testing dengan data testing kita. Tapi masalahnya adalah bagaimana jika hasil goodness of fit, let’s say R square nya 99.9999999%? Anda merasa puas? Jawaban saya it’s too good to be true! Pengalaman saya, jika sebuah model memiliki R-square yang terlalu mendekati 100% maka sebaiknya kita menaruh curiga apakah  model kita overfitting? Apa lagi ini overfitting??

Anda tentu sudah familiar dengan error bukan? Jika model anda menghasilkan error untuk data yang training sangaaat kecil, maka artinya model tersebut bagus…. tapii… pada saat model anda digunakan untuk data lain diluar dari data yang anda gunakan maka kemungkinannya adalah error yang dihasilkan akan sangat tinggi. Dengan kata lain model anda jago kandang. hehe.

Kesimpulannya, jika anda menemukan sebuah model memiliki hasil goodness of fit sempurna… hal ini tanda awal yang baik bahwa yang anda lakukan sudah cukup baik. Namun demikian anda perlu memperhatikan bahwa model ini akan digunakan untuk data lain diluar dari data yang anda latih. Untungnya anda bisa membuat model anda lebih masuk akal dengan jurus yang bernama “regularization”. Stay tune in the datatalker!