Data Modeling

Berikut adalah tahapan-tahapan dalam pemodelan data. Tahapan-tahapan ini adalah diperoleh dari hasil training tentang Credit Scoring di tempat Praktik Lapang tercinta PT.Ganesha Cipta Informatika. Sang trainer adalah seorang yang sudah berpengalaman dalam masalah pemodelan selama belasan tahun. Beliau kakak kelasqu, Statistika IPB angkatan 27. Sedikit curhat, dari praktek lapang banyak banget ilmu, pengalaman, wawasan dan inspirasi bermanfaat yang qu dapet. Oleh karena itu, aq pengen menuliskan semampuku biar manfaatnya bisa dirasakan sama semua orang yang baca.

Artikel ini lumayan panjang, tapi keep going on ya…
These are the steps :

1. Variable Creation

Selama ini gw cuma tau memodelkan data dengan variabel yang tersedia. Ga pernah berpikir untuk membuat variabel turunan dari variabel yang sudah ada. Nah, ternyata pada dunia pemodelan yang high class, variabel turunan wajib dibuat.

Dari 30 variabel inti bisa didapat 150 atau lebih variabel turunan. Variabel turunan itu bisa apa saja, misalnya average, min, max, dsb. Pembentukan variabel turunan ini menjadi begitu penting karena pada model akhir yang didapat biasanya hanya terdiri dari beberapa variabel inti dan sisanya adalah variabel turunan. Satu hal yang pasti yaitu belum tentu variabel inti adalah variabel terbaik, bisa saja turunannya yang terbaik.

2. Variable Checking

Setelah dibuat variabel turunan dari variabel inti, selanjutnya adalah mengecek keberadaan missing value dan outlier (pencilan). Sehingga, dua tahap terpenting yang harus dilakukan dalam variable checking adalah :

* Missing Value Handling *

Missing value tidak bisa dibiarkan begitu saja, terutama jika analisisnya menggunakan Regresi Logistik, karena analisis tersebut akan membuang semua data yang mengandung missing value. Jadi sayang kan kalau udah capek-capek nyari datanya, malah ga dipake tuk model. Jika data dianalisis dengan classification tree, keberadaan missing value tidak jadi masalah. Classification tree akan menganggap missing value sebagai suatu kategori tersendiri, jadi tidak akan membuangnya.

Ok, dalam pemodelan yang sering dilakukan oleh sang trainer, terdapat 4 cara yang sering dilakukan untuk mengatasi missing value, yaitu :

1. memberikan score dengan nilai terendah
2. memberikan score 0
3. mengisi dengan mean/median/modus
— mean digunakan pada data yang berskala kontinu, misal jumlah pendapatan pada usia tertentu
— median/modus digunakan pada data yang berskala kategorik, misal jenis kelamin
4. memprediksi nilainya dengan regresi linier sederhana

penggunaan metode-metode diatas harus disesuaikan dengan bentuk data dan perlu diperhatikan bahwa pemberian suatu nilai tertentu dipilih tidak hanya berdasarkan data keseluruhan tetapi juga berdasarkan kategori peubah-peubah lain yang bersandingan. Ya, seperti kasus yang jumlah pendapatan tadi, ngisinya jangan langsung rata-rata dari seluruh nilai jumlah pendapatan tapi liat dulu variabel lain kya umur, pekerjaan, jumlah tanggungan.

** Outlier Handling **

Menurut sang trainer, outlier itu cuma punya satu penanganan yaitu “Di Buang”. Walaupun begitu satu hal yang perlu diperhatikan adalah cara mendeteksi outlier. Ada 2 cara yang sering di pake :

* liat dari box plot

** bikin batesan Xbar +/- 3Sigma, outlier tu yang diluar bates.

Lanjut membaca

pencuri beng-beng…

melicul ku harap kau membacanya…

aq hanya berniat iseng..

tidakkah kau mau mengambil beng-beng itu dariqu

a..k..u..i..k..h..l..a..s..

ntar kapan2 klo ketemu qu balikin

(k..l..o..m..a..s..i..h..a..d..a)

2 hari lagi SU

2 hari lagi BEM FMIPA2007/2008 akan menghadapi Sidang Umum

ya sidang untuk semua LPJ yang telah masuk ke DPM

rasa khawatir merasuki setiap diri anggota BEM-G yang aktif

terutama bagi mereka yang memang mempunyai tanggung jawab terbesar akan hal itu….

hari ini Sidang Umum GSB berlangsung dengan baik

mudah2an Sidang Umum BEM G juga berlangsuing dengan baik

semua LPJ diterima tanpa terkecuali

deg…deg…deg…

yang paling takut LPJ ga diterima tu mungkin gw

Infokom adalah departemen yang paling fluktuatif di BEM G tahun ini

gw sebagai pemegang tanggung jawab terbesar di Infokom bener2 dalam kecemasan yang nyata

gw dah berusaha semaksimal mungkin tuk ngebangkitin lagi departemen ini

dengan minimnya pengalaman organisasi yang gw punya

hanya sebatas apa yang tertulis di LPJ lah yang mampu gw berikan

andai mereka yang memeriksa itu tahu bagaimana perjuangan dibalik setiap kegiatan….

mereka pasti tidak akan tega mengeluarkan pernyataan penolakan

………..

banyak pelajaran dan pengalaman yang gw dapet dari sini

pelajaran tuk dapat menjadi….

seorang pemimpin yang mampu mendengarkan setiap aspirasi dari teman2 yang mendukungnya

seorang yang mampu menghandle setiap kegiatan saat yang lain tidak mampu

seorang yang mampu untuk mengandalkan dirinya dan teman2nya dalam menyelesailkan kewajiban bersama

seorang yang tidak boleh terbawa dalam keluhannya menghadapi segala persoalan

seorang yang tidak ingin mengecewakan ketuanya, organisasinya, jurusannya, dan fakultasnya

sorang yang selalu berusaha optimal sesuai kemampuannya

”””””””””””””””””””””””””’SIDANG UMUM”"”"”"”"”"”"”"”"”"”"”"”"”"”

tinggal 2 hari lagi masa jabatan sebagai pemimpin, gw ga boleh melewatkan setiap detik ini untuk kegiatan yang sia-sia

gw harus memanfaatkan waktu ini untuk mengeratkan teman2

gw ga boleh meninggalkan penyesalan yang lebih besar lagi terhadap organisasi ini dan lainnya…

BANGKIT….

SEMANGAT…

after 23 Desember 2008……………..

setelah ini gw berharap waktu yang gw punya akan menjadi waktu2 terbaik dalam hidup gw dan orang lain

menjadi waktu2 yang berisi kegiatan bermanfaat bukan hanya tuk pribadi dan lingkungan tapi tuk semuanya

tuk agama, bangsa, negara, dan dunia..

Amin…

Hosting WEB BEM FMIPA

oh…. sungguh salah perhitungan

kata seorang teman yang sangat terpercaya

hosting bisa hanya 10 menit saja

tapi apa yang terjadi…..?????

qu sudah tiga jam di nature dan ga selesai2 mpe sekarang

file yang diupload baru setengah

mo mpe kapan qu disini…..

kemaren ngerjain LPJ n mading terakhir mpe jam 24.00

‘n baru nyampe kostan jam 01.00, muter2 dulu nganter yang laen

hari ini sepertinya tidak akan berbeda jauh dengan kemaren

bagaimana dengan hari esok????

ah….pokoknya selalu semangat

semua nak MIPA kudu ngakses bemfmipa-ipb.org oke……..

ini adalah perjuangan semalaman di nature….

Alhamdulillah..

terkait posting yang duluuuuuu banggetz, dikejar deadline..
akhirnya baru selesai bersihnya sekarang
fyuhh….
untuk sebuah akhir yang baik walaupun itu telat dan rada ga sesuai harapan awal
ya Alhamdulillah…

Alhamdulillah juga,
…if there’s a will, there’s a way…
ndah keterima beasiswa yang memang sangat ndah harepin ‘n butuhin

semua karna keyakinan kali ya
selalu berjuang, ga pernah putus asa
keluhan pada teman2 sebenernya jadi pelengkap usaha
dalam keluhan itu, ada banyak kata2 semangat dan masukan
makasih tuk smua temen2 yang dah jadi pendengar yang sangat Baik
dan konsultan yang Hebat..

yang penting :
yakin bahwa Allah SWT akan selalu memberikan jalan keluar dari masalah2 hambaNya,
jika hambaNya mau berusaha  dan berdoa, tidak pernah ada kata menyerah atau putus asa!!!
selalu bersyukur pada apa yang dia punya….

Alhamdulillah…

existance…

i obviously realize that this person has a big influence to me,
that person makes me depend on his existance…
but,
i dont wanna face it just like a routine…
‘coz routine could change
‘n when it change…
i would be on big distortion

pliz never place me on that horrible situation….

ralat niey

ralat cerita gw yang sebelumnya niey…
ARIMA yang dimaksud bukan seasonal ARIMA lag 12 tapi ARIMA X12
ARIMA X12 itu mang salah satu pemodelan time series yang ada trading factors
maksud trading factor di kasus ini adalah si HARI RAYA
Jadi..
maklum aja klo gw heran seasonal ARIMA ada faktor lain yang berpengaruh kya hari raya
ternyata mang bukan seasonal tapi ARIMA X12

Kausalitas Grangger itu tuk ngeliat hubungan sebab-akibat.
hub. sebab-akibatnya dilihat dari pola waktu juga krn ada lag-nya
tuk lebih jelas silahkan cari bahan sendiri ye