Data story teller

Menceritakan data seperti dongeng sebelum tidur

Beberapa hari ini saya sering kali mendengar kata data story teller. Profesi baru katanya dengan pekerjaan utama membuat data analisis terdengar seperti dongeng sebelum tidur. Ya data selama ini hanya berakhir dengan grafik statis. Bahkan kalupun sudah jadi grafik dinamis pun, kita sering belum dapat membuat kisah menarik darinya.

Bidang saya hidrogeologi dan geologi. Orang-orang yang bekerja di bidang ini berpotensi menjadi pendongeng saintifik kelas wahid. Kemampuan itu tinggal diasah saja.

Bila ingin tahu lebih banyak, ada empat video Ted Talk yang ingin saya bagikan, yaitu:

Ben Wellington: Data story teller

Ben Wellington seorang data analyst yang berdomisili di New York. Ia dosen Pratt Institute  yang menikahi seorang urban planner. Berdua mereka membuat blog IQuantNY yang isinya menceritakan berbagai data unik di lingkungan mereka. Ben Wellington juga aktif di Twitter dengan akun IQuantNY.

David McCandless: The beauty of data visualization

David McCandless seorang penulis, desainer, dan direktur kreatif yang tinggal di London. pekerjaan unik, salah satunya adalah membuat visualisasi data secara profesional. Semboyannya adalah “Information is beautiful“.

Jer Thorp: Visualizing the world’s Twitter data

Twitter adalah media sosial yang paling produktif di dunia dengan rata-rata 6000 tweet per detik (internetlivestats.com). Dengan data semasif itu, Twitter jadi sumber informasi. Adalah seorang Jet Thorp seorang adjunct professor dari New York University dan kawan-kawannya yang pernah memetakan perjalanan dari jejak tweet yang dikirimkan pengguna Twitter. Uniknya data ini bermanfaat untuk menelaah pola penyebaran penyakit menular di dunia.

Data demografi

Di sisi lain, saya juga beberapa kali diminta membantu kawan-kawan di pemerintahan untuk membuat visualisasi, klaster, dan klasifikasi data untuk membuat suatu keputusan. Bukan keputusan yang berat macam kenaikan BBM atau Pajak Kendaraan Bermotor, tapi beberapa kali saya diminta membagi karakter tersembunyi dari kab/kota, terutama di Jawa Barat berdasarkan berbagai indikator pembangunan yang telah diukur. Saya biasanya menggunakan Principal Component Analysis dan Cluster Analysis. Saya belajar banyak tentang Jawa Barat dari kawan-kawan saya berbaju coklat ini.

Kemudian di satu hari minggu lalu, saya disodori tiga grafik sebagai berikut yang berasal dari laporan Bappenas tentang Jawa Barat (Simreg.Bappenas.go.id). Tiga grafik ini menggambarkan pertumbuhan ekonomi, penurunan jumlah pengangguran dan penurunan penduduk miskin. Sepertinya bagus kalau saya bisa mencari data time series-nya dan memvisualkan menjadi sebuah cerita.

Kemudian saya coba mencari informasi mengenai bagaimana cara mempresentasikan data demografi, maka saya menemukan video presentasi Hans Rosling ini. Rupanya ada juga orang yang membuat tutorial untuk mereplikasi grafik tersebut, dengan R (Magesblog.com).

Hans Rosling: The best stats you’ve ever seen

Orang ini telah dengan cantik menjelaskan pergerakan data demografi (berdasarkan data Bank Dunia) di 200 negara di dunia sejak tahun 1960 hingga 2000 an.

Maka kemudian jadilah video di bawah ini (Google Drive) atau Youtube.

Target visualisasi

Target visualisasi saya (atau kami, tergantung nanti) adalah memetakan distribusi indikator pembangunan Jawa Barat secara time series. Indikator yang akan digunakan mencakup indikator utama IPM dan indikator pendukungnya (proxy indicators). Bila memungkinkan pemetaan secara spasial juga akan dilakukan. Untuk memudahkan saya membayangkan bentuk jadinya, maka saya mencoba membuat dataset imajiner/main-main (toy dataset) indikator pembangunan dari tahun 2002 hingga 2016. Visualisasinya akan seperti ini.

And you know what… I found a way for those of you to avoid R programming…

Tunggu update proyek ini berikutnya. Harus bagi waktu dengan banyak hal. Selamat akhir pekan. @dasaptaerwin.

Walaupun tangan hanya dua dan kaki pun begitu. Tapi biarlah angan berkarya  membuat sesuatu.

Published by

Erwin

Research interest: Hydrochemistry, multivariate analysis, and R programming My current focus is how to provide the hydrostratigraphy of volcanic aquifers in Bandung area. The research is based on environmental isotope measurement in groundwater and morphometry. My work consists of hydrochemical measurements. I am using multivariate statistical methods to provides more quantitative foundation for the analysis and more insight into the groundwater behaviour.

Leave a Reply

Please log in using one of these methods to post your comment:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s