Mengorek jumlah makalah berbahasa Indonesia dalam basis data DOAJ dan hubungannya dengan parameter lainnya dari data Bank Dunia

Berawal dari “Negara penghasil ilmu pengetahuan”

Saya sangat tertarik dengan blog post Prof. Hendra Gunawan tentang “Negara penghasil ilmu pengetahuan”. Di dalamnya mentor saya ini menyampaikan data yang diambil dari basis data ScimagoJR.

Dari blog post tersebut yang beliau tweet juga, berkembang diskusi via medsos Twitter. Salah satunya adalah sebagai berikut.

Kemudian muncul dua negara pembanding yang kami sebut-sebut, yakni Kamboja dan Sudan.

Basis data yang digunakan oleh Pak Hendra adalah ScimagoJR, yang mana, pastinya lembaga ini hanya memasukkan artikel dalam Bahasa Inggris. Seperti yang telah kita ketahui nature dari penulis kita adalah sering protes kalau dipaksa oleh aturan untuk terus-terusan diminta menulis dalam Bahasa Inggris agar makalahnya terindeks Scopus. Tapi kalau dilacak apakah mereka ini telah menulis makalah dalam Bahasa Indonesia, faktanya tidak banyak juga jumlah tulisannya.

Tapi terlepas dari itu, saya penasaran, seberapa banyak sebenarnya makalah berbahasa Indonesia. Kalau memungkinkan, maka uraian di sini akan coba saja masukkan ke dalam draft makalah yang sedang kami susun dengan platform Authorea “Status jurnal berbahasa Indonesia di DOAJ”.

Metode

Saya menggunakan dua basis data, yakni DOAJ dan Bank Dunia (World Bank).

Mengapa DOAJ? Saya menggunakan beberapa asumsi:

  1. Bahwa jurnal yang terbit di Indonesia mayoritas (bahkan mungkin seluruhnya) bersifat Open Access, karena itu DOAJ adalah indeks yang tepat untuk digunakan.
  2. Bahwa melalui komunikasi saya dengan para pengelola jurnal Indonesia yang tergabung dalam Relawan Jurnal Indonesia, mereka telah sangat sadar untuk menggunakan kode DOI dan mendaftarkan jurnalnya ke DOAJ.
  3. Bahwa DOAJ adalah indeks yang inklusif, tidak membedakan bahasa. Lain dengan lembaga pengindeks lainnya yang eksklusif hanya mendata makalah atau jurnal dalam Bahasa Inggris.

Basis data DOAJ memiliki sistem filter yang cukup baik. Saya menggunakan filter:

  • Journals vs articles: “articles”
  • Subject: “show all”
  • Journal title: “show all”
  • DOAJ seal: “show all”
  • Journal license: “show all”
  • Publisher: “show all”
  • Full text language: “Indonesia”
  • Year of publication: “show all”

Mengapa data Bank Dunia (BD)? Sebagai informasi awal, BD memiliki data tematik Science and Technology. Di dalamnya adalah sub tema Scientific and Technical Journal Article. Saya menggunakan data tersebut dengan beberapa asumsi:

  1. Bahwa Bank Dunia adalah lembaga internasional yang mengumpulkan berbagai data dari (seluruh) negara di bola bumi ini. Oleh karenanya data yang mereka kumpulkan dan analisis yang dihasilkan akan inklusif.
  2. Bahwa Bank Dunia memiliki kerjasama yang erat dengan masing-masing negara, karena itu datanya dapat dianggap valid. Tapi saya belum berhasil mengorek lebih dalam, dari basis data mana mereka mendapatkan jumlah makalah.
  3. Bahwa Bank Dunia adalah salah satu dari banyak lembaga internasional yang telah membuka lebar-lebar akses data. Oleh karenanya setiap orang, bukan hanya saya, dapat mengunduh data sekaligus menganalisis dari situs mereka.

Untuk data BD, mereka telah memiliki aplikasi analisis dan agregator yang baik. Setiap opsi yang kita pilih akan langsung dapat diplot dalam grafik secara langsung. Data mentah dan grafik hasilnya dapat diunduh.

Hasil sementara

Data DOAJ

Dari DOAJ saya mendapatkan hasil sebagai berikut. Sebanyak total 46.626 makalah didapatkan sejak tahun 1984 (5 makalah) sampai 2017 (668 makalah). Grafiknya sebagai berikut (Gambar 1). 

Screen Shot 2017-03-27 at 2.07.00 PM
Gambar 1 Jumlah jurnal berbahasa Indonesia berdasarkan tahun (1984-2017) di DOAJ (Data diakses tanggal 26-27 Maret 2017)

Saat saya coba overlay dengan data makalah dalam Bahasa Khmer (bahasa Kamboja) dan Sudanese Arabic (bahasa Sudan) tidak muncul dalam basis data DOAJ. Saya tidak paham, apakah ini berarti jurnal di Kamboja dan Sudan mayoritas non-OA ataukah memang yang terdaftar di DOAJ adalah jurnal dari kedua negara tersebut yang terbit dalam Bahasa Inggris. Kalau ada yang bisa membantu menganalisis akan sangat bagus. Karena kendala tersebut, maka saya mencoba membandingkan jumlah jurnalnya, bukan artikelnya. 

Berikut adalah perbandingan jumlah jurnal terbitan Indonesia dan terbitan negara lain (Jepang, Malaysia, Sudan, Kamboja), menurut DOAJ (Gambar 2). Negara peringkat satu dari sisi jumlah adalah Brazil, disusul secara berurutan oleh UK, Mesir, US, dan Indonesia (peringkat no 5). Kemudian Malaysis no 36 dan Jepang no 50. Sudan belum terlihat dalam top 100.

Screen Shot 2017-03-27 at 2.25.29 PM.png
Gambar 2 Peringkat negara berdasarkan jumlah terbitan jurnalnya menurut DOAJ (Data diakses tanggal 26-27 Maret 2017)

Data Bank Dunia

Saya mendapatkan data dalam bentuk grafik sebagai berikut. Data jumlah dokumen ilmiah (sementara ini saya melihat terdiri dari makalah dan paten). Terlihat garis milik Jepang paling atas, kemudian Malaysia, Mesir, Indonesia, Sudan, dan Kamboja (Gambar 4). 

sum of pubs
Gambar 4 Jumlah publikasi menurut Bank Dunia untuk beberapa negara terpilih (data diakses tanggal 26-27 Maret 2017)

Data persentase anggaran riset dari GDP. Garis paling atas adalah milik Sudan. Garis yang di bawah milik Indonesia. Kamboja masih belum terlihat (Gambar 6). Gambar tersebut akan berubah drastis bila data dari Jepang,  Malaysia, dan Mesir dimasukkan. Brazil dengan jumlah publikasi terbanyak berada sedikit di atas Malaysia.

persen RnD
Gambar 5 Persentase anggaran riset dan pengembangan terhadap total Gross Domestic Product (GDP) menurut Bank Dunia untuk beberapa negara terpilih (data diakses tanggal 26-27 Maret 2017)

Masih penasaran dengan berbagai data yang ada, saya mencoba menghubungkan jumlah makalah, persentase anggara R/D, serta rasio jumlah peneliti dibanding jumlah penduduk berdasarkan data BD. Hasilnya bila diplot akan tampak seperti ini (data mentah, data terformat, dan R code dapat diunduh dari OSF DOI 10.17605/OSF.IO/HXH78).

Gambar 6 Grafik antara jumlah publikasi dengan persentase belanja riset dan pengembangan (atas = overlay; bawah = facet)

Gambar 7 Bila plot Gambar 6 diperbesar untuk negara Jepang (atas) dan Indonesia (bawah) terlihat tidak ada korelasi antara jumlah artikel dengan persentase anggaran R/D.

Masih dengan sumber data yang sama, sekarang kita lihat hubungan antara jumlah artikel dengan rasio jumlah peneliti/jumlah penduduk.

Gambar 8 Grafik antara jumlah artikel dengan rasio jumlah peneliti/1000population (atas = overlay; bawah = facet)

Gambar 9 Perbesaran plot antara jumlah artikel dan jumlah peneliti/1000population untuk Jepang (atas) dan Indonesia (bawah)

Kesimpulan

Saya belum akan menyimpulkan apa-apa, apalagi membandingkannya dengan hasil dari ScimagoJR. Grafik saya ini bertujuan lebih kepada untuk memberikan variasi sumber data lain yang mungkin belum banyak diketahui dan dieksplorasi oleh umum. Tapi yang jelas faktor kualitas belum dibicarakan di sini, faktor kuantitas yang disoroti lebih dulu. Saya masih percaya bila kepercayaan diri ditingkatkan, maka jumlah makalah akan bertambah, dan pada saatnya (mudah-mudahan tidak terlalu lama), kualitas akan dapat disejajarkan dengan makalah dari negara lain.

Kalaupun terlihat ada korelasi antara jumlah publikasi dengan besar kecilnya dana (yang dicerminkan oleh persentase dana R&D dari total GDP), tetapi hubungan kausal antara keduanya masih perlu diuji.

Saya akan sangat senang, kalau ada yang berminat menganalisis lebih jauh, misalnya menghubungkannya dengan anggaran riset/pendidikan, GDP, jumlah penduduk, gender, dll. Yang seperti ini juga riset tapi dengan biaya yang rendah.

Selamat hari Minggu sore.

How to cite this blog post:

Irawan, D.E., 2017, Mengorek jumlah makalah berbahasa Indonesia dalam basis data DOAJ dan Bank Dunia, url: https://derwinirawan.wordpress.com/2017/03/26/mengorek-jumlah-makalah-berbahasa-indonesia-dalam-basis-data-doaj-dan-bank-dunia/, diakses (tanggal) (bulan) (tahun)

Advertisements

Published by

Erwin

Research interest: Hydrochemistry, multivariate analysis, and R programming My current focus is how to provide the hydrostratigraphy of volcanic aquifers in Bandung area. The research is based on environmental isotope measurement in groundwater and morphometry. My work consists of hydrochemical measurements. I am using multivariate statistical methods to provides more quantitative foundation for the analysis and more insight into the groundwater behaviour.

Leave a Reply

Please log in using one of these methods to post your comment:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s