Aug 06

Audit Data Blacklist Aduan dari TrustPositif

Akhir-akhir ini sedang hangat kembali pemberitaan mengenai keberadaan lembaga TrustPositif sebagai salah satu alat pemblokiran situs-situs yang mengandung unsur SARA, judi, phishing, dan pornografi. Banyak pro kontra mengenai keberadaan lembaga ini, terutama setelah pemblokiran situs Vimeo karena mengandung unsur pornografi. Oleh karena itu, saya penasaran mengenai seberapa benar-kah blacklist yang dikeluarkan oleh TrustPositif. Apakah benar situs yang diblok itu memang mengandung unsur SARA, judi, phishing, atau pornografi. Untuk memenuhi rasa penasaran itu, saya mencoba untuk memeriksa blacklist yang diberikan oleh TrustPositif.

Melalui laman resmi TrustPositif, disebutkan bahwa sesungguhnya mereka memiliki dua metode pemblokiran, yaitu berdasarkan Domain dan URL. Walaupun berdasarkan laman resmi mereka juga, blacklist yang ada hanya untuk Domain. Nanti akan dijelaskan di akhir mengapa blacklist URL tampaknya sulit untuk dilakukan. Untuk blacklist domain sendiri, TrustPositif memiliki 3 jenis, yaitu blacklist yang asalnya dari aduan masyarakat, blacklist situs porno dari internal, dan blacklist untuk situs yang digunakan sebagai proxy. Yang dicek pada saat ini hanyalah blacklist yang berasal dari aduan masyarakat, karena dibandingkan dengan blacklist internal, jumlahnya masih lebih sedikit (12.645 vs 745.029 domain). Sehingga waktu yang dibutuhkan untuk memeriksa tiap domain yang di-blacklist lebih cepat. Dan semoga mampu menjadi random sample untuk blacklist internal :)

Bagaimana Caranya?

Dari blacklist aduan (diambil pada 4 Agustus 2014 malam) ada 12611 domain, ada 32 domain yang tercatat ganda, dan ada 2 baris yang salah. Setiap nama domain yang ada itu dicoba akses menggunakan sebuah program sederhana. Untuk menjaga kebenaran hasil audit, maka pengaksesan dicoba dua kali dengan menggunakan koneksi internet biasa dan menggunakan TOR (The Onion Routing). Kemudian respon yang diterima akan dicatat HTTP Response Codenya, halaman HTML yang diterima, dan diperiksa apakah halaman HTML yang diterima mengandung kata-kata kotor (badwords) yang ditentukan atau jika terjadi error, akan dicatat juga apa errornya. Apabila respon yang diterima mengharuskan klien untuk mengakses halaman lain (redirect), maka redirect akan dilakukan juga sampai maksimal 5 kali. Kode sumber dari program yang digunakan dapat diunduh di sini. Sedangkan jika menginginkan list hasil pemeriksaan, bisa menghubungi saya secara privat.

Hasil

Contoh hasil pencatatan tadi yang tersimpan di dalam database dapat dilihat pada gambar di bawah ini. Jumlah badwords yang muncul dalam setiap halaman web juga dicatat. Dibutuhkan waktu +/- 3.5 jam untuk memeriksa 12611 entry yang ada.

Hasil Pencatatan

Hasil Pencatatan

Secara garis besar, ada 6 jenis hasil yang didapatkan, yaitu Badwords ditemukan (Match), Badwords tidak ditemukan (No Match), Halaman tidak ditemukan (biasanya terjadi pada website yang menggunakan blogspot, dan sudah hilang), Tidak bisa diakses (Domain tidak ada/Server sudah mati), Infinite Redirect, dan Error-error lainnya.

Yang perlu diperhatikan adalah pada bagian No Match. No Match belum tentu berarti situs ini bebas dari 4 unsur yang dilarang tadi, ada beberapa kemungkinan mengapa sebuah domain ketika dicek tidak ditemukan. Berikut ini adalah beberapa kemungkinan yang terlihat dari beberapa pemeriksaan manual menggunakan web browser Lynx dan text editor :

  • Website menggunakan bahasa selain bahasa Inggris dan bahasa Indonesia serta tidak menggunakan huruf latin. Karena yang diperiksa hanya teks latin yang tertera dalam html
  • Parked Domain
  • Halaman banyak berisi javascript yang biasanya hanya berisi iklan-iklan PayPerClick/PayPerView
  • Isi halaman sudah berubah (Berisi halaman default web server “It Works”, “Default IIS” )
  • Tidak mengandung badwords yang ditentukan, list badwords yang digunakan hanya yang mengandung unsur pornografi, sedangkan unsur judi, SARA, dan phishing belum ditambahkan, karena kesulitan mencari daftar kata-kata yang umum dipakai pada situs yang mengandung 3 unsur tersebut.
  • Yang diakses hanya halaman utama dari suatu website. Jadi jika situs konten seperti Vimeo, apabila ada halaman-halaman di dalamnya yang mengandung badwords, maka tidak akan ditemukan juga.
Rekap Hasil Pemeriksaan Domain

Rekap Hasil Pemeriksaan Domain

Hasil rekapitulasi jumlah masing-masing kategori hasil tadi dapat dilihat pada diagram pie di atas. Bisa dilihat bahwa 56,427% dari total domain yang dicek adalah domain yang memang mengandung unsur pornografi. Sebanyak 17.826% dari daftar adalah website yang sudah tidak aktif lagi. Dan 25.747% tidak ditemui kata-kata yang berbau pornografi, termasuk di dalamnya adalah Vimeo dan beberapa situs judi bola dan gerakan separatis. Selain itu, di bawah ini juga ditampilkan daftar HTTP Response Code yang diterima.

Rekap HTTP Response Code

Rekap HTTP Response Code

Terus Bagaimana?

Dari hasil yang didapatkan di atas, situs-situs yang diadukan oleh masyarakat sebetulnya memang cukup banyak yang memang mengandung salah satu unsur yang dilarang. Walaupun juga cukup banyak juga domain yang sudah tidak aktif lagi. Selain itu seharusnya badwords yang digunakan juga bisa ditambah lagi dan digunakan untuk mengkategorikan sebuah situs termasuk kategori terlarang yang mana.

Salah satu (mungkin satu-satunya) yang paling membuat kontra mengenai keberadaan blacklisting ini adalah blokir Vimeo. Seperti kita ketahui, sebetulnya Vimeo, sama seperti Youtube, Kaskus, dan situs konten bebas lainnya, adalah situs yang berisi berbagai macam konten, tidak hanya berisi satu jenis topik. Sehingga jika kita tidak suka dengan sebuah konten tertentu di dalamnya, atau salah satu kontennya mengandung hal yang tidak diinginkan, maka kita tidak bisa memblokir keseluruhan domain. Sama seperti membakar rumah untuk menghilangkan tikus di dalamnya.

Seperti telah dijelaskan di atas, sebenarnya ada 2 jenis blacklist yang digunakan oleh TrustPositif, yaitu berdasarkan Domain atau URL. Sayangnya blacklist jenis URL belum ada. Pertanyaannya adalah mengapa belum ada? Padahal dengan adanya blacklist URL, masalah konten tertentu di Vimeo bisa teratasi tanpa harus memberangus juga konten bermanfaat lainnya.

Permasalahan utama di sini adalah blokir URL itu hampir tidak mungkin dilakukan oleh penyedia jasa Internet (ISP). Perangkat penting di dalam ISP yang berguna untuk meneruskan paket data anda ke tempat lain (router) hanya bisa melihat alamat IP dan port pengirim dan penerima serta POTONGAN data. Butuh energi yang luar biasa besar bagi router untuk dapat meneruskan data sekaligus memeriksa isi keseluruhan data yang terpotong-potong. Padahal informasi mengenai URL yang diakses oleh user itu tersebar di potongan-potongan tadi. Bisa saja dibuat yang sanggup memeriksa, tapi itu akan mengorbankan kecepatannya untuk meneruskan data.

Yang bisa melakukan blokir URL umumnya adalah pengguna sendiri (end user). Atau kalau di institusi atau perusahaan biasanya menggunakan yang namanya webcache/web proxy (contohnya Squid atau perangkat keras khusus). Sehingga di sini butuh peran serta aktif juga dari masyarakat. Jika anda merasa konten tertentu pada suatu website semacam Vimeo, Youtube, atau Kaskus mengandung unsur-unsur yang dilarang, tidak perlu menunggu Depkominfo/TrustPositif memblokir keseluruhan website. Anda bisa melaporkan konten-konten tersebut ke pemilik situs. Di Kaskus kita bisa melaporkan ke moderator, di Youtube/Vimeo/web sejenis ada fitur flagging/mark as appropriate/mark as spam.

Terus pemerintah berbuat apa?

Yang bisa dilakukan pemerintah sebetulnya adalah negosiasi dengan pemilik situs terkait. Misalkan pemerintah tidak setuju ada konten tertentu di sebuah situs, jika sebelumnya memiliki perjanjian, seharusnya kan bisa saja meminta pemilik situs untuk memblokir akses ke konten tersebut jika pengaksesnya terdeteksi dari Indonesia. Hal ini pernah terjadi untuk beberapa video musik yang ada di Youtube. Beberapa video di sana tidak bisa diakses jika kita berada di Indonesia dan memang ada pesan kesalahan yang sesuai. Prinsipnya sama seperti itu bukan.

Akhir kata

Pengendalian situs sebenarnya bisa bermanfaat, namun perlu diingat juga bahwa satu diblokir, tumbuh yang lain. Saat tulisan ini ditulis, hasil pencarian di Google dengan salah satu badwords yang digunakan saja mencapai 401 Milyar hasil. Jadi pemblokiran bukan satu-satunya solusi dan tidak sepatutnya juga mencurahkan 100% energi kita ke sana. Saya teringat perkataan dari pak Onno W. Purbo, “Marilah kita isi internet Indonesia ini dengan hal-hal positif, sehingga orang akan lebih banyak melihat hal-hal yang positif daripada menghabiskan waktunya melihat sesuatu yang negatif.”.

Be Sociable, Share!

0
comments

Reply

[+] kaskus emoticons nartzco