Setelah melihat 100.000 percakapan chatbot, para peneliti menemukan statistik yang menyedihkan tetapi tidak begitu mengejutkan: bahwa sekitar satu dari 10 orang yang “berbicara” dengan chatbot ini melakukannya untuk tujuan yang kurang pantas.
Chatbot Dominan Digunakan Untuk Motif Cabul
Dalam sebuah makalah yang belum melewati tinjauan sejawat yang ditemukan oleh ZDNet, sebuah tim peneliti menemukan bahwa sepuluh persen dari 100.000 “percakapan dunia nyata” dengan model bahasa besar (LLMs) bersifat erotis, dikutip dari Futurism.
Sementara separuh dari percakapan atau chatbot dalam kelompok sampel tersebut cukup umum dan berfokus pada subjek pekerjaan atau rekreasi seperti tips pemrograman dan bantuan menulis, separuh lainnya mencakup permainan peran percakapan dan beberapa jenis pertukaran yang “tidak aman.”
Para peneliti, yang berbasis di Carnegie Mellon, Stanford, UC Berkeley, San Diego, dan Universitas Kecerdasan Buatan Mohamed bin Zayed di Abu Dhabi, mengkategorikan topik-topik yang “tidak aman” menjadi tiga kelompok.
Dua di antaranya bersifat seksual: “permintaan cerita eksplisit dan erotis” dan “fantasi seksual eksplisit dan skenario permainan peran.”
Kategori ketiga, “membahas perilaku toksik di berbagai identitas,” tampaknya berfokus pada kebencian, masalah besar lainnya yang dihadapi kecerdasan buatan, meskipun para peneliti tidak mendefinisikan perilaku toksik secara rinci dalam makalah tersebut.
Dari ketiga kategori tersebut, kategori chatbot dengan cerita erotis yang bernuansa merangsang paling sering terjadi, dengan 5,71 persen dari percakapan sampel fokus pada jenis percakapan tersebut.
Selanjutnya adalah kelompok fantasi dan permainan peran “eksplisit,” yang mencakup 3,91 persen dari percakapan, diikuti oleh 2,66 persen interaksi sampel dengan pengguna yang jelas-jelas membenci.
Meskipun temuan ini tidak benar-benar mengejutkan bagi siapa pun yang telah lama berada di internet, metodologi di balik temuan tersebut sungguh menarik.
Anggota tim dari Berkely dan Stanford berhasil mendapatkan sampel sebesar ini sebagian karena mereka bersama-sama menjalankan apa yang mereka sebut “Chatbot Arena.”
Platform ini merupakan sebuah layanan berbasis permainan yang memungkinkan pengguna memasukkan permintaan dan melihat tanggapan dari berbagai LLMs secara berdampingan.
Pengguna kemudian didorong untuk memberikan suara pada tanggapan mana yang lebih baik, meskipun juga bisa memberikan suara bahwa “keduanya buruk” atau bahwa mereka seimbang.
Selain Chatbot Arena, para peneliti di balik makalah ini juga menggunakan kumpulan data yang mereka peroleh dari Vicuña, pesaing ChatGPT sumber terbuka yang diciptakan sebagian oleh Lianmin Zheng dari Berkeley, salah satu penulis makalah ini.
Dalam kumpulan data sejuta percakapan dari mana tim mengumpulkan 100.000 pertukaran sampel mereka secara acak, terdapat lebih dari 210.000 alamat IP unik dari berbagai belahan dunia.
Meskipun chatbot kecerdasan buatan telah mengambil alih media sejak OpenAI merilis versi publik ChatGPT pada akhir tahun 2022, belum banyak penelitian tentang interaksi dunia nyata yang sebenarnya dilakukan oleh orang-orang dengan chatbot sampai saat ini, selain dari cara teknologi ini mengganggu dunia akademis, bisnis, dan penerbitan.
Para peneliti di balik temuan ini menulis bahwa mereka berharap studi mereka akan membantu membuat chatbot lebih aman di dunia nyata bagi semua pengguna, kecuali mungkin mereka yang memiliki tujuan yang kurang pantas. [az]