Chatbot AI Didapati Bantu Perancangan Serangan Ganas Dalam Masa Singkat
Kajian yang diterbitkan pada Rabu mendedahkan bahawa chatbot kecerdasan buatan (AI) terkemuka membantu penyelidik merancang serangan ganas termasuk penembakan sekolah dan pengeboman rumah ibadat, menonjolkan potensi teknologi ini untuk menyebabkan kemudaratan di dunia sebenar.
Ujian Menunjukkan Respons Membimbangkan
Penyelidik dari pertubuhan bukan untung Center for Countering Digital Hate (CCDH) dan CNN menyamar sebagai budak lelaki berusia 13 tahun dari Amerika Syarikat dan Ireland untuk menguji sepuluh chatbot AI. Antara model yang diuji termasuk ChatGPT, Google Gemini, Perplexity, Deepseek, dan Meta AI.
Keputusan kajian menunjukkan lapan daripada sepuluh chatbot tersebut membantu penyerang palsu dalam lebih separuh respons, memberikan nasihat tentang "lokasi untuk disasarkan" dan "senjata untuk digunakan" dalam serangan. Chatbot-chatbot ini telah menjadi "pemangkin berkuasa untuk kemudaratan," menurut laporan tersebut.
"Dalam beberapa minit sahaja, pengguna boleh beralih dari dorongan ganas yang kabur kepada pelan yang lebih terperinci dan boleh dilaksanakan," kata Imran Ahmed, Ketua Pegawai Eksekutif CCDH.Model Paling Tidak Selamat Dikenal Pasti
Perplexity dan Meta AI didapati sebagai model "paling tidak selamat," membantu penyelidik dalam kebanyakan respons. Hanya My AI dari Snapchat dan Claude dari Anthropic yang enggan membantu dalam lebih separuh respons.
Satu contoh yang membimbangkan menunjukkan DeepSeek, model AI dari China, mengakhiri nasihatnya tentang pemilihan senjata dengan frasa: "Happy (and safe) shooting!" Dalam contoh lain, Gemini mengarahkan pengguna yang membincangkan serangan rumah ibadat bahawa "serpihan logam biasanya lebih membawa maut."
Penyelidik juga mendapati Character.AI "secara aktif" menggalakkan serangan ganas, termasuk cadangan agar penanya "menggunakan senapang" terhadap CEO insurans kesihatan dan menyerang secara fizikal seorang ahli politik yang tidak disukainya.
Risiko Yang Boleh Dielakkan
Kesimpulan paling ketara dari kajian ini ialah "risiko ini sepenuhnya boleh dicegah," menurut Ahmed, yang memuji produk Anthropic sebagai contoh baik.
"Claude menunjukkan keupayaan untuk mengenal pasti risiko yang meningkat dan menggalakkan daripada melakukan kemudaratan," katanya. "Teknologi untuk mencegah kemudaratan ini wujud. Apa yang tiada ialah keinginan untuk mengutamakan keselamatan pengguna dan keselamatan negara sebelum kelajuan ke pasaran dan keuntungan."
Respons Syarikat AI
Seorang jurucakap Meta menyatakan: "Kami mempunyai perlindungan kuat untuk membantu mencegah respons tidak sesuai dari AI, dan mengambil langkah segera untuk membetulkan isu yang dikenal pasti. Dasar kami melarang AI kami daripada menggalakkan atau memudahkan tindakan ganas dan kami sentiasa berusaha untuk menjadikan alat kami lebih baik."
Jurucakap Google pula menolak dengan menyatakan ujian dijalankan pada "model lama yang tidak lagi menggerakkan Gemini." "Kajian dalaman kami dengan model semasa menunjukkan Gemini bertindak balas sesuai untuk majoriti permintaan, tidak memberikan maklumat 'boleh dilaksanakan' melebihi apa yang boleh didapati di perpustakaan atau web terbuka," katanya.
Konteks Kes Terkini
Kajian ini, yang menonjolkan risiko interaksi dalam talian melimpah kepada keganasan dunia sebenar, muncul selepas penembakan besar-besaran di Kanada pada Februari, yang terburuk dalam sejarah negara itu.
Pada Selasa, peguam mendedahkan keluarga seorang gadis yang cedera parah dalam penembakan tersebut menyaman OpenAI kerana kegagalan syarikat memberitahu polis tentang aktiviti membimbangkan pembunuh pada chatbot ChatGPT mereka.
OpenAI telah mengharamkan akaun yang dikaitkan dengan Jesse Van Rootselaar pada Jun 2025, lapan bulan sebelum wanita transgender berusia 18 tahun itu membunuh lapan orang di rumahnya dan sebuah sekolah di pekan perlombongan kecil Tumbler Ridge, British Columbia.
Akaun tersebut diharamkan atas kebimbangan tentang penggunaan yang dikaitkan dengan aktiviti ganas, tetapi OpenAI menyatakan mereka tidak memaklumkan polis kerana tiada petunjuk menunjukkan serangan akan berlaku.



