DeepSeek lancar AI murah konteks panjang, ubah industri

Beijing, 24 April – Startup China DeepSeek melancarkan model kecerdasan buatan (AI) baharu dengan kos yang dikurangkan secara drastik hari ini, lebih setahun selepas ia mengejutkan dunia dengan model penaakulan kos rendah yang setanding dengan keupayaan pesaing Amerika Syarikat.

Persaingan AI China-AS semakin sengit

Perlumbaan AI telah meningkatkan persaingan antara China dan Amerika Syarikat, dengan Rumah Putih semalam menuduh entiti China melakukan usaha besar-besaran untuk mencuri teknologi AI. DeepSeek yang berpangkalan di Hangzhou muncul secara tiba-tiba pada Januari tahun lalu dengan chatbot AI generatif, dikuasakan oleh model penaakulan R1, yang mengubah andaian penguasaan AS dalam sektor strategik ini.

Kelebihan DeepSeek-V4

Versi baharu, DeepSeek-V4, menampilkan konteks ultra-panjang satu juta perkataan, kata syarikat itu dalam satu kenyataan di platform media sosial WeChat, sambil memuji ia sebagai peneraju dunia dengan kos pengiraan dan memori yang dikurangkan secara drastik dalam pengumuman berasingan di X. Panjang konteks model, yang menentukan berapa banyak input yang dapat diserap oleh model untuk membantu menyelesaikan tugas, mencapai kepimpinan dalam kedua-dua domain domestik dan sumber terbuka merentas keupayaan ejen, pengetahuan dunia, dan prestasi penaakulan, menurut kenyataan WeChat.

—

Banner lebar Pickt — aplikasi senarai beli-belah kolaboratif untuk Telegram

Versi pratonton model sumber terbuka kini tersedia, kata syarikat itu. Pakar mengatakan pelancaran V4 menandakan titik perubahan dari segi perkakasan dan kos. Zhang Yi, pengasas firma penyelidikan teknologi iiMedia, memberitahu AFP bahawa ini menangani isu prestasi perlahan dan kos tinggi yang berkaitan dengan panjang konteks yang panjang, menandakan titik perubahan sebenar untuk industri. Bagi pengguna akhir, ini akan membawa manfaat yang meluas dan boleh diakses. Contohnya, jika sokongan konteks ultra-panjang menjadi ciri standard, pemprosesan teks panjang dijangka bergerak melangkaui makmal penyelidikan mewah dan memasuki aplikasi komersial arus perdana.

Dua versi DeepSeek-V4

V4 baharu dilancarkan sebagai dua versi, DeepSeek-V4-Pro dan DeepSeek-V4-Flash, dengan yang terakhir menjadi pilihan yang lebih cekap dan menjimatkan kerana parameter yang lebih kecil. V4-Pro mempunyai 1.6 trilion parameter manakala V4-Flash mempunyai 284 bilion parameter, yang memperhalusi keupayaan membuat keputusan model. Model ini juga telah dioptimumkan untuk produk Ejen AI popular seperti Claude Code, OpenClaw, OpenCode dan CodeBuddy, kata kenyataan DeepSeek. Dalam penanda aras pengetahuan dunia, DeepSeek-V4-Pro jauh mendahului model sumber terbuka lain dan hanya sedikit diatasi oleh model sumber tertutup terkemuka, Gemini-Pro-3.1 Google.

Kesan Kejutan DeepSeek

Tahun lalu, apa yang dipanggil kejutan DeepSeek mencetuskan jualan saham berkaitan AI dan penilaian semula strategi perniagaan dalam apa yang juga digambarkan sebagai detik Sputnik untuk industri. Chatbot itu berprestasi pada tahap yang sama dengan ChatGPT dan tawaran Amerika terkemuka yang lain, tetapi syarikat itu berkata ia mengambil kuasa pengiraan yang jauh lebih sedikit untuk dibangunkan. Walau bagaimanapun, popularitinya yang tiba-tiba menimbulkan persoalan mengenai privasi data dan penapisan, dengan chatbot sering enggan menjawab soalan mengenai topik sensitif seperti tindakan keras Tiananmen 1989.

Di dalam negara, alat AI DeepSeek telah digunakan secara meluas oleh majlis perbandaran dan institusi penjagaan kesihatan China serta sektor kewangan dan perniagaan lain. Ini sebahagiannya didorong oleh keputusan DeepSeek untuk menjadikan sistemnya sumber terbuka, dengan proses dalamannya didedahkan kepada umum — berbeza dengan model proprietari yang dijual oleh OpenAI dan pesaing Barat yang lain.

Tuduhan pencurian teknologi

Rumah Putih telah menuduh syarikat China bersaing untuk mencuri teknologi Amerika, menjelang sidang kemuncak yang dijangka antara Donald Trump dan Xi Jinping di Beijing bulan depan. Penasihat ketua sains dan teknologi Trump, Michael Kratsios, berkata di X bahawa AS mempunyai bukti bahawa entiti asing, terutamanya di China, menjalankan kempen penyulingan skala industri untuk mencuri AI Amerika. Penyulingan adalah amalan biasa dalam pembangunan AI, sering digunakan oleh syarikat untuk mencipta versi model mereka yang lebih murah dan lebih kecil.

Banner selepas artikel Pickt — aplikasi senarai beli-belah kolaboratif dengan ilustrasi keluarga

Pengumuman DeepSeek pada hari Jumaat juga datang ketika Meta berkata ia merancang untuk memotong sepersepuluh kakitangannya kerana ia mencari peningkatan produktiviti daripada tenaga kerja yang lain sambil melabur banyak dalam kecerdasan buatan. Laporan mengatakan Microsoft juga sedang mencari untuk mengurangkan barisannya.