GLM-5 Dilancarkan: Era Baharu AI Apabila Model Menjadi Jurutera Sistem

GLM-5 Dilancarkan: Era Baharu dalam Kecerdasan Buatan Apabila Model Menjadi Jurutera Sistem

Pelancaran GLM-5 sebagai sumber terbuka menandakan peralihan yang lebih luas dalam bidang kecerdasan buatan. Model bahasa besar kini bergerak melampaui penjanaan serpihan kod atau prototaip antara muka ke arah pembinaan sistem lengkap dan melaksanakan tugas kompleks dari hujung ke hujung.

Perubahan ini menandakan peralihan dari apa yang dipanggil "pengkodan vibes" kepada apa yang semakin digambarkan oleh penyelidik sebagai kejuruteraan agen. Model kini bukan sekadar menulis kod tetapi membina sistem berfungsi sepenuhnya.

Penilaian Prestasi LLM: Agen, Penaakulan dan Pengkodan

Dibina untuk fasa baharu ini, GLM-5 berada antara model sumber terbuka terkuat untuk pengkodan dan pelaksanaan tugas autonomi. Dalam tetapan pengaturcaraan praktikal, prestasinya menghampiri Claude Opus 4.5, terutamanya dalam reka bentuk sistem kompleks dan tugas jangka panjang yang memerlukan perancangan dan pelaksanaan berterusan.

—

Banner lebar Pickt — aplikasi senarai beli-belah kolaboratif untuk Telegram

Model ini terletak pada seni bina baharu yang bertujuan untuk meningkatkan kedua-dua keupayaan dan kecekapan. Kiraan parameternya telah berkembang dari 355 bilion kepada 744 bilion, dengan parameter aktif meningkat dari 32 bilion kepada 40 bilion, manakala data pra-latihan telah berkembang kepada 28.5 trilion token.

Peningkatan ini dipadankan dengan kemajuan dalam kaedah latihan. Rangka kerja yang dipanggil Slime membolehkan pembelajaran pengukuhan tak segerak pada skala yang lebih besar, membolehkan model belajar secara berterusan dari interaksi lanjutan dan meningkatkan kecekapan pasca-latihan.

Peningkatan Teknikal dan Prestasi Benchmark

GLM-5 juga memperkenalkan DeepSeek Sparse Attention, yang mengekalkan prestasi konteks panjang sambil mengurangkan kos penyebaran dan meningkatkan kecekapan token. Penanda aras mencadangkan keuntungan yang kukuh.

Pada SWE-bench-Verified dan Terminal Bench 2.0, GLM-5 masing-masing mendapat skor 77.8 dan 56.2, keputusan tertinggi yang dilaporkan untuk model sumber terbuka, mengatasi Gemini 3 Pro dalam beberapa tugas kejuruteraan perisian.

Pada Vending Bench 2, yang mensimulasikan menjalankan perniagaan mesin layan diri selama setahun, ia selesai dengan baki $4,432, mendahului model sumber terbuka lain dalam pengurusan operasi dan ekonomi.

Keputusan ini menyerlahkan kualiti yang diperlukan untuk kejuruteraan agen: mengekalkan matlamat merentasi jangka panjang, mengurus sumber, dan menyelaraskan proses pelbagai langkah. Apabila model semakin menganggap keupayaan ini, sempadan AI nampaknya beralih dari menulis kod kepada menyampaikan sistem berfungsi.

Peralihan ini bukan sekadar kemajuan teknikal tetapi perubahan paradigma dalam bagaimana kecerdasan buatan diaplikasikan. Model seperti GLM-5 kini mampu mengambil peranan yang lebih kompleks dalam pembangunan sistem, membuka kemungkinan baharu dalam automasi dan kejuruteraan perisian.