BahasBerita.com – Deepseek V3.1 (0324) merupakan pembaruan terbaru dari model bahasa besar (LLM) yang dikembangkan oleh perusahaan AI asal Tiongkok, Deepseek. Model ini dirilis pada 24 Maret 2025 dan menawarkan peningkatan signifikan dari versi sebelumnya, Deepseek V3 yang diluncurkan pada Desember 2024.
Fitur dan Kemampuan Utama
Deepseek V3.1 hadir dengan sejumlah peningkatan penting yang menjadikannya salah satu model AI open-source terkemuka saat ini:
Peningkatan Performa
-
Model ini telah berhasil menyamai kemampuan Sonnet 3.7 dalam berbagai benchmark, bahkan mengalahkannya dalam beberapa aspek
-
Ukuran model mencapai 700GB dengan arsitektur yang dioptimalkan
-
Dirilis di bawah lisensi MIT, menjadikannya sepenuhnya open-source dan tersedia di platform seperti Hugging Face dan Hyperbolic
Kemampuan Penalaran yang Ditingkatkan
-
Mampu menyelesaikan lebih banyak masalah matematika tanpa menggunakan mode penalaran khusus
-
Berhasil menangani prompt yang sebelumnya hanya bisa diselesaikan oleh model-model penalaran seperti masalah “jugs 4 liters”
-
Mengalami peningkatan signifikan dalam evaluasi Misguided Attention, menjadi model non-reasoning terbaik
Keunggulan dalam Pengkodean
-
Kemampuan pengkodean front-end yang jauh lebih baik dibandingkan versi sebelumnya
-
Mampu menyelesaikan tantangan pengkodean Python tingkat lanjut dengan tingkat keberhasilan tinggi
-
Menunjukkan kreativitas dalam pengkodean yang setara dengan model-model terbaik lainnya
Perbandingan dengan Model Sebelumnya
Deepseek V3.1 (0324) merupakan hasil post-training dari model Deepseek V3 asli yang dirilis pada Desember 2024. Berikut perbandingan kedua versi:
Deepseek V3 (Desember 2024)
-
Menggunakan arsitektur Mixture of Experts (MoE) dengan total 671 miliar parameter
-
37 miliar parameter aktif saat digunakan
-
Dilatih pada 14,8 triliun token berkualitas tinggi
-
Kecepatan inferensi 60 token per detik (3x lebih cepat dari V2)
Deepseek V3.1 (0324)
-
Meningkatkan kemampuan matematika dan pengkodean front-end
-
Mampu menyelesaikan masalah penalaran yang lebih kompleks
-
Performa yang lebih baik dalam benchmark kreativitas kode
-
Meningkatkan kemampuan untuk menghindari jebakan penalaran
Ketersediaan dan Akses
Deepseek V3.1 dapat diakses melalui beberapa cara:
-
Tersedia secara gratis di situs resmi Deepseek, dengan catatan pengguna harus menonaktifkan opsi “deep think” untuk menggunakan model V3.1 dan bukan model R1
-
Dapat diunduh dan dijalankan secara lokal melalui Hugging Face
-
Kompatibel dengan API yang sama seperti versi sebelumnya, memudahkan integrasi bagi pengguna yang sudah menggunakan layanan Deepseek
Posisi dalam Lanskap AI
Deepseek V3.1 memperkuat posisi Deepseek sebagai salah satu pemimpin dalam pengembangan model AI open-source. Model ini bersaing langsung dengan model-model proprietary seperti GPT-4 dan Claude 3.5 Sonnet, namun dengan keunggulan biaya yang jauh lebih rendah.
Dalam benchmark terbaru, Deepseek V3.1 menunjukkan kemampuan yang setara atau bahkan lebih baik dari Sonnet 3.7 dalam beberapa aspek, terutama dalam kreativitas pengkodean dan kemampuan menyelesaikan masalah matematika kompleks.
Peningkatan signifikan dari versi sebelumnya menunjukkan komitmen Deepseek untuk terus mengembangkan teknologi AI open-source yang dapat bersaing dengan model-model proprietary terkemuka, sambil tetap menjaga aksesibilitas dan keterjangkauan bagi komunitas pengembang.
Dengan kemampuan yang terus ditingkatkan dan komitmen pada model open-source, Deepseek V3.1 menjadi pilihan menarik bagi pengembang dan organisasi yang mencari alternatif berkualitas tinggi dari model-model AI proprietary yang lebih mahal.