China AI Lab Deepseek telah merilis versi terbuka Deepseek-R1, yang disebut model penalarannya, yang diklaim kinerjanya serta Openai O1 pada tolok ukur AI tertentu.
R1 tersedia dari platform AI Dev memeluk wajah di bawah lisensi MIT, yang berarti dapat digunakan secara komersial tanpa batasan. Menurut Deepseek, R1 mengalahkan O1 pada tolok ukur AIME, Math-500, dan Swe-Bench diverifikasi. AIME menggunakan model lain untuk mengevaluasi kinerja model, sementara Math-500 adalah kumpulan masalah kata. SWE-Bench diverifikasi, sementara itu, berfokus pada tugas pemrograman.
Menjadi model penalaran, R1 secara efektif memeriksa sendiri, yang membantunya menghindari beberapa jebakan yang biasanya membuat model. Model penalaran membutuhkan waktu sedikit lebih lama – biasanya detik hingga menit lebih lama – untuk sampai pada solusi dibandingkan dengan model non -musim khas. Keuntungannya adalah mereka cenderung lebih dapat diandalkan dalam domain seperti fisika, sains, dan matematika.
R1 berisi 671 miliar parameter, Deepseek terungkap dalam a Laporan Teknis. Parameter secara kasar sesuai dengan keterampilan pemecahan masalah model, dan model dengan lebih banyak parameter umumnya berkinerja lebih baik daripada yang dengan parameter lebih sedikit.
Memang, 671 miliar parameter sangat besar, tetapi Deepseek juga merilis versi “suling” dari ukuran R1 mulai dari 1,5 miliar parameter hingga 70 miliar parameter. Yang terkecil dapat berjalan di laptop. Adapun R1 lengkap, itu membutuhkan perangkat keras yang lebih besar, tetapi itu adalah Tersedia melalui API Deepseek dengan harga 90% -95% lebih murah daripada O1 Openai.
Clem Delangue, CEO Hugging Face, mengatakan dalam a Posting di x Pada hari Senin bahwa pengembang di platform telah menciptakan lebih dari 500 model “turunan” R1 yang telah mengumpulkan 2,5 juta unduhan digabungkan – lima kali jumlah unduhan yang didapat R1 resmi.
Ada kerugian untuk R1. Menjadi model Cina, itu tunduk Benchmarking oleh regulator internet China untuk memastikan bahwa tanggapannya “mewujudkan nilai -nilai sosialis inti.” R1 tidak akan menjawab pertanyaan tentang Tiananmen Square, misalnya, atau otonomi Taiwan.
Banyak Sistem AI Cina, termasuk model penalaran lainnya, menolak untuk menanggapi topik yang mungkin meningkatkan kemarahan regulator di negara ini, seperti spekulasi tentang Xi Jinping rezim.
R1 tiba beberapa hari setelah administrasi Biden yang keluar diusulkan lebih keras Ekspor aturan dan pembatasan teknologi AI untuk usaha Cina. Perusahaan di Cina sudah dicegah untuk membeli chip AI canggih, tetapi jika aturan baru mulai berlaku seperti tertulis, perusahaan akan dihadapkan dengan topi yang lebih ketat pada teknologi semikonduktor dan model yang diperlukan untuk mem -bootstrap sistem AI canggih.
Dalam dokumen kebijakan minggu lalu, Openai mendesak pemerintah AS untuk mendukung pengembangan AI AS, jangan sampai model Cina mencocokkan atau melampaui kemampuannya. Dalam an wawancara Dengan informasi tersebut, Wakil Presiden Kebijakan Openai, Chris Lehane memilih High Flyer Capital Management, orang tua perusahaan Deepseek, sebagai organisasi yang menjadi perhatian khusus.
Sejauh ini, setidaknya tiga laboratorium Cina – Deepseek, Alibaba, dan Menyukaiyang dimiliki oleh ai Moonshot Unicorn China – telah menghasilkan model yang mereka klaim saingan O1. (Dari catatan, Deepseek adalah yang pertama – mengumumkan pratinjau R1 pada akhir November.) Dalam a pos Di X, Dean Ball, seorang peneliti AI di Universitas George Mason, mengatakan bahwa tren itu menunjukkan laboratorium AI Cina akan terus menjadi “pengikut cepat.”
“Kinerja mengesankan dari model suling Deepseek […] berarti bahwa alasan yang sangat cakap akan terus berkembang secara luas dan dapat dijalankan pada perangkat keras lokal, “tulis Ball,” jauh dari mata rezim kontrol top-down. “
Kisah ini awalnya diterbitkan pada 20 Januari dan diperbarui pada 27 Januari dengan informasi lebih lanjut.
TechCrunch memiliki buletin yang berfokus pada AI! Daftar di sini untuk mendapatkannya di kotak masuk Anda setiap hari Rabu.