Deepseek sudah viral.
Laboratorium AI China Deepseek menerobos masuk ke dalam kesadaran utama minggu ini setelah aplikasi chatbot naik ke puncak tangga lagu Apple App Store (dan Google Play, juga). Model AI Deepseek, yang dilatih menggunakan teknik komputasi-hemat, telah memimpin analis Wall Street-dan teknologi-untuk mempertanyakan apakah AS dapat mempertahankan keunggulannya dalam lomba AI dan apakah permintaan chip AI akan bertahan.
Tapi dari mana Deepseek berasal, dan bagaimana hal itu naik ke ketenaran internasional begitu cepat?
Origins Trader Deepseek
Deepseek didukung oleh High-Flyer Capital Management, dana lindung nilai kuantitatif Cina yang menggunakan AI untuk menginformasikan keputusan perdagangannya.
Penggemar AI Liang Wenfeng ikut mendirikan High-Flyer pada tahun 2015. Wenfeng, yang dilaporkan mulai berkecimpung dalam perdagangan sementara seorang mahasiswa di Universitas Zhejiang, meluncurkan manajemen modal terbang tinggi sebagai dana lindung nilai pada tahun 2019 yang berfokus pada pengembangan dan penggalian algoritma AI.
Pada tahun 2023, High-Flyer memulai Deepseek sebagai laboratorium yang didedikasikan untuk meneliti alat AI yang terpisah dari bisnis keuangannya. Dengan High-Flyer sebagai salah satu investornya, lab berputar ke perusahaannya sendiri, juga disebut Deepseek.
Sejak hari pertama, Deepseek membangun kelompok pusat data sendiri untuk pelatihan model. Tetapi seperti perusahaan AI lainnya di Cina, Deepseek telah dipengaruhi oleh larangan ekspor AS pada perangkat keras. Untuk melatih salah satu model yang lebih baru, perusahaan ini terpaksa menggunakan chip NVIDIA H800, versi chip yang kurang kuat, H100, tersedia untuk perusahaan AS.
Tim teknis Deepseek dikatakan condong muda. Perusahaan Dilaporkan merekrut secara agresif Doktor Peneliti AI dari universitas Cina terkemuka. Deepseek juga mempekerjakan orang tanpa latar belakang ilmu komputer Untuk membantu teknologinya lebih memahami berbagai subjek, sesuai New York Times.
Model kuat Deepseek
Deepseek meluncurkan serangkaian model pertamanya-Deepseek Coder, Deepseek LLM, dan Deepseek Chat-pada November 2023. Tetapi tidak sampai musim semi lalu, ketika startup merilis keluarga model Deepseek-V2 berikutnya, industri AI mulai memperhatikan.
Deepseek-V2, sistem analisis teks dan gambar tujuan umum, berkinerja baik dalam berbagai tolok ukur AI-dan jauh lebih murah untuk dijalankan daripada model yang sebanding pada saat itu. Ini memaksa kompetisi domestik Deepseek, termasuk Bytedance dan Alibaba, untuk memotong harga penggunaan untuk beberapa model mereka, dan membuat yang lain benar -benar gratis.
Deepseek-V3, diluncurkan pada bulan Desember 2024, hanya ditambahkan ke ketenaran Deepseek.
Menurut pengujian benchmark internal Deepseek, Deepseek V3 mengungguli baik model yang dapat diunduh, secara terbuka tersedia seperti Meta Llama dan model “tertutup” yang hanya dapat diakses melalui API, seperti Openai GPT-4O.
Yang sama mengesankannya adalah model “penalaran” R1 Deepseek. Dirilis pada bulan Januari, Deepseek mengklaim kinerja R1 serta model O1 Openai pada tolok ukur utama.
Menjadi model penalaran, R1 secara efektif memeriksa sendiri, yang membantunya menghindari beberapa jebakan yang biasanya membuat model. Model penalaran membutuhkan waktu sedikit lebih lama-biasanya detik hingga menit lebih lama-untuk sampai pada solusi dibandingkan dengan model non-pembalalan yang khas. Keuntungannya adalah mereka cenderung lebih dapat diandalkan dalam domain seperti fisika, sains, dan matematika.
Namun, ada downside untuk R1, Deepseek V3, dan model Deepseek lainnya. Menjadi AI yang dikembangkan Cina, mereka tunduk Benchmarking oleh regulator internet China untuk memastikan bahwa tanggapannya “mewujudkan nilai -nilai sosialis inti.” Dalam aplikasi Chatbot Deepseek, misalnya, R1 tidak akan menjawab pertanyaan tentang Tiananmen Square atau otonomi Taiwan.
Pendekatan yang mengganggu
Jika Deepseek memiliki model bisnis, tidak jelas apa itu model itu. Perusahaan harga produk dan layanannya jauh di bawah nilai pasar – dan memberikan orang lain secara gratis.
Cara Deepseek mengatakannya, terobosan efisiensi telah memungkinkannya untuk mempertahankan daya saing biaya yang ekstrem. Beberapa ahli sengketa Namun, angka -angka yang telah disediakan perusahaan.
Apa pun masalahnya, pengembang telah dibawa ke model Deepseek, yang bukan open source karena frasa umumnya dipahami tetapi tersedia di bawah lisensi permisif yang memungkinkan penggunaan komersial. Menurut Clem Delitue, CEO Hugging Face, salah satu platform yang menampung model Deepseek, Pengembang di Face Memeluk telah menciptakan lebih dari 500 model R1 “turunan” dari R1 yang telah mengumpulkan 2,5 juta unduhan digabungkan.
Keberhasilan Deepseek melawan saingan yang lebih besar dan lebih mapan telah digambarkan sebagai “evening ai” dan “over-hyped.” Keberhasilan perusahaan setidaknya sebagian bertanggung jawab untuk menyebabkan harga saham Nvidia turun 18% pada Januari, dan untuk memunculkan tanggapan publik Dari CEO OpenAI Sam Altman.
Microsoft mengumumkan bahwa Deepseek tersedia di Azure AI Foundry Service -nya, platform Microsoft yang menyatukan layanan AI untuk perusahaan di bawah satu spanduk. Ketika ditanya tentang dampak Deepseek pada pengeluaran AI Meta selama panggilan pendapatan kuartal pertama, CEO Mark Zuckerberg mengatakan pengeluaran untuk infrastruktur AI akan terus menjadi “keuntungan strategis” untuk meta.
Selama panggilan pendapatan kuartal keempat Nvidia, CEO Jensen Huang menekankan “inovasi luar biasa” Deepseek, mengatakan bahwa itu dan model “penalaran” lainnya bagus untuk NVIDIA karena mereka membutuhkan lebih banyak komputasi.
Pada saat yang sama, beberapa perusahaan melarang Deepseek, dan begitu juga utuh negara dan pemerintah, termasuk Korea Selatan. Negara Bagian New York juga Daerah Deepseek Digunakan di Perangkat Pemerintah.
Adapun apa yang mungkin terjadi di masa depan Deepseek, tidak jelas. Model yang ditingkatkan diberikan. Tetapi pemerintah AS tampaknya tumbuh waspada terhadap apa yang dianggapnya sebagai pengaruh asing yang berbahaya.
TechCrunch memiliki buletin yang berfokus pada AI! Daftar di sini untuk mendapatkannya di kotak masuk Anda setiap hari Rabu.
Kisah ini awalnya diterbitkan 28 Januari 2025, dan akan diperbarui secara berkala.