Andreessen Horowitz Mitra Umum dan Anggota Dewan Mistral Anjney “ANJ” Midha pertama kali memata-matai kinerja menjatuhkan rahang Deepseek enam bulan lalu, ia mengatakan kepada TechCrunch.
Saat itulah Deepseek memperkenalkan Coder V2, yang menyaingi GPT4-Turbo Openai untuk tugas-tugas khusus pengkodean kertas itu dirilis tahun lalu. Ini menempatkan Deepseek di jalan untuk merilis model yang lebih baik setiap beberapa bulan melalui R1, katanya. R1 adalah model penalaran open source baru yang telah membalikkan industri teknologi untuk menawarkan kinerja standar industri dengan sedikit biaya.
Terlepas dari penjualan saham Nvidia, Midha mengatakan R1 tidak berarti bahwa model dasar AI akan berhenti menghabiskan miliaran untuk melahap chip GPU dan membangun lebih banyak pusat data secepat mungkin.
Itu berarti mereka akan berbuat lebih banyak dengan daya komputasi yang dapat mereka peroleh.
“Ketika orang -orang seperti, oke dan, Mistral telah mengumpulkan satu miliar dolar,” katanya. “Apakah Deepseek berarti bahwa semua miliar dolar sama sekali tidak perlu? Tidak, sebenarnya, sangat berharga bagi mereka untuk dapat melihat peningkatan efisiensi Deepseek, menginternalisasi mereka, dan kemudian melemparkan satu miliar dolar ke sana. ”
Dia menambahkan, “Sekarang kita bisa mendapatkan output 10 kali lebih banyak dari komputasi yang sama.”
Itu tidak berarti Mistral benar -benar putus asa di belakang saingan Openai dan Anthropic, menurutnya. Masing -masing dari mereka telah mengumpulkan lebih banyak miliaran daripada Mistral. Openai dilaporkan dalam pembicaraan untuk mengumpulkan $ 40 miliar yang menjatuhkan rahang lainnya.
Mistral tetap kompetitif dengan mereka karena itu open source, katanya. Dan logikanya memang memiliki kelebihan. Open Source memberi perusahaan akses pada dasarnya tenaga kerja teknis gratis dari mereka yang ingin membantu karena mereka menggunakan proyek. Rival sumber tertutup menjaga rahasia mereka dan harus membayar semua tenaga kerja serta daya komputasi.
“Anda tidak membutuhkan $ 20 miliar. Anda hanya perlu lebih banyak komputasi daripada aplikasi model open source lainnya. Jadi Mistral diposisikan [well]. Mereka memiliki komputasi paling banyak dari penyedia sumber terbuka, ”kata Midha tentang perusahaan portofolionya.
Llama Facebook, saingan model AI open source barat terbesar untuk Mistral, juga akan mendapatkan lebih banyak investasi. CEO Mark Zuckerberg pada hari Rabu mengatakan dia masih berencana untuk menghabiskan “ratusan miliar dolar” secara keseluruhan di AI. Itu termasuk $ 60 miliar pada tahun 2025 untuk pengeluaran modal, sebagian besar pusat data.
Program Berbagi GPU oksigen A16Z 'Overbooked'
Midha, yang juga anggota dewan untuk generator gambar AI Black Forest Labs dan pembuat model 3D Luma (dan seorang malaikat dalam pakaian antropik AI, sebelas, yang lain) memiliki alasan lain mengapa ia tidak melihat kelaparan AI akan mereda dalam waktu dekat.
Dia adalah pemimpin program oksigen A16Z. GPU, khususnya H100-an Nvidia yang canggih, telah menjadi komoditas yang langka sehingga perusahaan VC mengambil masalah ke tangannya sendiri sekitar satu setengah tahun yang lalu. Itu membeli banyak dari mereka untuk digunakan perusahaan portofolionya.
Oksigen “overbook saat ini. Saya tidak bisa cukup mengalokasikan, ”Midha tertawa. Startupnya tidak hanya membutuhkan GPU untuk pelatihan model AI, tetapi kemudian mereka membutuhkan lebih banyak untuk menjalankan produk AI mereka yang sedang berlangsung untuk pelanggan.
“Sekarang ada permintaan inferensi yang tak terpuaskan ini, untuk konsumsi,” jelasnya.
Itu juga mengapa menurutnya terobosan teknik Deepseek juga tidak akan mengubah Stargate. Itu adalah kemitraan besar $ 500 miliar Openai yang diumumkan awal bulan ini dengan SoftBank dan Oracle untuk pusat data AI.
Perubahan utama Deepseek mengantarkan pengakuan oleh negara -negara negara bahwa AI adalah infrastruktur dasar berikutnya, seperti listrik dan internet. Midha ingin mereka mempertimbangkan “independensi infrastruktur,” sebagaimana ia menyebutnya. Apakah mereka ingin mengandalkan model Cina, dengan sensor dan cakarnya dalam data mereka? Atau apakah mereka menginginkan model Barat yang mengikuti hukum Barat, etika dan mematuhi perjanjian NATO?
Dia jelas mengadvokasi negara-negara Barat menggunakan model Barat, seperti Mistral yang berbasis di Paris. Ratusan perusahaan berbagi kekhawatiran itu dan telah memblokir Deepseek, yang merupakan layanan aplikasi konsumen dan model open source.
Tidak semua orang membeli ketakutan akan model open source Cina. Perusahaan dapat menjalankannya secara lokal di pusat data mereka sendiri. Dan Deepseek sudah tersedia sebagai layanan cloud yang aman dari perusahaan Amerika seperti Microsoft Azure Foundryjadi pengembang tidak harus menggunakan layanan cloud Deepseek.
Faktanya, mantan CEO Intel, Pat Gelsinger – seseorang sangat akrab dengan China – mengatakan kepada TechCrunch bahwa startup GLOO -nya, sedang membangun layanan obrolan AI pada versi mereka sendiri dari Deepseek R1 alih -alih pilihan seperti Llama atau Openai.
Tetapi jika ada yang ingin membuang rencana pusat data mereka mengingat Deepseek, Midra tertawa dan memiliki permintaan: “Jika Anda memiliki GPU tambahan, silakan kirim mereka ke ANJ.”