Sebagian besar fokus pada AI generatif adalah pada antarmuka berbasis teks yang digunakan untuk menghasilkan teks, gambar, dan banyak lagi. Gelombang berikutnya tampaknya adalah suara, dan bergulir dengan cepat. Dalam pengembangan terbaru, Google Today mengumumkan bahwa mereka akan menambahkan CHIRP 3-model pidato-ke-teks dan teks-ke-speech HD-ke platform pengembangan Vertex AI mulai minggu depan.
Minggu lalu, Google diam -diam diumumkan Chirp 3 itu akan meluncurkan 8 suara baru untuk 31 bahasa. Kasing penggunaan untuk platform termasuk membangun asisten suara, membuat buku audio, mengembangkan agen dukungan dan suara untuk video. Berita itu diumumkan di sebuah acara di kantor DeepMind Google di London.
Usahanya akan datang pada saat yang sama ketika orang lain juga melompat ke depan dengan pekerjaan AI suara mereka. Pekan lalu, Sesame – startup di balik aplikasi AI “Maya” dan “Miles” viral yang sangat realistis – mengumumkan peluncuran modelnya bagi pengembang untuk membangun aplikasi dan layanan khusus mereka sendiri di atas teknologinya.
Khususnya, akan ada pembatasan penggunaan di sekitar Chirp 3 untuk mencoba menangani penyalahgunaan. “Kami hanya mengerjakan beberapa hal ini dengan tim keselamatan kami,” kata Thomas Kurian, CEO Google Cloud, di acara berita hari ini.
Elevenlabs adalah salah satu startup utama yang telah mengumpulkan ratusan juta dana untuk memperluas pekerjaan mereka di layanan suara AI.
Berita itu akan membawa Chirp 3 ke kandang yang sama dengan versi yang lebih baru dari LLM andalannya, Gemini, yang sedang diuji, serta model generasi gambar Imagen dan alat pembuatan video VEO 2 yang mahal.
Masih harus dikonfirmasi apakah apa yang dirilis Google dengan Chirp 3 akan sama “realistis” seperti beberapa upaya AI lainnya untuk menciptakan suara “manusia” (karya Sesame menonjol pada khususnya). Tetapi ketika Demis Hassabis, CEO DeepMind, menekankan, ini tetap menjadi maraton, bukan sprint.
“Dalam waktu dekat … gagasan ini [AI is] Peluru perak untuk segala sesuatu dalam beberapa tahun ke depan, saya belum melihat itu terjadi. Pikir kita masih beberapa tahun lagi dari sesuatu seperti Agi terjadi, ”katanya. “Ini akan mengubah hal -hal … selama dekade berikutnya, jadi sedang hingga jangka panjang. Ini salah satu momen menarik dalam waktu. “
Google meluncurkan Vertex AI pada tahun 2021 sebagai platform bagi pengembang untuk membangun layanan pembelajaran mesin di cloud. Itu, tentu saja, jauh sebelum ledakan minat pada AI, dan khususnya AI generatif, yang datang dengan peluncuran layanan GPT Openai.
Sejak itu, perusahaan telah bersandar pada vertex ai sebagian saat bermain mengejar ketinggalan perusahaan lain Seperti Microsoft dan Amazon – mereka juga membangun alat AI generatif untuk pengembang. Selain membangun AI generatif di atas Gemini, pengembang dapat menggunakan AI Vertex untuk mengklasifikasikan data, melatih model, dan mengatur model untuk produksi. Akan menarik apakah ia bergerak untuk memperluas taman berdindingnya ke model di luar yang dibuat oleh Google itu sendiri.
Google telah membangun layanan suara “chirp” selama bertahun -tahun, kembali menggunakan nama sebagai a Nama kode untuk upaya awalnya untuk bersaing dengan Layanan Alexa Amazon.