Home Teknologi Platform Podcasting Podcastle Meluncurkan Model Teks-ke-Pidato dengan lebih dari 450 suara AI

Platform Podcasting Podcastle Meluncurkan Model Teks-ke-Pidato dengan lebih dari 450 suara AI

15
0
Platform Podcasting Podcastle Meluncurkan Model Teks-ke-Pidato dengan lebih dari 450 suara AI


Podcast Recording and Editing Platform Podcastle sekarang bergabung dengan perusahaan lain dalam balapan bertenaga AI, teks-ke-unggun dengan merilis model AI sendiri yang disebut Asyncflow v1.0. API untuk pengembang juga akan tersedia, memungkinkan mereka untuk secara langsung mengintegrasikan model teks-ke-ucapan dalam aplikasi mereka.

Berkat model baru, perusahaan dapat menawarkan lebih dari 450 suara AI yang dapat menceritakan teks Anda. Startup mengatakan bahwa mereka mengembangkan teknologi dan model sedemikian rupa sehingga biaya pelatihan dan inferensi rendah, memberikan keuntungan melawan pesaing.

Dengan pindah, Podcastle bergabung dengan sejumlah startup, termasuk ElevenLabs, Speechify, dan Wellsaid, yang telah mengembangkan teknologi dan model AI untuk mengubah segala jenis teks menjadi klip suara yang diceritakan oleh AI. Teknologi ini mencakup kasus penggunaan seperti pemasaran, iklan, pembuatan konten, pendidikan, dan pelatihan perusahaan.

Pendiri Podcastle, Arto Yeritsyan, mengatakan kepada TechCrunch bahwa perusahaan selalu ingin membangun model teks-ke-pidato, tetapi biaya pelatihan dan persyaratan data untuk itu sangat tinggi.

“Kami ingin membangun model teks-ke-speech yang kuat sejak awal kami. Namun, biaya pengembangan sangat tinggi. Berkat perkembangan model bahasa besar baru-baru ini, kami dapat mencapai terobosan tahun lalu untuk sampai ke tempat di mana kami dapat membangun model suara berkualitas tinggi tanpa memerlukan banyak data, ”kata Yeritsyan.

Perusahaan ini juga dibantu dalam upayanya dengan penggalangan dana Seri A $ 13,5 juta tahun lalu.

Yerititsyan mengatakan bahwa sementara Podcastle mengenakan biaya sekitar $ 40 per 500 menit konversi teks-ke-unggun, ElevenLabs mengenakan biaya $ 99 untuk hal yang sama.

Fitur kloning suara Podcastle juga mendapatkan peningkatan, untuk membuat proses yang lebih cepat untuk pelatihan.

Sebelumnya, proses pelatihan melibatkan membaca sekitar 70 kalimat yang berbeda. Sekarang, hanya perlu beberapa detik perekaman dari Anda untuk membuat klon suara Anda. Proses baru ini juga menggunakan Magic Dust AI Podcastle, yang dirilis tahun lalu, untuk meningkatkan kualitas rekaman audio.

Kredit Gambar: Podcastle

Dalam pengujian kami, suara yang dibuat dengan proses baru terdengar sedikit robot, meskipun itu meniru nada kami. Perusahaan mengatakan bahwa, seiring waktu, itu akan meningkatkan fitur. Plus, Anda dapat melatih sampel suara Anda yang berbeda untuk mendapatkan hasil yang berbeda.

Podcastle mengatakan bahwa selain dari biaya, memiliki alat untuk audio, video, podcast, dan narasi bertenaga AI di bawah satu situs yang didesain ulang akan memberikan keunggulan atas pesaing. Yeritsyan mengatakan bahwa sementara sebagian besar pengguna menggunakan Podcastle untuk mengerjakan konten audio, video juga mengejar itu.


LEAVE A REPLY

Please enter your comment!
Please enter your name here