Meta telah merilis implementasi “terbuka” dari fitur viral generate-a-podcast di NotebookLM Google.
Ditelepon Buku catatanLlamaproyek ini menggunakan model Llama milik Meta untuk sebagian besar pemrosesan, tidak mengherankan. Seperti NotebookLM, ia dapat menghasilkan ringkasan file teks bergaya podcast yang diunggah ke dalamnya.
NotebookLlama pertama-tama membuat transkrip dari sebuah file — misalnya PDF artikel berita atau postingan blog. Kemudian, ia menambahkan “lebih banyak dramatisasi” dan interupsi sebelum memasukkan transkrip ke model text-to-speech terbuka.
Hasilnya tidak terdengar sebagus NotebookLM. Di NotebookLlama sampel Saya telah mendengarkannya, suara-suara tersebut jelas memiliki kualitas seperti robot, dan cenderung berbicara satu sama lain pada saat-saat yang aneh.
Namun peneliti Meta di balik proyek ini mengatakan bahwa kualitasnya dapat ditingkatkan dengan model yang lebih kuat.
“Model text-to-speech adalah batasan seberapa natural suara ini,” tulis mereka di halaman GitHub NotebookLlama. “[Also,] Pendekatan lain dalam menulis podcast adalah dengan meminta dua agen memperdebatkan topik yang diminati dan menulis kerangka podcast. Saat ini kami menggunakan satu model untuk menulis kerangka podcast.”
NotebookLlama bukan yang pertama percobaan untuk meniru fitur podcast NotebookLM. Beberapa proyek lebih sukses dibandingkan proyek lainnya. Namun tidak ada satu pun — bahkan NotebookLM sendiri — yang berhasil memecahkan masalah halusinasi yang menghantui semua AI. Artinya, podcast yang dihasilkan AI adalah pasti berisi beberapa barang buatan.