Generator video Google akan hadir untuk beberapa pelanggan lagi — tepatnya pelanggan Google Cloud.
Pada hari Selasa, Google mengumumkan bahwa Veo, model AI-nya yang dapat menghasilkan klip video pendek dari gambar dan perintah, akan tersedia dalam pratinjau pribadi untuk pelanggan yang menggunakan Vertex AI, platform pengembangan AI Google Cloud.
Google mengatakan peluncuran ini akan memungkinkan satu pelanggan, Quora, untuk menghadirkan Veo ke platform chatbot Poe, dan pelanggan lainnya, pemilik Oreo Mondelez International, untuk membuat konten pemasaran dengan mitra agensinya.
“Kami menciptakan Poe untuk mendemokratisasi akses terhadap model AI generatif terbaik di dunia,” kata pemimpin produk Poe, Spencer Chan dalam sebuah pernyataan. “Melalui kemitraan dengan para pemimpin seperti Google, kami memperluas kemungkinan kreatif di semua modalitas AI.”
Generator andalan
Diluncurkan pada bulan April, Veo dapat menghasilkan klip hewan, objek, dan manusia beresolusi 1080p hingga enam detik dengan kecepatan 24 atau 30 frame per detik. Google mengatakan bahwa Veo mampu menangkap gaya visual dan sinematik yang berbeda, termasuk bidikan lanskap dan selang waktu, serta mengedit rekaman yang sudah dibuat.
Mengapa harus menunggu lama untuk API? “Kesiapan perusahaan,” kata Warren Barkley, direktur senior manajemen produk di Google Cloud.
“Sejak Veo diumumkan, tim kami telah menambah, memperkuat, dan menyempurnakan model Vertex AI untuk pelanggan perusahaan,” katanya. “Saat ini, Anda dapat membuat video definisi tinggi dalam resolusi 720p, dalam rasio aspek lanskap 16:9 atau potret 9:16. Mirip dengan bagaimana kami meningkatkan kemampuan model lain seperti Gemini pada Vertex AI, kami akan terus melakukan ini untuk Veo.”
Veo memahami VFX dengan cukup baik dari petunjuknya, kata Google (pikirkan teks seperti “ledakan besar”), dan memiliki sedikit pemahaman tentang fisika, termasuk dinamika fluida. Model ini juga mendukung pengeditan terselubung untuk perubahan pada wilayah tertentu dalam video, dan secara teknis mampu merangkai rekaman menjadi proyek yang lebih panjang.
Dengan cara ini, Veo bersaing dengan model penghasil video terkemuka saat ini — tidak hanya Sora OpenAI, tetapi juga model dari Adobe, Runway, Luma, Meta, dan lainnya.

Itu tidak berarti bahwa Veo sempurna. Mencerminkan keterbatasan AI saat ini, objek dalam video Veo menghilang dan muncul kembali tanpa banyak penjelasan atau konsistensi. Dan Veo sering kali salah memahami fisikanya. Misalnya, mobil akan mundur secara misterius dan mustahil dengan uang sepeser pun.
Pelatihan dan risiko
Veo dilatih pada banyak rekaman. Biasanya seperti itulah cara kerjanya dengan model AI generatif: dengan memberikan contoh demi contoh beberapa bentuk data, model mengambil pola dalam data yang memungkinkan model tersebut menghasilkan data baru — video, dalam kasus Veo.
Google, seperti banyak pesaing AI-nya, tidak mengatakan secara pasti dari mana mereka mendapatkan data untuk melatih model generatifnya. Ketika ditanya tentang Veo secara khusus, Barkley hanya mengatakan bahwa model tersebut “mungkin” dilatih pada “beberapa” konten YouTube “sesuai dengan [Google’s] perjanjian dengan pembuat YouTube.” (Perusahaan induk Google, Alphabet, memiliki YouTube.)
“Veo telah dilatih tentang berbagai kumpulan data deskripsi video berkualitas tinggi yang dikurasi secara ketat demi keselamatan dan keamanan,” tambahnya. “Model dasar Google dilatih terutama berdasarkan sumber yang tersedia untuk umum.”
Pelaporan The New York Times pada bulan April mengungkapkan bahwa Google memperluas persyaratan layanannya tahun lalu sebagian untuk memungkinkan perusahaan memanfaatkan lebih banyak data untuk melatih model AI-nya. Berdasarkan ToS yang lama, tidak jelas apakah Google dapat menggunakan data YouTube untuk membuat produk di luar platform video. Tidak demikian halnya dengan ketentuan baru, yang sangat melonggarkan kendali.

Meskipun Google menghosting alat yang memungkinkan webmaster memblokir bot perusahaan agar tidak mengambil data pelatihan dari situs web mereka, Google tidak menawarkan mekanisme yang memungkinkan pembuat konten menghapus karya mereka dari set pelatihan yang ada. Google menyatakan bahwa model pelatihan menggunakan data yang tersedia untuk umum penggunaan wajarartinya perusahaan yakin bahwa mereka tidak berkewajiban untuk meminta izin dari — atau memberi kompensasi — pemilik data. (Namun Google mengatakan tidak menggunakan data pelanggan untuk melatih modelnya.)
Berkat perilaku model generatif saat ini saat dilatih, model tersebut memiliki risiko tertentu, seperti regurgitasi, yang mengacu pada saat model menghasilkan salinan cermin dari data pelatihan. Alat-alat seperti Runway ditemukan dimuntahkan diam pada dasarnya mirip dengan video yang dilindungi hak cipta, sehingga berpotensi menjadi ladang ranjau hukum bagi pengguna alat tersebut.
Solusi Google adalah filter tingkat cepat untuk Veo, termasuk konten kekerasan dan eksplisit. Jika gagal, perusahaan akan mengatakannya kebijakan ganti rugi memberikan pembelaan bagi pengguna Veo yang memenuhi syarat terhadap tuduhan pelanggaran hak cipta.
“Kami berencana mengganti kerugian keluaran Veo pada Vertex AI ketika sudah tersedia secara umum,” kata Barkley.
Veo dimana-mana
Selama beberapa bulan terakhir, Google perlahan-lahan mengintegrasikan Veo ke lebih banyak aplikasi dan layanannya untuk menyempurnakan model tersebut.
Pada bulan Mei, Google menghadirkan Veo ke Google Labs, program akses awalnya, untuk penguji terpilih. Dan pada bulan September, Google mengumumkan integrasi Veo untuk YouTube Shorts, format video pendek YouTube, untuk memungkinkan pembuat konten membuat latar belakang dan klip video berdurasi enam detik.
Bagaimana dengan risiko deepfake dari semua ini, Anda mungkin bertanya-tanya? Google mengatakan bahwa mereka menggunakan teknologi watermarking miliknya, SynthID, untuk menyematkan penanda tak terlihat ke dalam bingkai yang dihasilkan Veo. Memang benar, SynthID tidak tahan terhadap pengeditan, dan Google belum menyediakan bagian ID konten untuk pihak ketiga.

Ini mungkin menjadi poin yang diperdebatkan jika Veo tidak mendapatkan daya tarik yang berarti. Dalam hal kemitraan, Google telah kalah bersaing dengan pesaing AI generatif, yang bergerak cepat untuk merayu produser, studio, dan agensi kreatif dengan alat mereka. Runway baru-baru ini menandatangani kesepakatan dengan Lionsgate untuk melatih model khusus pada katalog film studio, dan OpenAI bekerja sama dengan merek Dan direktur independen untuk menampilkan potensi Sora.
Google pernah mengatakan sedang menjajaki aplikasi Veo bekerja sama dengan artis termasuk Donald Glover (AKA Childish Gambino). Perusahaan tidak memberikan informasi terkini tentang upaya penjangkauan tersebut hari ini.
Promosi Google untuk Veo — sebuah cara untuk mengurangi biaya dan melakukan iterasi dengan cepat pada konten video — berisiko mengasingkan materi iklan. Sebuah tahun 2024 belajar yang ditugaskan oleh Animation Guild, sebuah serikat pekerja yang mewakili animator dan kartunis Hollywood, memperkirakan bahwa lebih dari 100.000 pekerjaan di bidang film, televisi, dan animasi yang berbasis di AS akan terganggu oleh AI pada tahun 2026.
Hal ini mungkin menjelaskan pendekatan Google yang hati-hati, “lambat dan mantap”. Ketika ditanya, Barkley tidak memberikan ETA untuk ketersediaan umum Veo di Vertex, dan dia juga tidak mengatakan kapan Veo akan hadir di platform dan layanan Google tambahan.

“Kami biasanya merilis produk dalam bentuk pratinjau terlebih dahulu, karena ini memungkinkan kami mendapatkan masukan nyata dari sekelompok pelanggan perusahaan kami sebelum produk tersebut tersedia secara umum untuk penggunaan yang lebih luas,” katanya. “Ini membantu meningkatkan fungsionalitas dan memastikan produk memenuhi kebutuhan pelanggan kami.”
Dalam pengumuman terkait hari ini, Google mengatakan bahwa generator gambar andalannya, Imagen 3, kini tersedia untuk semua pelanggan Vertex AI tanpa daftar tunggu. Ini memperoleh fitur penyesuaian dan pengeditan gambar baru — tetapi untuk saat ini fitur-fitur tersebut masih berada dalam daftar tunggu terpisah.