Aplikasi visi komputer mendapat dorongan besar dari kemajuan ponsel cerdas yang dikombinasikan dengan AI yang membantu mengisi kesenjangan yang tidak dapat dilihat oleh perangkat sehari-hari. Dengan menggunakan alat ini, sebuah startup dari Munich bernama Melampaui Kehadiran percaya bahwa hal ini memegang kunci untuk apa yang akan terjadi selanjutnya: Avatar hiper-realistis yang terlihat dan terdengar persis seperti manusia dan dapat digunakan dalam situasi percakapan real-time.
Startup tersebut hari ini mengatakan telah mengumpulkan pendanaan luar pertamanya, putaran awal sebesar $3,1 juta. Perusahaan Jerman HV Capital memimpin putaran ini, dengan 10x Pendiri, Alba VC, dan individu dari Meta, DeepMind, dan Zalando juga berpartisipasi.
Beyond Presence belum benar-benar meluncurkan teknologinya ke dunia, tetapi sudah dekat, kata Awais Shafique, CEO dan salah satu pendiri startup tersebut, kepada TechCrunch.
Sebagian dari modal baru akan digunakan untuk terus mengembangkan model dasar perusahaan, katanya, dan sebagian lagi akan mendanai peluncuran beta publiknya pada akhir bulan ini.
Sejauh ini, sekitar 300 perusahaan berada dalam daftar tunggu untuk produk tersebut, yang kemungkinan besar akan memiliki aplikasi awal di berbagai bidang seperti layanan dan dukungan pelanggan, rekrutmen, penjualan, dan e-learning. Semua hal ini merupakan area di mana perusahaan ingin meningkatkan interaksi dengan pengguna tanpa harus mempekerjakan dan melatih lebih banyak orang.
Jadi, bagaimana sebuah startup berhasil mengumpulkan dana jutaan dolar bahkan sebelum produknya diluncurkan, dan sampai sejauh ini sebagai perusahaan AI yang intensif sumber daya tanpa pendanaan dari luar? Jawabannya terletak pada latar belakang para pendirinya.
Shafique sebelumnya ikut mendirikan Presize, sebuah startup computer vision yang dapat melakukan pengukuran pengguna secara akurat dengan merekam klip pengguna yang berputar satu kali di depan kamera ponsel cerdas. Pengukuran tersebut kemudian dapat digunakan untuk membantu membeli pakaian secara online. Startup yang berbasis di Munich ini memiliki profil yang sangat besar di negara asalnya karena para pendirinya berpartisipasi dalam “Dragons Den”/”Shark Tank” versi TV Jerman pada tahun 2020, di mana mereka mengumpulkan dana sebesar €650.000 yang memecahkan rekor.
Lalu masuk April 2022ternyata Meta telah mengakuisisi Presize. Harga dan tanggal pasti transaksi tidak pernah diungkapkan, namun beberapa sinyal kuat menunjukkan jalan keluar yang bagus.
Pengajuan SEC menunjukkan bahwa Meta menghabiskan antara $774 juta dari Januari sampai Maret 2022, dan $1,15 miliar dalam enam bulan pertama tahun 2022, tentang akuisisi. Presize adalah satu-satunya kesepakatan yang diungkapkan secara publik pada saat itu. Sementara itu, daftar akuisisi Meta di Wikipedia telah diedit dengan perkiraan yang jauh lebih sederhana: $100 juta.
Sumber yang mengetahui masalah ini mengatakan kepada TechCrunch bahwa nilai kesepakatan dalam sembilan angka terbawah lebih akurat daripada 10 angka dalam kasus ini.
Terlepas dari posisi Presize dalam kisaran tersebut, mengingat bahwa startup tersebut hanya mengumpulkan “beberapa juta”, menurut perkiraan Shafique, ia dan rekan-rekan pendirinya mendapatkan hasil yang sangat baik.
“Cukup menguntungkan sehingga kami tidak perlu bekerja,” katanya dalam sebuah wawancara.
(Bagaimanapun, mereka semua masih bekerja. Selain startup terbaru Shafique, salah satu pendiri Presize lainnya, Leon Szeli dan Tomislav Tomov, masih di Meta, mengerjakan proyek AI generatifnya. Namun, mereka tetap berhubungan dengan Shafique, sebagai keduanya berinvestasi di Beyond Presence.)
Pada intinya, Presize bertujuan untuk memecahkan masalah penglihatan komputer yang sulit, dan itulah yang juga ingin dilakukan oleh Beyond Presence.
Memang benar, pemikiran awal saya tentang presentasi Beyond Presence bersifat skeptis.
Avatar digital bukanlah wilayah yang belum dipetakan. Tidak hanya mereka telah ada selama beberapa dekade, tetapi mereka juga mendapatkan perhatian baru-baru ini – dan mungkin beberapa hype – dengan inovasi terbaru dalam AI dan pemrosesan, belum lagi kegemaran akan segala sesuatu yang berhubungan dengan chatbot.
Juga tidak ada gagasan yang jelas tentang apa yang akan berhasil di bidang avatar sebagai bisnis jangka panjang. Beberapa diantaranya, seperti Hyper dan Ready Player Me (masing-masing didukung oleh Amazon dan a16z), mengambil inspirasi dari budaya game dan teori bahwa avatar seharusnya bukan jadilah versi realistis dari orang yang menggunakannya. Mereka yang ingin menyembunyikan identitas mereka untuk menjaga privasi mereka mungkin memilih pendekatan ini daripada pendekatan yang meniru kemiripan persisnya.
Lainnya, seperti Synthesia, Bisa membuat kemiripan orang. Namun mereka memerlukan kunjungan studio, dan bukan merupakan dasar dari produk utama, yang menggunakan perangkat sederhana seperti kamera ponsel untuk menangkap ekspresi Anda untuk memperkuat avatar yang dapat melakukannya. bukan terlihat seperti kamu.
Dan beberapa lainnya mencoba membuat alat yang dapat Anda gunakan untuk berinteraksi menggunakan perangkat sehari-hari — termasuk Veed dan Otak dalam.
Beyond Presence tidak hanya bertujuan untuk membuat avatar yang dapat dibuat dengan cepat menggunakan ponsel Anda, namun juga avatar yang mirip dengan Anda dan dapat digunakan dalam situasi percakapan tanpa naskah secara real-time. Sesuatu seperti versi video dari chatbot berbasis teks yang ditawarkan oleh OpenAI, Anthropic, Meta dan banyak lainnya.
Tentu saja, startup ini bukan satu-satunya yang bergerak di bidang ini. Zoom tampaknya sedang mengerjakan avatar khusus yang sangat realistis, dan CommonGround juga mengembangkan sesuatu yang serupa.
Untuk saat ini, Beyond Presence fokus membangun sesuatu yang unik pada komponen video produknya.
Eleven Labs mendukung bagian suara dalam pengalaman, dan GPT OpenAI adalah model AI generatif yang mendukung konten. Pelanggan bisnis dapat secara fleksibel mengubah model yang mereka gunakan.
“Anda juga dapat menyerahkan semuanya kepada kami, [or use] LLM apa pun yang Anda inginkan, atau agen suara apa pun yang Anda inginkan. Lalu kita lakukan face di atasnya, ”ujarnya. Fitur ini mengatasi fakta bahwa pelanggan perusahaan mungkin sudah bekerja dengan penyedia LLM tertentu, misalnya, atau tidak ingin berbagi data kepemilikan apa pun secara eksternal, katanya.
Ada detail menarik tentang keputusan awal Beyond Presence seputar pendanaan: Ternyata perusahaan tersebut diterima untuk berpartisipasi dalam Y Combinator awal tahun ini, namun memilih keluar dari inkubator bergengsi tersebut.
Meskipun YC jelas memberikan akses ke jaringan yang hebat, Shafique dan salah satu pendirinya Felix Altenberger (CTO; dan mantan spesialis pembelajaran mendalam di Presize) memilih untuk tidak melepaskan kesetaraan dan otonomi untuk mengaksesnya.
Meskipun mitra YC mungkin memiliki masukan sendiri tentang cara mengembangkan perusahaan melalui penjualan, Shafique mengatakan dia dan Altenberger memiliki pendekatan “horizontal” yang ingin mereka terapkan.
“Kami ingin lebih fokus pada teknologi inti dan lapisan model pondasi,” katanya.
TechCrunch memiliki buletin yang berfokus pada AI! Daftar di sini untuk menerimanya di kotak masuk Anda setiap hari Rabu.