Apakah Anda bingung tentang kecerdasan umum buatan atau AGI? OpenAI terobsesi untuk menciptakan hal tersebut dengan cara yang “menguntungkan seluruh umat manusia.” Anda mungkin ingin menganggapnya serius karena mereka baru saja mengumpulkan $6,6 miliar untuk mendekati tujuan tersebut.
Namun jika Anda masih bertanya-tanya apa sebenarnya AGI itu, Anda tidak sendirian.
Dalam diskusi luas pada hari Kamis di pertemuan puncak kepemimpinan AI yang bertanggung jawab di Credo AI, Fei-Fei Li, seorang peneliti terkenal di dunia yang sering disebut sebagai “ibu baptis AI,” mengatakan bahwa dia juga tidak tahu apa itu AGI. Di kesempatan lain, Li membahas perannya dalam lahirnya AI modern, bagaimana masyarakat harus melindungi diri dari model AI yang canggih, dan mengapa menurutnya startup unicorn barunya, World Labs, akan mengubah segalanya.
Namun ketika ditanya apa pendapatnya tentang “singularitas AI”, Li sama bingungnya dengan kami semua.
“Saya berasal dari akademisi AI dan telah dididik dalam metode yang lebih ketat dan berbasis bukti, jadi saya tidak benar-benar tahu apa arti semua kata-kata ini,” kata Li di sebuah ruangan yang penuh sesak di San Francisco, di samping jendela besar yang menghadap ke Jembatan Gerbang Emas. “Saya terus terang tidak tahu apa yang dimaksud dengan AGI. Seperti kata orang, Anda mengetahuinya ketika Anda melihatnya, saya rasa saya belum melihatnya. Sebenarnya, saya tidak menghabiskan banyak waktu memikirkan kata-kata ini karena menurut saya ada banyak hal yang lebih penting untuk dilakukan…”
Kalau ada yang tahu apa itu AGI, mungkin itu Fei-Fei Li. Pada tahun 2006, ia menciptakan ImageNet, kumpulan data pelatihan dan benchmarking AI besar pertama di dunia yang sangat penting untuk mengkatalisasi ledakan AI kita saat ini. Dari tahun 2017 hingga 2018, ia menjabat sebagai Kepala Ilmuwan AI/ML di Google Cloud. Saat ini, Li memimpin Stanford Human-Centered AI Institute (HAI) dan startupnya, World Labs, sedang membangun “model dunia yang besar.” (Istilah itu hampir sama membingungkannya dengan AGI, jika Anda bertanya kepada saya.)
CEO OpenAI Sam Altman mencoba mendefinisikan AGI dalam profil Orang New York tahun lalu. Altman menggambarkan AGI sebagai “setara dengan manusia rata-rata yang dapat Anda pekerjakan sebagai rekan kerja.”
Jelasnya, definisi ini tidak cukup baik untuk diupayakan oleh perusahaan senilai $157 miliar. Jadi OpenAI dibuat lima tingkat digunakan secara internal untuk mengukur kemajuannya menuju AGI. Tingkat pertama adalah chatbots (seperti ChatGPT), kemudian pemikir (tampaknya, OpenAI o1 adalah tingkat ini), agen (yang akan datang berikutnya), inovator (AI yang dapat membantu menciptakan sesuatu), dan tingkat terakhir, organisasi (AI yang dapat membantu menciptakan sesuatu). dapat melakukan pekerjaan seluruh organisasi).
Masih bingung? Aku juga, dan Li juga. Selain itu, semua ini terdengar lebih dari apa yang bisa dilakukan oleh rata-rata rekan kerja manusia.
Pada awal pembicaraan, Li mengatakan dia terpesona dengan gagasan kecerdasan sejak dia masih kecil. Hal ini membawanya untuk mempelajari AI jauh sebelum hal itu menguntungkan. Pada awal tahun 2000-an, Li mengatakan bahwa dia dan beberapa orang lainnya diam-diam meletakkan fondasi untuk bidang tersebut.
“Pada tahun 2012, ImageNet saya digabungkan dengan AlexNet dan GPU – banyak orang menyebutnya sebagai kelahiran AI modern. Hal ini didorong oleh tiga unsur utama: data besar, jaringan saraf, dan komputasi GPU modern. Dan begitu momen tersebut tiba, saya pikir kehidupan di seluruh bidang AI dan dunia kita tidak akan pernah sama lagi.”
Ketika ditanya tentang RUU AI yang kontroversial di California, SB 1047, Li berbicara dengan hati-hati untuk tidak mengulangi kontroversi yang baru saja dikesampingkan oleh Gubernur Newsom dengan memveto RUU tersebut minggu lalu. (Kami baru-baru ini berbicara dengan penulis SB 1047, dan dia lebih tertarik untuk membuka kembali argumennya dengan Li.)
“Beberapa dari Anda mungkin tahu bahwa saya sangat vokal mengenai kekhawatiran saya terhadap RUU ini [SB 1047]yang diveto, tapi saat ini saya sedang berpikir mendalam, dan dengan penuh semangat, untuk melihat ke depan,” kata Li. “Saya sangat tersanjung, atau tersanjung, karena Gubernur Newsom mengundang saya untuk berpartisipasi dalam langkah selanjutnya pasca SB 1047.”
Gubernur California baru-baru ini menunjuk Li, bersama dengan pakar AI lainnya, untuk membentuk satuan tugas guna membantu negara bagian tersebut mengembangkan batasan dalam penerapan AI. Li mengatakan dia menggunakan pendekatan berbasis bukti dalam peran ini, dan akan melakukan yang terbaik untuk mengadvokasi penelitian akademis dan pendanaan. Namun, dia juga ingin memastikan California tidak menghukum para ahli teknologi.
“Kita harus benar-benar melihat potensi dampaknya terhadap manusia dan komunitas kita daripada membebani teknologi itu sendiri… Tidak masuk akal jika kita memberikan sanksi kepada teknisi mobil – misalnya Ford atau GM – jika mobil disalahgunakan, baik disengaja maupun tidak. dan merugikan seseorang. Menghukum teknisi mobil saja tidak akan membuat mobil lebih aman. Apa yang perlu kita lakukan adalah terus berinovasi demi langkah-langkah yang lebih aman, namun juga membuat kerangka peraturan menjadi lebih baik – baik itu sabuk pengaman atau batas kecepatan – dan hal yang sama juga berlaku untuk AI.”
Ini adalah salah satu argumen terbaik yang pernah saya dengar menentang SB 1047, yang akan menghukum perusahaan teknologi karena model AI yang berbahaya.
Meskipun Li memberi nasihat kepada California mengenai peraturan AI, dia juga menjalankan startupnya, World Labs, di San Francisco. Ini adalah pertama kalinya Li mendirikan sebuah startup, dan dia adalah salah satu dari sedikit wanita yang memimpin laboratorium AI yang terdepan.
“Kita masih jauh dari ekosistem AI yang sangat beragam,” kata Li. “Saya percaya bahwa kecerdasan manusia yang beragam akan menghasilkan kecerdasan buatan yang beragam, dan akan memberi kita teknologi yang lebih baik.”
Dalam beberapa tahun ke depan, dia bersemangat untuk membawa “kecerdasan spasial” lebih dekat dengan kenyataan. Li mengatakan bahasa, yang menjadi dasar model bahasa besar saat ini, mungkin membutuhkan waktu satu juta tahun untuk berkembang, sedangkan penglihatan dan persepsi mungkin membutuhkan waktu 540 juta tahun. Artinya, membuat model dunia besar adalah tugas yang jauh lebih rumit.
“Ini tidak hanya membuat komputer melihat, namun benar-benar membuat komputer memahami keseluruhan dunia 3D, yang saya sebut kecerdasan spasial,” kata Li. “Kami tidak hanya melihat untuk menyebutkan sesuatu… Kami benar-benar melihat untuk melakukan sesuatu, untuk menavigasi dunia, untuk berinteraksi satu sama lain, dan menutup kesenjangan antara melihat dan melakukan memerlukan pengetahuan spasial. Sebagai seorang teknolog, saya sangat gembira dengan hal itu.”