Sebut saja ini sebagai kebangkitan penalaran.
Setelah peluncuran o1 OpenAI, yang disebut model penalaran, terjadi ledakan model penalaran dari laboratorium AI saingannya. Pada awal November, DeepSeek, sebuah perusahaan riset AI yang didanai oleh pedagang kuantitatif, meluncurkan pratinjau algoritma penalaran pertamanya, DeepSeek-R1. Pada bulan yang sama, tim Qwen Alibaba meluncurkan apa yang mereka klaim sebagai penantang “terbuka” pertama terhadap o1.
Jadi apa yang membuka pintu air? Salah satunya adalah pencarian pendekatan baru untuk menyempurnakan teknologi AI generatif. Seperti yang baru-baru ini dilaporkan oleh rekan saya Max Zeff, teknik “brute force” untuk meningkatkan model tidak lagi menghasilkan perbaikan seperti dulu.
Ada tekanan kompetitif yang kuat terhadap perusahaan AI untuk mempertahankan laju inovasi saat ini. Menurut Menurut perkiraan, pasar AI global mencapai $196,63 miliar pada tahun 2023 dan dapat bernilai $1,81 triliun pada tahun 2030.
OpenAI, misalnya, mengklaim bahwa model penalaran dapat “memecahkan masalah yang lebih sulit” dibandingkan model sebelumnya dan mewakili langkah perubahan dalam pengembangan AI generatif. Namun tidak semua orang yakin bahwa model penalaran adalah jalan terbaik ke depan.
Ameet Talwalkar, seorang profesor pembelajaran mesin di Carnegie Mellon, mengatakan bahwa menurutnya hasil awal dari model penalaran “cukup mengesankan”. Namun, pada saat yang sama, dia mengatakan kepada saya bahwa dia akan “mempertanyakan motif” siapa pun yang mengklaim dengan pasti bahwa mereka tahu sejauh mana model penalaran akan membawa industri ini.
“Perusahaan AI memiliki insentif finansial untuk menawarkan proyeksi bagus tentang kemampuan versi teknologi mereka di masa depan,” kata Talwalkar. “Kami menghadapi risiko untuk tidak terlalu fokus pada satu paradigma saja. Oleh karena itu, sangat penting bagi komunitas riset AI yang lebih luas untuk tidak terlalu mempercayai hype dan upaya pemasaran dari perusahaan-perusahaan ini dan sebaliknya berfokus pada hasil yang nyata.”
Dua kelemahan model penalaran adalah (1) mahal dan (2) boros daya.
Misalnya, dalam API OpenAI, perusahaan mengenakan biaya $15 untuk setiap ~750.000 kata o1 analisis dan $60 untuk setiap ~750.000 kata yang dihasilkan model. Itu antara 3x dan 4x biaya model “non-penalaran” terbaru OpenAI, GPT-4o.
O1 tersedia di platform chatbot bertenaga AI OpenAI, ChatGPT, gratis — dengan batasan. Namun awal bulan ini, OpenAI memperkenalkan tingkat o1 yang lebih canggih, mode o1 pro, dengan biaya $2.400 per tahun.
“Biaya keseluruhan [large language model] penalarannya pasti tidak akan turun,” Guy Van Den Broeck, profesor ilmu komputer di UCLA, mengatakan kepada TechCrunch.
Salah satu alasan mengapa model penalaran sangat mahal adalah karena model tersebut memerlukan banyak sumber daya komputasi untuk dijalankan. Tidak seperti kebanyakan AI, o1 dan model penalaran lainnya berupaya memeriksa pekerjaan mereka sendiri saat melakukannya. Hal ini membantu mereka menghindari beberapa kendala yang biasanya membuat model tersandung, namun kelemahannya adalah mereka sering kali membutuhkan waktu lebih lama untuk menemukan solusi.
OpenAI membayangkan model penalaran masa depan “berpikir” selama berjam-jam, berhari-hari, atau bahkan berminggu-minggu. Biaya penggunaan akan lebih tinggi, perusahaan mengakui, namun imbalannya — mulai dari baterai terobosan untuk obat kanker baru — mungkin sepadan.
Proposisi nilai model penalaran saat ini kurang jelas. Costa Huang, seorang peneliti dan insinyur pembelajaran mesin di organisasi nirlaba Ai2, mencatat bahwa o1 bukanlah kalkulator yang sangat andal. Dan penelusuran sepintas di media sosial menemukan sejumlah mode o1 pro kesalahan.
“Model penalaran ini terspesialisasi dan mungkin berkinerja buruk di domain umum,” kata Huang kepada TechCrunch. “Beberapa batasan akan diatasi lebih cepat dibandingkan batasan lainnya.”
Van den Broeck menegaskan bahwa model penalaran tidak berfungsi sebenarnya penalaran dan dengan demikian terbatas pada jenis tugas yang dapat mereka selesaikan dengan sukses. “Penalaran yang benar berhasil dalam semua permasalahan, bukan hanya permasalahan yang mungkin saja terjadi [in a model’s training data]”katanya. “Itulah tantangan utama yang masih harus diatasi.”
Mengingat kuatnya insentif pasar untuk meningkatkan model penalaran, dapat dipastikan bahwa model tersebut akan menjadi lebih baik seiring berjalannya waktu. Lagi pula, bukan hanya OpenAI, DeepSeek, dan Alibaba yang berinvestasi dalam bidang penelitian AI terbaru ini. VC dan pendiri di industri yang berdekatan bersatu dalam gagasan masa depan yang didominasi oleh kecerdasan buatan.
Namun, Talwalkar khawatir laboratorium besar akan menjaga kemajuan ini.
“Dapat dimengerti bahwa laboratorium-laboratorium besar mempunyai alasan kompetitif untuk tetap merahasiakannya, namun kurangnya transparansi ini sangat menghambat kemampuan komunitas riset untuk terlibat dengan ide-ide ini,” katanya. “Saya berharap semakin banyak orang yang berupaya ke arah ini [reasoning models to] maju dengan cepat. Namun meskipun beberapa ide akan datang dari akademisi, mengingat adanya insentif finansial di sini, saya berharap sebagian besar – jika tidak semua – model akan ditawarkan oleh laboratorium industri besar seperti OpenAI.”