Menjelang liburan, Microsoft dikatakan itu adalah peningkatan model AI di balik Bing Image Creator, alat pengeditan gambar bertenaga AI yang terpasang di mesin pencari Bing perusahaan. Microsoft berjanji bahwa model baru ini – versi terbaru dari model DALL-E 3 OpenAI, dengan nama kode “PR16” – akan memungkinkan pengguna membuat gambar “dua kali lebih cepat dari sebelumnya” dengan “kualitas lebih tinggi.”
Tapi itu tidak berhasil. Keluhan dengan cepat membanjiri X dan Reddit.
“DALL-E yang dulu kita cintai telah hilang selamanya,” dikatakan satu Redditor. “Saya menggunakan ChatGPT sekarang karena Bing menjadi tidak berguna bagi saya,” menulis lain.
Pukulan baliknya sedemikian rupa sehingga Microsoft mengatakan akan mengembalikan model sebelumnya ke Bing Image Creator hingga dapat mengatasi masalah tersebut.
kembalikan dalle 3 yang lama! kualitas gambar jauh lebih baik pada model lama. seperti gambar ini misalnya. gambar yang dihasilkan oleh model baru jelek 🙁 pic.twitter.com/BjIM8MS4ng
— ze rigrowl (@riegrowl) 28 Desember 2024
“Kami sudah mampu melakukannya [reproduce] beberapa masalah yang dilaporkan, dan berencana untuk kembali ke [DALL-E 3] PR13 hingga kami dapat memperbaikinya,” Jordi Ribas, kepala pencarian di Microsoft, dikatakan dalam postingan pada Selasa malam X. “Sayangnya, proses penerapannya sangat lambat. Ini dimulai lebih dari seminggu yang lalu dan akan memakan waktu 2-3 minggu lagi untuk mencapai 100%.”
Jadi apa yang salah?
Sulit untuk membandingkan keluaran model dari laporan anekdotal, terutama jika petunjuknya tidak terstandarisasi. Namun banyak pengguna mengatakan bahwa PR16 cenderung membuat gambar terlihat kurang realistis – dan “tidak bernyawa.” Mayank Parmar, menulis untuk Windows Terbarumencatat bahwa gambar yang dihasilkan PR16 kurang detail dan halus, dan tampak seperti kartun.
Saya tidak tahu siapa yang Anda pikir Anda bercanda dengan ini. DALL-E secara objektif lebih buruk daripada sebelumnya setelah “pembaruan” ini dan Anda dikalahkan oleh perusahaan lain seperti Google. Benar-benar siang dan malam membandingkan kualitas gambar sekarang dengan beberapa bulan yang lalu pic.twitter.com/EdSdk7aign
— ke luar (@roccynoxy) 19 Desember 2024
Ini bukan pertama kalinya model foto yang mungkin lolos pemeriksaan internal tidak diterima publik dengan baik. Pada bulan Februari lalu, Google terpaksa menghentikan kemampuan AI chatbot Gemini untuk membuat gambar orang setelah pengguna mengeluhkannya historis ketidakakuratan.
Kesalahan langkah ini menggambarkan betapa sulitnya mengukur peningkatan model di dunia nyata. Menurut Ribas, benchmarking Microsoft menemukan kualitas PR16 “rata-rata sedikit lebih baik” dibandingkan dengan model Bing Image Creator sebelumnya.
Apa pun metrik internal yang digunakan perusahaan, tampak jelas bahwa metrik tersebut tidak sejalan dengan preferensi kebanyakan orang.