Home Teknologi Stability mengklaim model Difusi Stabil terbarunya menghasilkan gambar yang lebih 'beragam'

Stability mengklaim model Difusi Stabil terbarunya menghasilkan gambar yang lebih 'beragam'

35
0
Stability mengklaim model Difusi Stabil terbarunya menghasilkan gambar yang lebih 'beragam'


Menyusul serangkaian kontroversi yang bermula dari gangguan teknis Dan perubahan perizinanstartup AI Stability AI telah mengumumkan rangkaian model pembuatan gambar terbarunya.

Seri Stable Diffusion 3.5 yang baru lebih dapat disesuaikan dan serbaguna dibandingkan teknologi Stability generasi sebelumnya, klaim perusahaan — serta lebih berperforma. Total ada tiga model:

  • Difusi Stabil 3,5 Besar: Dengan 8 miliar parameter, ini adalah model paling kuat yang mampu menghasilkan gambar dengan resolusi hingga 1 megapiksel. (Parameter secara kasar sesuai dengan keterampilan pemecahan masalah model, dan model dengan lebih banyak parameter umumnya berperforma lebih baik dibandingkan model dengan lebih sedikit parameter.)
  • Difusi Stabil 3.5 Turbo Besar: Versi sulingan dari Stable Diffusion 3.5 Large yang menghasilkan gambar lebih cepat, dengan mengorbankan kualitas tertentu.
  • Difusi Stabil 3.5 Medium: Model yang dioptimalkan untuk dijalankan pada perangkat edge seperti ponsel cerdas dan laptop, mampu menghasilkan gambar dengan resolusi mulai dari 0,25 hingga 2 megapiksel.

Meskipun Stable Diffusion 3.5 Large dan 3.5 Large Turbo tersedia saat ini, 3.5 Medium baru akan dirilis pada tanggal 29 Oktober.

Stability mengatakan bahwa model Stable Diffusion 3.5 harus menghasilkan keluaran yang lebih “beragam” – yaitu, gambar yang menggambarkan orang-orang dengan warna kulit dan fitur berbeda – tanpa perlu dorongan “ekstensif”.

“Selama pelatihan, setiap gambar diberi keterangan dengan beberapa versi perintah, dengan perintah yang lebih pendek diprioritaskan,” Hanno Basse, chief technology officer Stability, mengatakan kepada TechCrunch dalam sebuah wawancara. “Hal ini memastikan distribusi konsep gambar yang lebih luas dan beragam untuk setiap deskripsi teks tertentu. Seperti kebanyakan perusahaan AI generatif, kami melatih berbagai macam data, termasuk kumpulan data publik yang difilter dan data sintetis.”

Beberapa perusahaan telah dengan cerdik membangun fitur “diversifikasi” semacam ini ke dalam generator gambar di masa lalu, memicu protes di media sosial. Versi lama dari chatbot Gemini Google, misalnya, akan menampilkan sekelompok tokoh yang ketinggalan jaman untuk petunjuk sejarah seperti “legiun Romawi” atau “senator AS”. Google terpaksa menghentikan sementara pembuatan gambar manusia selama hampir enam bulan sementara mereka mengembangkan perbaikan.

Jika beruntung, pendekatan Stability akan lebih bijaksana dibandingkan pendekatan lainnya. Sayangnya kami tidak dapat memberikan kesan karena Stabilitas tidak menyediakan akses awal.

Kredit Gambar:Stabilitas AI

Generator gambar andalan Stability sebelumnya, Stable Diffusion 3 Medium, adalah dikritik habis-habisan karena artefaknya yang aneh dan kepatuhan yang buruk terhadap petunjuknya. Perusahaan memperingatkan bahwa model Stable Diffusion 3.5 mungkin mengalami kesalahan serupa; mereka menyalahkan trade-off teknik dan arsitektur. Namun Stability juga menegaskan bahwa model ini lebih kuat dibandingkan pendahulunya dalam menghasilkan gambar dalam berbagai gaya berbeda, termasuk seni 3D.

“Variasi yang lebih besar dalam keluaran dari permintaan yang sama dengan benih yang berbeda mungkin terjadi, hal ini disengaja karena membantu mempertahankan basis pengetahuan yang lebih luas dan gaya yang beragam dalam model dasar,” tulis Stability dalam sebuah postingan blog dibagikan dengan TechCrunch. “Namun, akibatnya, petunjuk yang kurang spesifik dapat menyebabkan meningkatnya ketidakpastian dalam keluaran, dan tingkat estetika dapat bervariasi.”

Stabilitas AI
Kredit Gambar:Stabilitas AI

Satu hal yang tidak berubah dengan model baru ini adalah lisensi Stability.

Seperti model Stabilitas sebelumnya, model dalam seri Stable Diffusion 3.5 bebas digunakan untuk tujuan “non-komersial”, termasuk penelitian. Bisnis dengan pendapatan tahunan kurang dari $1 juta juga dapat mengkomersialkannya tanpa biaya. Namun, organisasi dengan pendapatan lebih dari $1 juta harus membuat kontrak dengan Stability untuk mendapatkan lisensi perusahaan.

Stabilitas menyebabkan a mengaduk musim panas ini karena persyaratan penyesuaian yang ketat, yang memberikan (atau setidaknya tampaknya memberi) hak kepada perusahaan untuk memungut biaya untuk model yang dilatih menggunakan gambar dari generator gambarnya. Menanggapi pukulan balik tersebut, perusahaan disesuaikan ketentuannya untuk memungkinkan penggunaan komersial yang lebih liberal. Stabilitas hari ini menegaskan kembali bahwa pengguna adalah pemilik media yang mereka hasilkan dengan model Stabilitas.

“Kami mendorong para pembuat konten untuk mendistribusikan dan memonetisasi karya mereka di seluruh jalur,” Ana Guillén, Wakil Presiden Pemasaran dan Komunikasi di Stability, mengatakan dalam sebuah pernyataan email, “selama mereka memberikan salinan lisensi komunitas kami kepada pengguna tersebut kreasi dan secara jelas menampilkan 'Didukung oleh Stabilitas AI' di situs web terkait, antarmuka pengguna, postingan blog, halaman Tentang, atau dokumentasi produk.”

Difusi Stabil 3.5 Besar dan Difusi 3.5 Besar Turbo dapat dihosting sendiri atau digunakan melalui API Stabilitas dan platform pihak ketiga termasuk Hugging Face, Fireworks, Replication, dan ComfyUI. Stability mengatakan bahwa mereka berencana untuk merilis ControlNets untuk model tersebut, yang memungkinkan penyesuaian, dalam beberapa hari ke depan.

Model stabilitas, seperti kebanyakan model AI, dilatih pada data web publik — beberapa di antaranya mungkin memiliki hak cipta atau lisensi terbatas. Stabilitas dan banyak vendor AI lainnya berpendapat bahwa penggunaan wajar doktrin melindungi mereka dari klaim hak cipta. Namun hal itu tidak menghentikan pemilik data dari mengajukan semakin banyak tuntutan hukum class action.

Stabilitas AI Difusi Stabil 3.5
Kredit Gambar:Stabilitas AI

Stabilitas menyerahkan kepada pelanggan untuk membela diri terhadap klaim hak cipta, dan, tidak seperti beberapa vendor lain, tidak ada pembayaran yang diberikan jika ditemukan bertanggung jawab.

Stabilitas melakukan namun, izinkan pemilik data untuk meminta agar datanya dihapus dari kumpulan data pelatihannya. Pada Maret 2023, artis telah menghapus 80 juta gambar dari data pelatihan Stable Diffusion, menurut perusahaan tersebut.

Ketika ditanya tentang langkah-langkah keamanan seputar misinformasi sehubungan dengan pemilihan umum AS yang akan datang, Stability mengatakan bahwa mereka “telah mengambil – dan terus mengambil – langkah-langkah yang wajar untuk mencegah penyalahgunaan Difusi Stabil oleh pihak-pihak yang tidak bertanggung jawab.” Namun, startup tersebut menolak memberikan rincian teknis spesifik tentang langkah-langkah tersebut.

Mulai bulan Maret, Stability hanya melarang konten yang secara eksplisit “menyesatkan” yang dibuat menggunakan alat AI generatifnya – bukan konten yang dapat memengaruhi pemilu, merusak integritas pemilu, atau yang menampilkan politisi dan tokoh masyarakat.

TechCrunch memiliki buletin yang berfokus pada AI! Daftar di sini untuk mendapatkannya di kotak masuk Anda setiap hari Rabu.


LEAVE A REPLY

Please enter your comment!
Please enter your name here