Home Teknologi OpenAI gagal memberikan alat penyisihan yang dijanjikan pada tahun 2025

Teknologi

OpenAI gagal memberikan alat penyisihan yang dijanjikan pada tahun 2025

January 1, 2025

Pada bulan Mei lalu, OpenAI mengatakan pihaknya sedang mengembangkan alat yang memungkinkan para pembuat konten menentukan bagaimana mereka ingin karya mereka dimasukkan ke dalam – atau dikecualikan dari – data pelatihan AI-nya. Namun 7 bulan kemudian, fitur ini belum juga muncul.

Disebut Media Manager, alat ini akan “mengidentifikasi teks, gambar, audio, dan video yang dilindungi hak cipta,” kata OpenAI pada saat itu, untuk mencerminkan preferensi pembuat konten “di berbagai sumber.” Hal ini dimaksudkan untuk mencegah beberapa kritik paling keras dari perusahaan, dan berpotensi melindungi OpenAI dari tantangan hukum terkait IP.

Namun orang-orang yang akrab dengan TechCrunch mengatakan bahwa alat tersebut jarang dipandang sebagai peluncuran penting secara internal. “Saya rasa hal ini bukan prioritas,” kata salah satu mantan karyawan OpenAI. “Sejujurnya, saya tidak ingat ada orang yang mengerjakannya.”

Seorang non-karyawan yang mengoordinasikan pekerjaan dengan perusahaan tersebut mengatakan kepada TechCrunch pada bulan Desember bahwa mereka telah mendiskusikan alat tersebut dengan OpenAI di masa lalu, tetapi belum ada pembaruan terkini. (Orang-orang ini menolak untuk disebutkan namanya secara publik saat membahas masalah bisnis rahasia.)

Dan anggota tim hukum OpenAI yang bekerja pada Manajer Media, Fred von Lohmann, beralih ke peran konsultan paruh waktu pada bulan Oktober. OpenAI PR mengonfirmasi kepindahan Von Lohmann ke TechCrunch melalui email.

OpenAI belum memberikan informasi terkini mengenai kemajuan Media Manager, dan perusahaan tersebut melewatkan tenggat waktu yang ditetapkan sendiri untuk memiliki alat tersebut “pada tahun 2025.” (Untuk lebih jelasnya, “pada tahun 2025” dapat diartikan sebagai tahun 2025, namun TechCrunch menafsirkan istilah OpenAI sebagai menjelang 1 Januari 2025.)

masalah kekayaan intelektual

Model AI seperti OpenAI mempelajari pola kumpulan data untuk membuat prediksi — misalnya seseorang yang menggigit burger akan meninggalkan bekas gigitan. Hal ini memungkinkan model untuk mempelajari bagaimana dunia bekerja, sampai taraf tertentu, dengan mengamatinya. ChatGPT dapat menulis email dan esai yang meyakinkan, sementara Sora, pembuat video OpenAI, dapat membuat rekaman yang relatif realistis.

Kemampuan untuk memanfaatkan contoh tulisan, film, dan lainnya untuk menghasilkan karya baru menjadikan AI sangat kuat. Tapi itu juga regurgitatif. Ketika diminta dengan cara tertentu, model – yang sebagian besar dilatih pada halaman web, video, dan gambar yang tak terhitung jumlahnya – menghasilkan hampir salinan data tersebut, yang meskipun “tersedia untuk umum”, tidak dimaksudkan untuk digunakan dengan cara ini.

Misalnya Sora bisa menghasilkan klip yang menampilkan logo TikTok dan karakter video game populer. The New York Times meminta ChatGPT mengutip artikelnya kata demi kata (OpenAI menyalahkan perilaku tersebut pada “meretas“).

Dapat dimengerti bahwa hal ini membuat marah para pembuat konten yang karyanya dimasukkan ke dalam pelatihan AI tanpa izin mereka. Banyak yang telah menjadi pengacara.

OpenAI sedang melawan tuntutan hukum class action yang diajukan oleh seniman, penulis, YouTuber, ilmuwan komputer, dan organisasi berita, yang semuanya mengklaim bahwa startup tersebut melatih karya mereka secara ilegal. Penggugat termasuk penulis Sarah Silverman dan Ta Nehisi-Coates, seniman visual, dan konglomerat media seperti The New York Times dan Radio-Canada, adalah beberapa di antaranya.

OpenAI telah mengupayakan kesepakatan lisensi dengan mitra terpilih, namun tidak semua pembuat konten melihatnya ketentuan sebagai menarik.

OpenAI menawarkan kepada para pembuat beberapa cara khusus untuk “menyisih” dari pelatihan AI-nya. September lalu, perusahaan tersebut meluncurkan formulir pengajuan yang memungkinkan seniman menandai karya mereka untuk dihapus dari set pelatihan di masa mendatang. Dan OpenAI telah lama membiarkan webmaster memblokir bot perayapan web agar tidak mengambil data di seluruh domain mereka.

Namun para pencipta mengkritik metode ini sebagai metode yang serampangan dan tidak memadai. Tidak ada mekanisme penolakan khusus untuk karya tulis, video, atau rekaman audio. Dan formulir penyisihan untuk gambar mengharuskan pengiriman salinan setiap gambar untuk dihapus bersama dengan deskripsi, sebuah proses yang berat.

Media Manager diusulkan sebagai perubahan total — dan perluasan — dari solusi opt-out OpenAI saat ini.

Dalam postingan pengumumannya di bulan Mei, OpenAI mengatakan bahwa Media Manager akan menggunakan “penelitian pembelajaran mesin mutakhir” untuk memungkinkan pembuat dan pemilik konten “memberi tahu [OpenAI] apa yang mereka miliki.” OpenAI, yang mengaku berkolaborasi dengan regulator saat mengembangkan alat tersebut, mengatakan bahwa mereka berharap Media Manager akan “menetapkan standar di seluruh industri AI.”

OpenAI tidak pernah menyebut Media Manager secara publik sejak saat itu.

Seorang juru bicara mengatakan kepada TechCrunch bahwa alat tersebut “masih dalam pengembangan” pada bulan Agustus, tetapi tidak menanggapi permintaan komentar lanjutan pada pertengahan Desember.

OpenAI tidak memberikan indikasi kapan Media Manager akan diluncurkan – atau bahkan fitur dan kemampuan apa yang mungkin digunakan untuk meluncurkannya.

Penggunaan wajar

Dengan asumsi Media Manager benar-benar mencapai titik tertentu, para ahli tidak yakin bahwa hal ini akan menghilangkan kekhawatiran pembuat konten — atau berbuat banyak untuk menyelesaikan pertanyaan hukum seputar penggunaan AI dan IP.

Adrian Cyhan, pengacara kekayaan intelektual di Stubbs Alderton & Markiles, mencatat bahwa Manajer Media seperti yang dijelaskan adalah upaya yang ambisius. Bahkan platform sebesar YouTube dan TikTok berjuang dengan ID konten dalam skala besar. Bisakah OpenAI bekerja lebih baik?

“Memastikan kepatuhan terhadap perlindungan pencipta yang diwajibkan secara hukum dan potensi persyaratan kompensasi yang sedang dipertimbangkan menghadirkan tantangan,” kata Cyhan kepada TechCrunch, “terutama mengingat lanskap hukum yang berkembang pesat dan berpotensi berbeda di yurisdiksi nasional dan lokal.”

Ed Newton-Rex, pendiri Fairly Trained, sebuah organisasi nirlaba yang memberikan sertifikasi bahwa perusahaan AI menghormati hak pencipta, percaya bahwa Manajer Media akan secara tidak adil mengalihkan beban pengendalian pelatihan AI kepada pencipta; dengan tidak menggunakannya, mereka bisa dibilang memberikan persetujuan diam-diam atas karya mereka untuk digunakan. “Sebagian besar pembuat konten tidak akan pernah mendengarnya, apalagi menggunakannya,” katanya kepada TechCrunch. “Namun hal ini akan digunakan untuk membela eksploitasi massal atas karya kreatif yang bertentangan dengan keinginan para pencipta.”

Mike Borella, salah satu ketua kelompok praktik AI MBHB, menunjukkan bahwa sistem opt-out tidak selalu memperhitungkan transformasi yang mungkin dilakukan pada sebuah karya, seperti gambar yang telah di-downsampling. Mereka juga mungkin tidak mengatasi skenario umum dimana platform pihak ketiga menghosting salinan konten pembuat konten, tambah Joshua Weigensberg, pengacara kekayaan intelektual dan media untuk Pryor Cashman.

“Pencipta dan pemilik hak cipta tidak mengontrol, dan seringkali bahkan tidak mengetahui, di mana karya mereka muncul di internet,” kata Weigensberg. “Bahkan jika pencipta memberi tahu setiap platform AI bahwa mereka memilih untuk tidak mengikuti pelatihan, perusahaan-perusahaan tersebut mungkin masih terus melanjutkan dan melatih salinan karya mereka yang tersedia di situs web dan layanan pihak ketiga.”

Media Manager bahkan mungkin tidak terlalu menguntungkan bagi OpenAI, setidaknya dari sudut pandang yurisprudensi. Evan Everist, mitra di Dorsey & Whitney yang berspesialisasi dalam hukum hak cipta, mengatakan bahwa meskipun OpenAI dapat menggunakan alat tersebut untuk menunjukkan kepada hakim bahwa mereka meringankan pelatihannya mengenai konten yang dilindungi IP, Manajer Media kemungkinan besar tidak akan melindungi perusahaan dari kerugian jika hal tersebut terjadi. kedapatan melakukan pelanggaran.

“Pemilik hak cipta tidak mempunyai kewajiban untuk keluar dan terlebih dahulu memberi tahu orang lain untuk tidak melanggar karya mereka sebelum pelanggaran itu terjadi,” kata Everist. “Dasar-dasar undang-undang hak cipta masih berlaku — yaitu, jangan mengambil dan menyalin karya orang lain tanpa izin. Fitur ini mungkin lebih tentang PR dan memposisikan OpenAI sebagai pengguna konten yang beretika.”

Sebuah perhitungan

Dengan tidak adanya Media Manager, OpenAI telah menerapkan filter — meskipun tidak sempurna — untuk mencegah modelnya memuntahkan contoh pelatihan. Dan dalam tuntutan hukum yang mereka hadapi, perusahaan tersebut terus mengklaim perlindungan penggunaan wajar, dengan menyatakan bahwa model-modelnya menciptakan karya yang transformatif, bukan plagiat.

OpenAI bisa saja menang dalam sengketa hak ciptanya.

Pengadilan dapat memutuskan bahwa AI milik perusahaan memiliki 'tujuan transformatif', mengikuti preseden yang ditetapkan sekitar satu dekade lalu dalam gugatan industri penerbitan terhadap Google. Dalam kasus tersebut, pengadilan memutuskan bahwa penyalinan jutaan buku oleh Google untuk Google Buku, sejenis arsip digital, diperbolehkan.

OpenAI punya dikatakan secara terbuka bahwa “tidak mungkin” untuk melatih model AI yang kompetitif tanpa menggunakan materi berhak cipta – baik yang sah atau tidak. “Membatasi data pelatihan pada buku dan gambar domain publik yang dibuat lebih dari satu abad yang lalu mungkin menghasilkan eksperimen yang menarik, namun tidak akan menyediakan sistem AI yang memenuhi kebutuhan masyarakat saat ini,” tulis perusahaan tersebut dalam pengajuannya pada bulan Januari ke House of Lords Inggris. .

Jika pengadilan pada akhirnya menyatakan OpenAI menang, Manajer Media tidak akan mempunyai banyak tujuan hukum. OpenAI tampaknya bersedia mengambil risiko tersebut – atau mempertimbangkan kembali strategi opt-out-nya.

OpenAI gagal memberikan alat penyisihan yang dijanjikan pada tahun 2025

masalah kekayaan intelektual

Penggunaan wajar

Sebuah perhitungan

LEAVE A REPLY Cancel reply

EVEN MORE NEWS

Bill de Blasio berpendapat bahwa pemilihan presiden 2024 'dapat dimenangkan' untuk...

Cara Menonton Nvidia GTC 2025, termasuk keynote CEO Jensen Huang

Puluhan ribu menghadiri protes anti-pemerintah di Serbia

POPULAR CATEGORY

masalah kekayaan intelektual

Penggunaan wajar

Sebuah perhitungan

RELATED ARTICLESMORE FROM AUTHOR

Cara Menonton Nvidia GTC 2025, termasuk keynote CEO Jensen Huang

Pengguna Bluesky Debat Paket seputar data pengguna dan pelatihan AI

Minggu dalam ulasan: SXSW Week berakhir

LEAVE A REPLY Cancel reply

EVEN MORE NEWS

Bill de Blasio berpendapat bahwa pemilihan presiden 2024 'dapat dimenangkan' untuk...

Cara Menonton Nvidia GTC 2025, termasuk keynote CEO Jensen Huang

Puluhan ribu menghadiri protes anti-pemerintah di Serbia

POPULAR CATEGORY

RELATED ARTICLES MORE FROM AUTHOR