Home Teknologi OpenAI secara tidak sengaja menghapus bukti potensial dalam gugatan hak cipta NY...

OpenAI secara tidak sengaja menghapus bukti potensial dalam gugatan hak cipta NY Times

24
0
OpenAI secara tidak sengaja menghapus bukti potensial dalam gugatan hak cipta NY Times


Pengacara The New York Times dan Daily News, yang menggugat OpenAI karena diduga menghapus karya mereka untuk melatih model AI-nya tanpa izin, mengatakan bahwa para insinyur OpenAI secara tidak sengaja menghapus data yang mungkin relevan dengan kasus tersebut.

Awal musim gugur ini, OpenAI setuju untuk menyediakan dua mesin virtual sehingga penasihat The Times dan Daily News dapat melakukan pencarian konten berhak cipta mereka dalam set pelatihan AI mereka. (Mesin virtual adalah komputer berbasis perangkat lunak yang ada dalam sistem operasi komputer lain, sering kali digunakan untuk tujuan pengujian, pencadangan data, dan menjalankan aplikasi.) Dalam sebuah surat, pengacara penerbit mengatakan bahwa mereka dan pakar yang mereka pekerjakan telah mengeluarkan biaya lebih dari 150 jam sejak 1 November mencari data pelatihan OpenAI.

Namun pada tanggal 14 November, para insinyur OpenAI menghapus semua data pencarian penerbit yang disimpan di salah satu mesin virtual, menurut surat yang disebutkan di atas, yang diajukan ke Pengadilan Distrik AS untuk Distrik Selatan New York pada Rabu malam.

OpenAI mencoba memulihkan data — dan sebagian besar berhasil. Namun, karena struktur folder dan nama file “tidak dapat diambil kembali” hilang, data yang dipulihkan “tidak dapat digunakan untuk menentukan di mana artikel yang disalin oleh penggugat berita digunakan untuk membuat [OpenAI’s] model, ”sesuai surat itu.

“Penggugat berita telah dipaksa untuk membuat ulang karya mereka dari awal dengan menggunakan banyak waktu kerja dan waktu pemrosesan komputer,” tulis penasihat The Times dan Daily News. “Penggugat berita baru mengetahui kemarin bahwa data yang dipulihkan tidak dapat digunakan dan bahwa pekerjaan para ahli dan pengacara selama seminggu penuh harus dilakukan kembali, itulah sebabnya surat tambahan ini diajukan hari ini.”

Kuasa hukum penggugat menjelaskan bahwa mereka tidak mempunyai alasan untuk meyakini bahwa penghapusan tersebut disengaja. Namun mereka mengatakan insiden tersebut menggarisbawahi bahwa OpenAI “berada dalam posisi terbaik untuk mencari kumpulan datanya sendiri” untuk mengetahui potensi pelanggaran konten menggunakan alatnya sendiri.

Juru bicara OpenAI menolak memberikan pernyataan.

Dalam kasus ini dan kasus lainnya, OpenAI menyatakan bahwa model pelatihan yang menggunakan data yang tersedia untuk umum – termasuk artikel dari The Times dan Daily News – adalah penggunaan wajar. Dengan kata lain, dalam membuat model seperti GPT-4o, yang “belajar” dari miliaran contoh e-book, esai, dan lainnya untuk menghasilkan teks yang terdengar manusiawi, OpenAI percaya bahwa model tersebut tidak perlu melisensikan atau membayarnya. contohnya — bahkan jika model tersebut menghasilkan uang.

Meskipun demikian, OpenAI telah menandatangani kesepakatan lisensi dengan semakin banyak penerbit baru, termasuk Associated Press, pemilik Business Insider Axel Springer, Financial Times, perusahaan induk People Dotdash Meredith, dan News Corp. OpenAI telah menolak untuk memenuhi persyaratan ini bertransaksi secara publik, tetapi salah satu mitra konten, Dotdash, yang melakukannya dilaporkan dibayar setidaknya $16 juta per tahun.

OpenAI tidak mengonfirmasi atau menyangkal bahwa mereka melatih sistem AI-nya pada karya berhak cipta tertentu tanpa izin.


LEAVE A REPLY

Please enter your comment!
Please enter your name here