Pengacara The New York Times dan Daily News, yang menggugat OpenAI karena diduga menghapus karya mereka untuk melatih model AI-nya tanpa izin, mengatakan bahwa para insinyur OpenAI secara tidak sengaja menghapus data yang mungkin relevan dengan kasus tersebut.
Awal musim gugur ini, OpenAI setuju untuk menyediakan dua mesin virtual sehingga penasihat The Times dan Daily News dapat melakukan pencarian konten berhak cipta mereka dalam set pelatihan AI mereka. (Mesin virtual adalah komputer berbasis perangkat lunak yang ada dalam sistem operasi komputer lain, sering kali digunakan untuk tujuan pengujian, pencadangan data, dan menjalankan aplikasi.) Dalam a suratpengacara penerbit mengatakan bahwa mereka dan pakar yang mereka pekerjakan telah menghabiskan lebih dari 150 jam sejak 1 November untuk mencari data pelatihan OpenAI.
Namun pada tanggal 14 November, para insinyur OpenAI menghapus semua data pencarian penerbit yang disimpan di salah satu mesin virtual, menurut surat yang disebutkan di atas, yang diajukan ke Pengadilan Distrik AS untuk Distrik Selatan New York pada Rabu malam.
OpenAI mencoba memulihkan data — dan sebagian besar berhasil. Namun, karena struktur folder dan nama file “tidak dapat diambil kembali” hilang, data yang dipulihkan “tidak dapat digunakan untuk menentukan di mana artikel yang disalin oleh penggugat berita digunakan untuk membuat [OpenAI’s] model, ”sesuai surat itu.
“Penggugat berita telah dipaksa untuk membuat ulang karya mereka dari awal dengan menggunakan banyak waktu kerja dan waktu pemrosesan komputer,” tulis penasihat The Times dan Daily News. “Penggugat berita baru mengetahui kemarin bahwa data yang dipulihkan tidak dapat digunakan dan bahwa pekerjaan para ahli dan pengacara selama seminggu penuh harus dilakukan kembali, itulah sebabnya surat tambahan ini diajukan hari ini.”
Kuasa hukum penggugat menjelaskan bahwa mereka tidak memiliki alasan untuk meyakini bahwa penghapusan tersebut disengaja. Namun mereka mengatakan insiden tersebut menggarisbawahi bahwa OpenAI “berada dalam posisi terbaik untuk mencari kumpulan datanya sendiri” untuk mengetahui potensi pelanggaran konten menggunakan alatnya sendiri.
Juru bicara OpenAI menolak memberikan pernyataan.
Namun Jumat malam, 22 November, penasihat OpenAI mengajukan a tanggapan surat yang dikirim oleh pengacara The Times dan Daily News pada hari Rabu. Dalam tanggapan mereka, pengacara OpenAI dengan tegas menyangkal bahwa OpenAI menghapus bukti apa pun, dan sebaliknya menyatakan bahwa penggugatlah yang harus disalahkan atas kesalahan konfigurasi sistem yang menyebabkan masalah teknis.
“Penggugat meminta perubahan konfigurasi pada salah satu dari beberapa mesin yang disediakan OpenAI untuk mencari kumpulan data pelatihan,” tulis penasihat OpenAI. “Melaksanakan perubahan yang diminta penggugat, bagaimanapun, mengakibatkan penghapusan struktur folder dan beberapa nama file pada satu hard drive — drive yang seharusnya digunakan sebagai cache sementara… Bagaimanapun, tidak ada alasan untuk menganggap bahwa file apa pun benar-benar hilang.”
Dalam kasus ini dan kasus lainnya, OpenAI menyatakan bahwa model pelatihan yang menggunakan data yang tersedia untuk umum – termasuk artikel dari The Times dan Daily News – adalah penggunaan wajar. Dengan kata lain, dalam membuat model seperti GPT-4o, yang “belajar” dari miliaran contoh e-book, esai, dan lainnya untuk menghasilkan teks yang terdengar manusiawi, OpenAI percaya bahwa model tersebut tidak perlu melisensikan atau membayarnya. contohnya — bahkan jika model tersebut menghasilkan uang.
Meskipun demikian, OpenAI telah menandatangani kesepakatan lisensi dengan semakin banyak penerbit baru, termasuk Associated Press, pemilik Business Insider Axel Springer, Financial Times, perusahaan induk People Dotdash Meredith, dan News Corp. OpenAI telah menolak untuk memenuhi persyaratan ini bertransaksi secara publik, tetapi salah satu mitra konten, Dotdash, yang melakukannya dilaporkan dibayar setidaknya $16 juta per tahun.
OpenAI tidak mengonfirmasi atau menyangkal bahwa mereka melatih sistem AI-nya pada karya berhak cipta tertentu tanpa izin.
Pembaruan: Menambahkan tanggapan OpenAI terhadap tuduhan tersebut.