Home Teknologi Pengguna Bluesky Debat Paket seputar data pengguna dan pelatihan AI

Pengguna Bluesky Debat Paket seputar data pengguna dan pelatihan AI

9
0
Pengguna Bluesky Debat Paket seputar data pengguna dan pelatihan AI


Jejaring sosial bluesky baru -baru ini menerbitkan proposal di github Menguraikan opsi baru itu dapat memberi pengguna untuk menunjukkan apakah mereka ingin posting dan data mereka dikikis untuk hal -hal seperti pelatihan AI generatif dan pengarsipan publik.

CEO Jay Graber membahas proposal awal pekan ini, sementara di atas panggung di South by Southwest, tetapi menarik perhatian baru pada Jumat malam, setelah dia Diposting tentang hal itu di bluesky. Beberapa pengguna bereaksi dengan alarm terhadap rencana perusahaan, yang mereka lihat sebagai pembalikan desakan Bluesky sebelumnya bahwa itu tidak akan menjual data pengguna kepada pengiklan dan tidak akan melatih AI pada posting pengguna.

“Oh, neraka tidak!” Sketsa Pengguna menulis. “Keindahan platform ini adalah tidak berbagi informasi. Terutama Gen AI. Jangan kau gua sekarang. ”

Graber menjawab bahwa perusahaan AI generatif “sudah menggores data publik dari seluruh web,” termasuk dari Bluesky, karena “Segalanya di Bluesky adalah publik seperti situs web adalah publik.” Jadi dia mengatakan Bluesky berusaha menciptakan “standar baru” untuk mengatur goresan itu, mirip dengan robots.txt File yang digunakan situs web untuk mengomunikasikan izin mereka kepada Web Crawlers.

Debat tentang pelatihan AI dan hak cipta telah menyeret robot.txt menjadi sorotan, antara lain menyoroti fakta bahwa itu tidak dapat ditegakkan secara hukum. Bluesky membingkai standar yang diusulkan sebagai yang akan memiliki “mekanisme dan harapan” yang serupa, memberikan “format yang dapat dibaca mesin, yang diharapkan oleh para aktor yang baik, dan memang membawa bobot etis, tetapi tidak dapat ditegakkan secara hukum.”

Di bawah proposal, pengguna aplikasi bluesky, atau aplikasi lain yang menggunakan yang mendasarinya Atprotocoldapat masuk ke pengaturan mereka dan memungkinkan atau melarang penggunaan data bluesky mereka di empat kategori: AI generatif, bridging protokol (yaitu, menghubungkan berbagai ekosistem sosial), dataset curah, dan pengarsipan web (seperti mesin wayback arsip internet).

Jika pengguna menunjukkan bahwa mereka tidak ingin data mereka digunakan untuk melatih AI generatif, proposal mengatakan, “Perusahaan dan tim peneliti yang membangun set pelatihan AI diharapkan untuk menghormati niat ini ketika mereka melihatnya, baik ketika mengikis situs web, atau melakukan transfer curah menggunakan protokol itu sendiri.”

Molly White, yang menulis kutipan yang dibutuhkan Newsletter dan Web3 hanya akan blog yang bagus, menggambarkan ini Sebagai “proposal yang baik,” dan mengatakan “aneh melihat orang -orang membakar bluesky untuk itu,” karena itu tidak begitu banyak “menyambut dalam pengikisan AI” tetapi lebih “mencoba menambahkan sinyal persetujuan untuk memungkinkan pengguna mengkomunikasikan preferensi untuk goresan yang sudah terjadi.”

“Saya pikir kelemahan dengan ini dan [Creative Commons’] Proposal serupa untuk 'sinyal preferensi' adalah bahwa mereka mengandalkan pencakar untuk menghormati sinyal -sinyal ini dari beberapa keinginan untuk menjadi aktor yang baik, ”lanjut White. “Kami telah melihat beberapa perusahaan ini meledak melewati robot.txt atau materi bajak laut untuk mengikis.”


LEAVE A REPLY

Please enter your comment!
Please enter your name here