Teknologi

Anthropic Disebut Tengah Cacah Jutaan Buku Fisik untuk Latih AI Claude

×

Anthropic Disebut Tengah Cacah Jutaan Buku Fisik untuk Latih AI Claude

Sebarkan artikel ini
Ilustrasi AI | Foto: Freepik

JAKARTA, TINTAHIJAU.com — Perusahaan kecerdasan buatan (AI) Anthropic dilaporkan mencacah jutaan buku fisik secara diam-diam untuk melatih model AI andalannya, Claude. Fakta ini terungkap dari sejumlah dokumen internal perusahaan yang dibuka ke publik dalam proses hukum gugatan penulis terhadap Anthropic.

Praktik tersebut merupakan bagian dari inisiatif rahasia bertajuk Project Panama, yang terungkap setelah sekelompok penulis mengajukan gugatan hukum terhadap Anthropic. Kasus ini kemudian diselesaikan melalui jalur damai dengan nilai mencapai USD 1,5 miliar pada Agustus 2025. Sejak itu, pengadilan memerintahkan pembukaan lebih banyak dokumen, yang mengungkap proses di balik pengumpulan data pelatihan AI tersebut.

Dalam dokumen gugatan, terungkap bahwa pimpinan Anthropic memandang buku sebagai sumber penting untuk melatih AI agar mampu menulis dengan baik dan tidak sekadar meniru gaya bahasa internet. Salah satu cara yang ditempuh adalah dengan membeli jutaan buku bekas, memindainya, lalu menghancurkan fisik buku-buku tersebut.

Anthropic disebut menggunakan mesin pemotong hidrolik untuk mencacah buku-buku yang diperoleh dari pengecer buku bekas. Setelah dipotong rapi, halaman-halaman buku dipindai menggunakan pemindai produksi berkecepatan tinggi, sebelum akhirnya sisa buku yang telah tercacah diangkut oleh perusahaan daur ulang.

Praktik ini dinilai memanfaatkan celah hukum berupa doktrin first sale atau penjualan pertama, yang memungkinkan pembeli suatu barang melakukan apa pun terhadap barang yang telah dibeli, termasuk menghancurkannya, tanpa campur tangan pemegang hak cipta. Seorang hakim menilai bahwa konversi buku fisik ke format digital tersebut dapat dikategorikan sebagai penggunaan wajar (fair use), sehingga Anthropic tidak diwajibkan membayar royalti kepada penulis.

Meski demikian, dokumen internal menunjukkan adanya kekhawatiran di kalangan pimpinan perusahaan terkait dampak reputasi jika praktik ini diketahui publik. Dalam perencanaan internal tahun 2024, Anthropic disebut tidak ingin aktivitas tersebut terekspos ke luar.

Sebelum beralih ke buku fisik, Anthropic juga diketahui pernah mengandalkan sumber buku digital. Pada 2021, salah satu pendirinya, Ben Mann, disebut mengunduh jutaan buku dari situs LibGen yang berisi koleksi teks bajakan. Setahun kemudian, ia juga memuji situs Pirate Library Mirror, yang secara terbuka mengakui pelanggaran hak cipta di banyak negara.

Anthropic bukan satu-satunya perusahaan AI yang terseret isu serupa. Dalam gugatan penulis lainnya, terungkap bahwa Meta juga dituding menggunakan jutaan buku dari perpustakaan bayangan seperti LibGen untuk melatih model AI-nya. Sejumlah karyawan internal bahkan sempat mengingatkan potensi reaksi negatif publik dan dampaknya terhadap posisi perusahaan dalam negosiasi dengan regulator.

Kasus ini kembali memicu perdebatan global terkait etika, hukum, dan hak cipta dalam pengembangan teknologi kecerdasan buatan yang semakin masif.

Sumber: detikINET