Claudeが生きるために、何百万冊もの本が犠牲になった

The Verge
Anthropicは、大規模言語モデルを訓練するために膨大な量の書籍をデジタル化する「プロジェクト・パナマ」に着手しました。

概要

ChatGPTのローンチ後、テクノロジー企業は独自の高度なAIを開発するために奔走し、Anthropicは「プロジェクト・パナマ」を開始しました。この大規模な取り組みには、Claudeを搭載した大規模言語モデルに供給するため、膨大な量の書籍へのアクセスとデジタル化が含まれていました。その手法には、書籍カッターの使用、海賊版ウェブサイトへのアクセス、巨大な倉庫の利用などが含まれていたと報じられています。この記事は、この積極的なアプローチが他の企業の取り組みと類似していること、そしてこれらのデータ取得慣行をめぐる法的および道徳的な議論が続いていることを指摘しています。このエピソードでは、Netflixによるワーナー・ブラザース買収の試みと映画館の将来、そしてIKEAの新しいスマートボタンの問題についても簡単に触れています。

(出典:The Verge)