コンテンツをコントロールし、RSL 標準で収益化しましょう

VP Strategic Initiatives, Fastly

ここ数年で生じた、Web 上でのコンテンツ制作や利用の方法の根本的な変化を見逃すことはできません。AI は、このテーマに関する意見がどうであれ、AI 至上主義者や AGI (汎用 AI) エバンジェリスト、AI 愛好家、一方で懐疑論者や否定論者、ロボットによる終末論を唱える悲観論者がいる中で、常に話題に上るテーマのように感じられます。
真実はおそらくその中間あたりにあるでしょう。しかし、否定できないのは、スクレイパーやクローラーの役割と、それらが収集したデータがどのように利用されるかについての議論です。
まず第一に、著作権侵害という非常に正当な問題があります。大規模言語モデルはどれほどの変革をもたらすのでしょう。Pablo Picasso がかつて「優れた芸術家は模倣し、偉大な芸術家は盗む」と冗談めかして言ったように、芸術の歴史が先人たちから得たインスピレーションの再創造と再解釈によって支えられてきたことは否定しがたいことです。あらゆる芸術形式の系譜をたどると、世代を超えて絶え間ない進化が見られます。そして、より小規模なレベルでは、どれだけ多くの若きアーティストたちが、お気に入りの絵画や漫画を模写することからキャリアをスタートさせたのでしょうか。どれくらいのバンドが、お気に入りの曲のカバーから始めたのでしょうか。
それでも、これはまた違うように感じます。コンテンツをスクレイピングして、機械的・数学的に再構成して複製物を作り出す行為は、オマージュとは感じられません。直感的には、盗んでいるように感じられます。
一方、同じクローラーが、しばしば不適切に動作します。robots.txt のような確立された標準を無視し、IP アドレスを隠蔽し、サイトを繰り返し攻撃しています [1, 2, 3]。さらに悪いことに、トラフィックのコストはより高価になっています。Wikipedia によると、ボットは全トラフィックの 35% を占めるにもかかわらず、全リソースの 65% を消費しています。
それは不公平で理不尽に感じられ、AI 愛好家でさえも、多くの人がバランスを是正するために何かをするべきだと考えています。
RSL 標準(Really Simple Licensing) を入力してください。これは、「Web サイト、Web ページ、書籍、動画、画像、音楽、独自のデータなどのデジタル資産の機械可読なコンテンツライセンスおよび利用条件を定義するためのオープンな XML ベースのドキュメント形式」です。
これは、パブリッシャー、著者、アプリケーション開発者がライセンスおよび利用条件を容易に定義できるようにするための標準的なコンピューターによる読み取りが可能な形式を提供するように設計されています。これにより、ユーザーとボットが、AI トレーニング、Web 検索、その他のアプリケーションでデジタル資産を活用するための標準化されたライセンスおよびロイヤルティ契約を利用できます。また、クライアントがデジタル資産への合法的なアクセス権を自動的にライセンス取得し、支払いを行うための仕組みも備えています。
仕組み
本質的に、RSL は非常にシンプルで、必要なコンポーネントは2つだけで、そのうち1つはオプションです。
一つ目は XML で定義されたライセンスファイルです。その後、robots.txt でファイルを指定することができます。
License: https://your-website.com/license.xml
または HTTP レスポンスヘッダーとして
Link: https://your-website.com/license.xml; rel="license";
type="application/rsl+xml"
あるいは、さまざまなファイル形式で埋め込みやリンクが可能です。
ライセンスファイルにより、コンテンツの消費方法を完全にコントロールできるようになります。クリエイティブコモンズを通じて帰属表示を求めるだけという、ごく簡単な方法も可能です。
<rsl xmlns="https://rslstandard.org/rsl">
<content url="/">
<license>
<payment type="attribution">
<standard>https://creativecommons.org/licenses/by/4.0/</standard>
</payment>
</license>
</content>
</rsl>
あるいは、AI ボットがあなたのコンテンツで無料でトレーニングすることを許可することもできます。
<rsl xmlns="https://rslstandard.org/rsl">
<content url="/">
<license>
<permits type="usage">ai</permits>
</license>
</content>
</rsl>
あるいは逆に、それを禁止することも可能です。
<prohibits type="usage">ai</prohibits>
あるいは、アクセスを有料化したい場合、ここで二つ目のオプションのコンポーネントが機能し、状況は少し複雑になります。
お金を見せてください
ボットにコンテンツの閲覧を許可するか拒否するかは一つの問題ですが、コンテンツをクロールさせつつ、その対価として報酬を受け取りたい場合はどうでしょうか。RSL がサポートできます。
選択肢は、サブスクリプション、購入、もしくはロイヤリティの3つがあり、それらの交渉方法には柔軟性があります。繰り返しますが、すべてライセンスファイルから処理されます。
たとえば、サイトの問い合わせフォームから送信されるサブスクリプションを要求することもできます。
<license>
<permits type="usage">ai</permits>
<payment type="subscription">
<custom>https://your-website.com/contact-form.html</custom>
</payment>
</license>
あるいは、コンテンツの費用をボットに伝えることもできます。
<content url="/videos" server="https://example-server.org/api">
<license>
<payment type="purchase">
<amount currency="USD">10</amount>
</payment>
</license>
</content>
これにはライセンスサーバーが必要です。これらはどこにでもホストできますが、RSL Internet Collective がホストを提供することもあります。ライセンスサーバーは、ライセンスを所有するユーザーに対して復号化キーを取得する機能も提供します
<content url="https://example.com/books/example_book.epub.aes"
encrypted="true" server="https://example-server.org/api">
<license>
<permits type="usage">ai</permits>
<payment type="royalty">
<standard>https://rslcollective.org/license</standard>
</payment>
</license>
</content>
すでに Fastly との統合は可能ですか?
もちろんです!
以下では、VCL で非常にシンプルな実装方法を示しますが、JavaScript、Go、Rust での Compute でも同様に簡単に実装できるはずです。
まず、コンテンツメニューで、ライセンスファイルへのリンクを提供する新しいレスポンスヘッダーを作成します。
ソースの周囲の{" "}ではありません。これは、文字列内でリテラル引用符を許可するための VCL シンタックスです。

次に、引き続きコンテンツメニュー内でレスポンスを作成します (「詳細なレスポンスの設定」をクリックする必要があります)。そのパネルで、URL が license.xml かどうかを確認する条件を作成します。

次に、残りのレスポンスに希望するライセンスを入力します。ここでは帰属表示ライセンスを選択しました。

これで終了です。それを保存してサービスをデプロイしてください。
今後の展望
将来的には、さらに緊密な統合を行い、より簡単にする予定ですが、それまでは、ご自身でお試しいただく機会を提供したいと考えています。
注意が必要です。他にもさまざまな標準が、さまざまな完成度とオープン性で提案されています。一般的に、類似した独自のメカニズムを提案するよりも、オープン標準のプロセスで作業することが好まれますが、需要が高まることが確認された場合には、他のプロバイダーとの連携やドキュメントの提供も行います。
コンテンツ権利の未来における報酬役割について詳しくは、当社のブログ「AI トレーニングに著作権者へ支払うことが不可欠な理由」をご覧ください。