Volver al blog

Síguenos y suscríbete

Controla y rentabiliza tu contenido con la norma RSL

Simon Wistow

Vicepresidente de Strategic Initiatives, Fastly

Una ilustración de un teclado con una palanca en el medio y una mano empujando la palanca hacia adelante

Es imposible no haber notado el cambio fundamental en la forma en que se produce y consume contenido en la web en los últimos años. La IA, no importa cuáles sean tus opiniones al respecto, parece un tema de conversación omnipresente, con maximalistas de la IA, evangelistas de la AGI y entusiastas por un lado, y escépticos, detractores y agoreros del apocalipsis robótico por otro.

La verdad probablemente esté en algún punto intermedio. Pero una cosa que es innegable es el debate sobre el papel de los scrapers y crawlers y cómo se utilizan los datos que recopilan. 

En primer lugar, está la cuestión muy legítima de la infracción de los derechos de autor. ¿Hasta qué punto son transformadores los modelos de lenguaje de gran tamaño? Como bromeó una vez Pablo Picasso, «los buenos artistas copian; los grandes artistas roban», y es difícil negar que la historia del arte ha sido impulsada por la reinvención y reinterpretación de las inspiraciones de sus antepasados. Rastrear el linaje de cualquier forma de arte muestra una evolución constante a través de generaciones. Y, a menor escala,  ¿cuántos artistas jóvenes comenzaron copiando sus imágenes o cómics favoritos? ¿Cuántas bandas empezaron haciendo versiones de sus canciones favoritas? 

Y, sin embargo, esto sigue pareciendo diferente. Extraer contenido para remezclarlo mecánica y matemáticamente y convertirlo en un facsímil no parece un homenaje, sino, a nivel visceral, un robo. 

Mientras tanto, los mismos rastreadores también suelen comportarse mal, ignorando normas bien establecidas como robots.txt, esforzándose por ocultar sus direcciones IP, machacan los sitios repetidamente [1, 2, 3]. Peor aún, el tráfico es más caro: Wikipedia informa que, aunque los bots representan el 35 % de todo el tráfico, consumen el 65 % de todos los recursos.   

Se siente desigual e injusto, y muchas personas, incluso aquellos que son entusiastas de la IA, piensan que se debe hacer algo para corregir el desequilibrio.

Presentamos la norma RSL (Really Simple Licensing). Es "un formato de documento abierto basado en XML para definir las condiciones de licencia y uso de contenido legibles por máquina para los activos digitales, incluidos sitios web, páginas web, libros, vídeos, imágenes, música y datos propietarios."

Está diseñado para proporcionar una norma, legible por máquina, que permita a las editoriales, autores y desarrolladores de aplicaciones definir fácilmente los términos de licencia y uso, de modo que los usuarios y los bots puedan utilizar activos digitales para el entrenamiento de IA, la búsqueda web y otras aplicaciones, utilizando acuerdos estandarizados de licencias y regalías, así como un mecanismo para que los clientes puedan licenciar y pagar automáticamente por el acceso legal a los activos digitales.

¿Cómo funciona?

En su esencia, el RSL es muy simple y solo necesita dos componentes, uno de los cuales es opcional. 

El primero es un archivo de licencia, definido en XML. Luego puedes señalar el archivo en tu robots.txt

License: https://your-website.com/license.xml

O como un encabezado de respuesta HTTP

Link: https://your-website.com/license.xml; rel="license"; 
type="application/rsl+xml"


O se puede incrustar o enlazar en varios formatos de archivo. 

El archivo de licencia te da control total sobre cómo se consume tu contenido. Puede ser tan sencillo como solicitar la atribución mediante Creative Commons

<rsl xmlns="https://rslstandard.org/rsl">
  <content url="/">
    <license>
      <payment type="attribution">
        <standard>https://creativecommons.org/licenses/by/4.0/</standard>
      </payment>
    </license>
  </content>
</rsl>


O puedes permitir que los bots de IA se entrenen en tu contenido de forma gratuita 

<rsl xmlns="https://rslstandard.org/rsl">
  <content url="/">
    <license>
      <permits type="usage">ai</permits>
    </license>
  </content>
</rsl>


O, por el contrario, prohíbelo

<prohibits type="usage">ai</prohibits>

O si quieres cobrar por el acceso, aquí es donde entra en juego el segundo componente opcional y las cosas se vuelven un poco más complicadas.

Muéstrame el dinero

Permitir o denegar que los bots lean tu contenido es una cosa, pero ¿qué pasa si deseas que se rastree tu contenido, pero también quieres que te paguen por ello? RSL te cubre.

Tienes tres opciones: suscripción, compra o regalía, y flexibilidad en cómo se negocian. De nuevo, todo se gestiona desde el archivo de licencia. 

Por ejemplo, podrías requerir una suscripción que provenga de un formulario de contacto en tu sitio web.

<license>
  <permits type="usage">ai</permits>
  <payment type="subscription">
    <custom>https://your-website.com/contact-form.html</custom>
  </payment>
</license>

O puedes decirle al bot cuánto les costará el contenido

<content url="/videos" server="https://example-server.org/api">
  <license>
    <payment type="purchase">
      <amount currency="USD">10</amount>
    </payment>
  </license>
</content>

Esto requiere un servidor de licencias. Estos se pueden alojar en cualquier lugar o el RSL Internet Collective te proporciona uno. Los servidores de licencias también permiten obtener una clave de descifrado para alguien con una licencia

<content url="https://example.com/books/example_book.epub.aes" 
         encrypted="true" server="https://example-server.org/api">
  <license>
    <permits type="usage">ai</permits>
    <payment type="royalty">
      <standard>https://rslcollective.org/license</standard>
    </payment>
  </license>
</content>

¿Puedes integrarlo ya con Fastly?

¡Claro que sí! 

A continuación, encontrarás cómo implementar una versión muy sencilla en VCL, pero debería ser igual de fácil hacerlo en Compute con JavaScript, Go y Rust.

Primero, en el menú Contenido,  crea un nuevo encabezado de respuesta que proporcione un enlace a tu archivo de licencia.

No el {" "} alrededor de la Source. Esta es la sintaxis de VCL para permitir comillas literales en cadenas.

Luego, aún en Contenido, crea una Respuesta (tendrás que hacer clic en "Configurar respuesta avanzada"). En ese panel, crea una condición que verifique si la URL es license.xml

Luego rellena el resto de la respuesta con la licencia que quieras. Aquí he elegido una Licencia de Atribución.

Y eso es todo. Guárdalo y despliega tu servicio.

Qué es lo siguiente

En el futuro, haremos una integración mucho más estrecha para que sea aún más fácil, pero mientras tanto, queríamos darte la oportunidad de que lo pruebes por ti mismo.

Cabe señalarlo. Hay varios otras normas que se están proponiendo en varios estados de finalización y apertura. En general, preferimos trabajar con un proceso de estándares abiertos en lugar de proponer mecanismos similares pero propietarios, aunque también proporcionaremos documentación e integraciones con otros proveedores si resultan populares. 

Lee más sobre cómo encaja la compensación en el futuro de los derechos de contenido en nuestro blog: Por qué pagar a los titulares de derechos de autor por la capacitación en IA es esencial.