ChatGPT entrena su inteligencia artificial con las noticias de estos diez periódicos españoles

Estos son los diez periódicos generalistas españoles a los que ChatGPT (OPEN AI) escrapea para entrenar con noticias su inteligencia artificial generativa. EL PAÍS y EL MUNDO son dos de ellos, pero hay ocho más.

Una investigación de THE WASHINGTON POST desveló el dataset C4 con que Google entrena su inteligencia artificial (IA) con escrapeos del contenido creado por varios mercados de las industrias digitales.

El sector de los medios, por ejemplo, es uno de ellos y representan más del 13% del total del contenido escrapeado, con players como THE NEW YORK TIMES, FORBES, THE GUARDIAN o el mencionado THE WASHINGTON POST entre los más usados para mejorar la IA.

Es un especial éste, del Post, que pone de manifiesto cómo bebe de contenidos ajenos esta nueva tecnología disruptiva.

Al margen de esta investigación del Post, ReddePeriodistas.com quiso comprobar si ChatGPT nos desvelaba qué periódicos generalistas españoles utilizó -y utiliza- para elevar la calidad de las preguntas que les realizan los usuarios que conversan con su tecnología.

Los diez periódicos españoles que entrenan a ChatGPT

La respuesta del chatbot de OPEN AI, ahora integrado en el buscador BING de MICROSOFT, fue la siguiente.

ChatGPT explicita que «se entrena con una gran variedad de textos», de los cuales se incluye «noticias de diferentes periódicos generalistas» de nuestro país, como los diez que enumera, según el prompt al que le hemos sometido.

ChatGPT matiza, asimismo, que «estos periódicos pueden ser una fuente de entrenamiento útil para mejorar respuestas», pero que su «selección» puede variar en función del «modelo específico utilizado y del conjunto de datos de entrenamiento empleado».

Periódicos Generalistas:

  1. El País
  2. El Mundo
  3. ABC
  4. La Vanguardia
  5. El Periódico de Catalunya
  6. El Diario
  7. La Razón
  8. Público
  9. El Confidencial
  10. 20 Minutos

Cuando se le consulta de nuevo, pero excluimos a dichas cabeceras, pero solicitamos otras diez deportivas y otras diez económicas, el espectro es así de amplio:

Periódicos deportivos:

  1. Marca
  2. As
  3. Mundo Deportivo
  4. Sport
  5. Superdeporte
  6. Diario Gol
  7. Estadio Deportivo
  8. El Desmarque
  9. Don Balón
  10. La Grada

Periódicos Económicos:

  1. Expansión
  2. Cinco Días
  3. El Economista
  4. La Vanguardia (sección Economía)
  5. Invertia
  6. El Confidencial (sección Economía)
  7. Bolsamanía
  8. Economía Digital
  9. El Boletín
  10. ABC (sección Economía)

Cuando, por último, le pedimos que nos enumere -sin límites- todos los periódicos que rastrea para compilar sus respuestas, sean españoles o no, nos da los 15 que detallamos a continuación:

  1. The New York Times (Estados Unidos)
  2. The Guardian (Reino Unido)
  3. Le Monde (Francia)
  4. El País (España)
  5. The Washington Post (Estados Unidos)
  6. The Times (Reino Unido)
  7. Süddeutsche Zeitung (Alemania)
  8. The Wall Street Journal (Estados Unidos)
  9. La Vanguardia (España)
  10. Der Spiegel (Alemania)
  11. Financial Times (Reino Unido)
  12. El Mundo (España)
  13. Corriere della Sera (Italia)
  14. ABC (España)
  15. Frankfurter Allgemeine Zeitung (Alemania)

Estos listados ponen de manifiesto que la inteligencia artificial generativa, en este caso la de OPEN AI, escrapea y reutiliza las noticias de los medios para afinar la precisión en sus conversaciones.

Recordemos que ya en Estados Unidos, muchos editores están reclamando que se les retribuya en concepto de derechos de propiedad intelectual (copyright) por tal motivo.

En el caso de la legislación homóloga en España, y en la Unión Europea, tanto el input como el output (escaneo y reutilización) están sujetas a un doble pago por la minería de textos (noticias) y el posterior uso de dicho contenido (respuestas).

Los propietarios de los derechos de explotación (medios de comunicación) serían los tenedores y receptores de estos royalties.


📩 Suscríbete a nuestra newsletter semanal que ya leen 1.200 directivos de los medios


▶︎ Conversa con discover GPT Pro, chatbot de IA entrenado para ganar audiencia en Google Discover

▶︎ Apúntate al canal de WhatsApp de #ReddePeriodistas

Cómo Ganar Audiencia con Google Discover