-
El secretario de Defensa de EEUU obtiene la renuncia del jefe del Ejército de Tierra
-
Toyota bZ7: Lujo eléctrico en China
-
París suspende a 31 monitores escolares en tres meses por presuntos abusos sexuales
-
Los burkineses deben "olvidarse" de la democracia, advierte el jefe de la junta
-
Varios heridos en Alemania luego de que un hombre detonara pirotecnia en un tren de alta velocidad
-
Una nueva misión a Gaza de la flotilla propalestina comenzará en España el 12 de abril
-
Un comité de urbanismo aprueba el salón de baile de Trump, pero sigue bloqueado por un juez
-
"España no es un país racista", afirma el técnico madridista Arbeloa tras incidentes en Barcelona
-
Cuba, bajo fuerte presión de EEUU, anuncia el indulto de 2.010 prisioneros
-
Arbeloa desmiente un error de diagnóstico en la lesión de Mbappé
-
Secretario de Defensa de EEUU obtiene la renuncia del jefe del Ejército de Tierra
-
Irán ataca a Israel y Trump amenaza con bombardear puentes y centrales eléctricas
-
El jefe de la junta militar de Birmania se mantiene en el poder, ahora como presidente
-
El Consejo de Seguridad de la ONU aplaza la votación para autorizar el uso de la fuerza en Ormuz
-
Aplazan a enero el juicio federal contra el acusado de matar a un alto ejecutivo en EEUU
-
Cinco muertos en un atentado suicida en Pakistán
-
Microsoft invertirá USD 10.000 millones en centros de datos en Japón
-
Los pueblos costeros españoles prueban nuevas recetas para salvar sus playas
-
Filipinos acuden en masa a la crucifixión del Viernes Santo pese a un combustible por las nubes
-
Corea del Norte celebrará funeral por los soldados caídos en la guerra de Ucrania
-
Corea del Norte celebrará fueneral por los soldados caídos en la guerra de Ucrania
-
Irán golpea infraestructuras en el Golfo tras prometer ataques "devastadores" a EEUU e Israel
-
Los astronautas de Artemis II encienden motores hacia la Luna
-
Trump despide a su fiscal general, Pam Bondi
-
Irán promete ataques "devastadores" contra EEUU tras las amenazas de Trump
-
Trump llama a boicotear los conciertos de Bruce Springsteen, una "ciruela pasa reseca"
-
Cubanos piden frente a embajada de EEUU en La Habana el fin del bloqueo
-
¿Vuelve la ocupación israelí del sur del Líbano?
-
Cuatro astronautas siguen hacia la Luna por primera vez en medio siglo
-
Tesla entrega menos autos de lo esperado en el primer trimestre de 2026
-
Irán ejecuta a un joven de 18 años condenado por las protestas de enero, informa una ONG
-
John Travolta presentará en Cannes su primera película como director
-
Rusia lanzó una cantidad récord de drones en marzo, revela un análisis de cifras ucranianas
-
Rusia prepara el envío de un segundo petrolero a Cuba
-
Reino Unido urge a reabrir Ormuz en reunión multinacional
-
Una joven promesa del ciclismo español, en estado grave tras un accidente
-
La elección de un alcalde negro pone a Francia ante el espejo del racismo
-
Una violenta tormenta en Grecia deja un muerto
-
La Agencia Espacial Europea negociará con la NASA su participación en futuras misiones lunares
-
Un obispo belga defiende que los hombres casados puedan ser ordenados sacerdotes
-
India registra récord en exportaciones de defensa
-
Irán promete ataques "devastadores" contra EEUU e Israel tras las amenazas de Trump
-
Cuatro astronautas inician la histórica misión lunar de la NASA Artemis II
-
La violencia de los colonos recibe críticas en Israel, pero la impunidad reina
-
El papa León XIV celebra su primera Pascua bajo la sombra de la guerra en Oriente Medio
-
Los templos del lujo de Dubái se vacían con la guerra en Oriente Medio
-
Un muerto por fuerte terremoto en el este de Indonesia
-
La conferencia Side-by-Side reúne a cerca de 800 participantes en Malta
-
Valsoft Corporation refuerza su cartera de software para retail con la adquisición de NedFox
-
U.S. Polo Assn. apoya el Campeonato Nacional Interuniversitario de División I
El riesgo de alimentar la inteligencia artificial con datos generados por el propio sistema
Los modelos de inteligencia artificial (IA) se abastecen sin parar de datos generados por la propia IA, lo que desemboca en la creación de contenidos cada vez más incoherentes, un problema que ya han señalado varios estudios científicos.
Los modelos en los que se basan las herramientas de IA generativa, como ChatGPT, que permiten crear todo tipo de contenidos con simples preguntas, necesitan ser ejercitados con un nombre colosal de datos.
Estos datos a menudo vienen de internet, que cada vez contiene más imágenes y textos creados por la propia IA.
Esta autoalimentación de la IA lleva a un deterioro de los modelos, que producen respuestas que van siendo cada vez menos originales y pertinentes y acaban por no tener ningún sentido, según un artículo publicado a finales de julio por la revista científica Nature.
Con el uso de este tipo de datos, llamados "datos sintéticos" porque están generados artificialmente, la muestra en la que se basan los modelos de IA para dar respuestas va perdiendo calidad.
- Como las vacas locas -
Investigadores de las Universidades de Rice y de Stanford, en Estados Unidos, llegaron a la misma conclusión analizando los modelos de IA generadores de imágenes Midjourney, Dall-E y Stable Diffusion.
Los estudios mostraron que las imágenes generadas eran cada vez menos originales e iban incorporando elementos incoherentes a medida que se añadían datos "artificiales" en el modelo, y compararon este fenómeno con la enfermedad de las vacas locas.
Esta epidemia, surgida en el Reino Unido, empezó con el uso para alimentar a los bovinos de harinas animales, obtenidas a partir de partes no consumidas de restos vacunos o de cadáveres de animales contaminados.
Las empresas del sector de la IA utilizan a menudo "datos sintéticos" para alimentar a sus programas debido a su fácil acceso, su abundancia y el bajo coste, comparado con datos creados por humanos.
Estas "fuentes de datos humanos sin explotar, de alta calidad" son cada vez más minoritarias, explica a AFP Jathan Sadowski, investigador especializado en las nuevas tecnologías de la Universidad de Monash, en Australia.
"Sin ningún control durante varias generaciones", la peor hipótesis sería que la degradación de los modelos "envenene la calidad y la diversidad de los datos en todo internet", advierte Richard Baraniuk, uno de los autores del artículo de la Universidad de Rice, en un comunicado.
Así como la crisis de las vacas locas hundió la industria cárnica en los años 1990, un internet repleto de contenidos hechos con IA y de modelos descontrolados podría amenazar el futuro del sector, en pleno auge, según los científicos.
"La verdadera pregunta para los investigadores y las empresas que construyen los sistemas de IA es: ¿cuándo el uso de los datos sintéticos es demasiado?", dice Sadowski.
- "Basura" -
Para otros especialistas, no obstante, el problema es exagerado.
Anthropic y Hugging Face, dos líderes del sector que afirman tener en cuenta el lado ético de la tecnología, confirman a AFP utilizar datos generados por la IA.
El artículo de la revista Nature presenta una perspectiva teórica interesante, pero poco realista, según Anton Lozhkov, ingeniero en aprendizaje automático en Hugging Face.
"El entrenamiento [de los modelos] en varias series de datos sintéticos es algo que simplemente no se hace en realidad", asegura.
Lozhkov admite sin embargo que los expertos de la IA se sienten frustrados ante la situación en que se encuentra internet.
"Una gran parte de internet es una basura", dice, y agrega que su empresa ha hecho grandes esfuerzos para limpiar este tipo de datos, suprimiendo a veces hasta un 90% de contenido.
M.Odermatt--BTB