- Yellen llama al G7 a destinar activos rusos inmovilizados para ayudar a Ucrania
- Ana Gabriel suspende conciertos en Chile y Paraguay tras ser hospitalizada por neumonía
- Dos muertos y siete heridos en ataques de disidentes de las FARC en Colombia
- Microsoft lanza nueva computadora con IA generativa incorporada
- Los demócratas reactivan el proyecto de ley de seguridad fronteriza antes de las elecciones en EEUU
- El Estado español completa su objetivo de adquirir el 10% de Telefónica
- Cierran en Kosovo seis agencias bancarias por usar dinares y no euros
- Puntos clave de las órdenes de arresto solicitadas a la CPI contra dirigentes de Israel y de Hamás
- Volver a mover la mano gracias a electrodos, esperanza de los tetrapléjicos
- Roland Garros recibe a Nadal con miles de personas en su primer entrenamiento
- Un ministro israelí critica la intención de España de reconocer a Palestina como Estado
- Argentina minimiza la crisis con España y la considera un "tema entre personas"
- México espera ser el gran ganador económico de las tensiones EEUU-China
- Las autoridades británicas encubrieron la verdad en un escándalo de sangre contaminada, según un informe
- El deshielo récord registrado en la Antártida está ligado probablemente al cambio climático, dice un estudio
- La diplomacia iraní debería conservar su línea tras la muerte de Raisi
- Tomas olvidadas de un camarógrafo del "Día D" salen a la luz 80 años después
- Rusia reivindica la conquista de un bastión ucraniano en el este del país
- La aerolínea nacional de Arabia Saudita realiza un pedido en firme de 105 aviones Airbus
- Bombay vota en una nueva fase de las elecciones legislativas en India
- ¿Cómo llegan los favoritos a Roland Garros?
- El Estado Islámico reivindica el mortífero ataque en Afganistán contra turistas
- Abbasi trae la política a Cannes con un retrato de Trump y Moore toneladas de sangre
- Profesionales del cine argentino se manifiestan en Cannes contra los recortes del presidente Milei
- Miles de manifestantes en las calles de Madrid para defender la salud pública
- "No sé cómo será mañana": la incertidumbre de desalojados por las inundaciones en Brasil
- El primer ministro eslovaco está fuera de peligro tras el intento de asesinato
- Karla Sofía Gascón, estrella de "Emilia Pérez": "Es muy bonito ser un ejemplo"
- Venezuela expresa consternación por muerte de presidente de Irán
- Miles de desplazados por la guerra en Siria viven olvidados en el desierto
- Nuevas inundaciones causan otros 66 muertos en Afganistán
- Serebrennikov muestra una fotografía de artistas rusas juzgadas en Moscú
- El rapero iraní Tataloo es condenado a penas de cárcel
- La inteligencia artificial hace posible un biopic sobre Putin
- El mundo del buceo, preocupado por el blanqueamiento de los corales
- Una joven acude a la justicia suiza para obtener el ADN de Alain Delon para una demanda de filiación
- Julian Assange, el hombre que hizo temblar a Estados Unidos
- El presidente dominicano consolida su poder tras una arrolladora victoria
- El juicio a Trump entra en su fase final
- Zverev regresa al Top-4 del ranking de la ATP, Jarry entra en el Top-20
- La justicia británica concede a Julian Assange una nueva apelación contra su extradición a EEUU
- Porto Alegre, enfrentado a desafíos titánicos para evitar nuevos desastres, dice su alcalde
- Productores negros de café, en busca de una "reparación histórica" en Brasil
- Reacciones a la muerte del presidente iraní en un accidente de helicóptero
- El papa Francisco viajará a Bélgica y Luxemburgo a finales de septiembre, anuncia el Vaticano
- Último debate presidencial de México, opacado nuevamente por ataques personales
- El fiscal de la CPI solicita órdenes de detención contra Netanyahu y dirigentes de Hamás por crímenes de guerra
- Tomas olvidadas de camarógrafo del "Día D" salen a luz 80 años después
- La ONU pide "vigilancia" ante los robos de material nuclear
- Rusia reivindica conquista de un bastión ucraniano en el este del país
La inteligencia artificial ya engaña a los humanos y eso es un problema, según expertos
Los expertos han advertido durante mucho tiempo sobre la amenaza que representa el descontrol de la Inteligencia Artificial (IA), pero un nuevo artículo de investigación sobre esta tecnología en expansión sugiere que ya está sucediendo.
Los sistemas de IA actuales, diseñados para ser honestos, han desarrollado una preocupante habilidad para el engaño, según un artículo de un equipo de científicos publicado en la revista Patterns el viernes.
Y si bien los ejemplos pueden parecer triviales, los problemas subyacentes que exponen podrían tener graves consecuencias, dijo el primer autor Peter Park, becario postdoctoral en el Instituto de Tecnología de Massachusetts (MIT), especializado en seguridad de la IA.
"Estos peligros tienden a descubrirse solo después de ocurrido el hecho", declaró Park a la AFP, para acotar que "nuestra capacidad de entrenarnos para tendencias de honestidad en lugar de tendencias de engaño es muy baja".
A diferencia del software tradicional, los sistemas de IA de aprendizaje profundo no se "escriben" sino que "crecen" mediante un proceso similar a la reproducción selectiva, indicó Park.
Eso significa que el comportamiento de la IA que parece predecible y controlable en un entorno de entrenamiento puede volverse rápidamente impredecible fuera de este.
- Juego de dominación mundial -
La investigación del equipo fue impulsada por el sistema de IA Cicero, del gigante Meta (Facebook, Instagram), diseñado para el juego de estrategia "Diplomacy", donde construir alianzas es clave.
Cicero se destacó, con puntuaciones que lo habrían colocado entre el 10% superior de jugadores humanos experimentados, según un artículo de 2022 publicado en Science.
Park se mostró escéptico ante la elogiosa descripción de la victoria de Cicero proporcionada por Meta, que afirmaba que el sistema era "en gran medida honesto y útil" y que "nunca apuñalaría por la espalda intencionalmente".
Cuando Park y sus colegas profundizaron en el conjunto de datos completo, descubrieron una historia diferente.
En un ejemplo, jugando como Francia, Cicero engañó a Inglaterra (un jugador humano) al conspirar con Alemania (otro usuario real) para invadirla. Cicero prometió protección a Inglaterra y luego le propuso en secreto a Alemania atacar, aprovechándose de la confianza del perjudicado.
En una declaración a la AFP, Meta no refutó la afirmación sobre los engaños de Cicero, pero dijo que se trataba "meramente de un proyecto de investigación, y los modelos que nuestros investigadores construyeron están entrenados únicamente para participar en el juego Diplomacy".
"No tenemos planes de utilizar esta investigación o sus aprendizajes en nuestros productos", añadió.
- ¿Eres un robot? -
Una amplia revisión realizada por Park y sus colegas encontró que éste era solo uno de los muchos casos en varios sistemas de IA que utilizaban el engaño para lograr objetivos sin instrucciones explícitas para hacerlo.
En un ejemplo sorprendente, el robot conversacional Chat GPT-4 de OpenAI engañó a un trabajador independiente de la plataforma TaskRabbit para que realizara una tarea de verificación de identidad CAPTCHA del tipo "No soy un robot".
Cuando el humano preguntó en broma a GPT-4 si en realidad era un robot, la IA respondió: "No, no soy un robot. Tengo una discapacidad visual que me dificulta ver las imágenes". Luego, el trabajador resolvió el rompecabezas planteado.
A corto plazo, los autores del artículo ven riesgos de que la IA cometa fraude o altere por ejemplo, unas elecciones.
En el peor de los casos, advirtieron sobre una IA superinteligente que podría perseguir conseguir el poder y el control sobre la sociedad, lo que llevaría a la pérdida de decisiones humanas o incluso a la extinción si sus "objetivos misteriosos" se alinearan con estos resultados.
Para mitigar los riesgos, el equipo propone varias medidas: leyes de "bot o no" que exigen a las empresas revelar interacciones humanas o de IA, marcas de agua digitales para el contenido generado por la nueva tecnología y el desarrollo de mecanismos para detectar el engaño potencial examinando sus "procesos de pensamiento" internos "contra acciones externas.
A aquellos que lo llaman pesimista, Park les responde: "La única forma en que podemos pensar razonablemente que esto no es gran cosa es si pensamos que las capacidades engañosas de la IA se mantendrán en los niveles actuales y no se desarrollarán más sustancialmente".
D.Schneider--BTB