-
Cacique Raoni é operado e está sob cuidados intensivos
-
"Lamine pode ser o maior talento do mundo", diz técnico da Arábia Saudita
-
Irã e EUA iniciam negociações na Suíça neste domingo
-
Cabo Verde quer competir 'sem medo', diz técnico antes de enfrentar o Uruguai
-
Raphinha passa por 'tratamento intensivo' e vai desfalcar Brasil contra Escócia
-
Alemanha vence Costa do Marfim de virada (2-1) e se garante na próxima fase da Copa
-
Zagueiro Saliba, da seleção francesa, diz que está jogando Copa com dores nas costas
-
Militares e policiais liberam vias em meio a estado de exceção na Bolívia
-
Raphinha passará por 'tratamento intensivo' após sofrer lesão contra o Haiti na Copa
-
Vice-presidente dos EUA viaja à Suíça para negociações com Irã
-
Com problemas respiratórios, Doku vai desfalcar a Bélgica contra o Irã
-
Al Jazeera anuncia morte de jornalista em bombardeio na Faixa de Gaza
-
Autoridade do Exército de Israel diz que recebeu ordem de trégua no Líbano
-
Países Baixos goleiam Suécia (5-1) e entram na briga pela liderança do Grupo F da Copa
-
Professores encerram 20 dias de protestos na Cidade do México
-
Zverev perde para Fritz e cai na semifinal do ATP 500 de Halle
-
Aos 46 anos, Ronaldinho retorna ao futebol para jogar na 3ª divisão italiana
-
Real Madrid nega contato para contratar Olise
-
Bolívia decreta estado de exceção e começa a remover barricadas
-
Brasil mostra nova cara contra o Haiti, enquanto aguarda enfrentar gigantes na Copa
-
Em meio ao caos geopolítico, Irã desafia a Bélgica em campo
-
Funeral de David Hockney foi realizado na mais estrita intimidade, diz assessora
-
Após decepção na estreia, Laporte acredita em virada de chave da Espanha contra Arábia Saudita
-
Sabalenka perde para Pegula e cai na semifinal do WTA 500 de Berlim
-
Uruguai busca reação contra Cabo Verde para avançar na Copa do Mundo
-
Irã anuncia fechamento do Estreito de Ormuz em resposta aos ataques de Israel no Líbano
-
Espanha tem teste decisivo contra a Arábia Saudita no domingo
-
Juiz espanhol determina julgamento e apreensão do passaporte de esposa de Sánchez
-
Presidente Paz decreta estado de exceção na Bolívia após mais de seis semanas de protestos
-
Vini Jr. assume papel de líder na Seleção que sonha com o hexa
-
Copa do Mundo chega a 1.000 partidas e Alemanha pode voltar a um mata-mata
-
Paraguai sofre com um a menos mas vence Turquia (1-0), que está eliminada da Copa do Mundo
-
Paraguaio Almirón é o primeiro expulso por tapar a boca na Copa do Mundo
-
Brasil fez uma 'partida completa', diz Ancelotti, que espera Neymar contra Escócia
-
Brasil ganhou 'confiança' para a Copa com 'atuação excelente' contra o Haiti, diz Vini Jr
-
Brasil elimina Haiti (3-0) e lidera Grupo C da Copa do Mundo
-
Governo da Bolívia e central sindical fecham acordo para levantar protestos
-
Curaçao deve aproveitar Copa do Mundo com realismo, diz técnico Dick Advocaat
-
Estado de saúde de Raoni é grave, mas estável, informa hospital
-
Técnico do Equador pede cautela contra Curaçao: 'Não somos a Alemanha'
-
Timber está fora e De Jong é dúvida na seleção holandesa contra a Suécia
-
Governo da Bolívia e central sindical fecham acordo após semanas de crise
-
Marrocos vence Escócia (1-0) pelo grupo do Brasil na Copa
-
James Burrows, diretor de 'Friends', morre aos 85 anos
IA aprende a mentir, manipular e ameaçar seus criadores
Os últimos modelos de inteligência artificial (IA) generativa não se conformam mais em cumprir ordens. Começam a mentir, manipular e ameaçar para alcançar seus objetivos, diante dos olhares preocupados dos pesquisadores.
Ameaçado em ser desconectado, Claude 4, recém-criado pela Anthropic, chantageou um engenheiro e ameaçou revelar uma relação extraconjugal.
Por sua vez, o o1, da OpenAI, tentou se baixar em servidores externos e quando flagrado, negou.
Não é preciso se aprofundar na literatura ou no cinema: a IA que emula o comportamento humano já é uma realidade.
Para Simon Goldstein, professor da Universidade de Hong Kong, a razão para estas reações é o surgimento recente dos chamados modelos de "raciocínio", capazes de trabalhar por etapas em vez de produzir uma resposta instantânea.
O o1, versão inicial deste tipo da OpenAI, lançada em dezembro, "foi o primeiro que se comportou desta maneira", explica Marius Hobbhahn, encarregado da Apollo Research, que põe à prova grandes programas de IA generativa (LLM).
Estes programas também tendem, às vezes, a simular um "alinhamento", ou seja, dão a impressão de que seguem as instruções de um programador, quando na verdade buscam outros objetivos.
Por enquanto, estes traços se manifestam quando os algoritmos são submetidos a cenários extremos por humanos, mas "a questão é se os modelos cada vez mais potentes tenderão a ser honestos ou não", afirma Michael Chen, do organismo de avaliação METR.
"Os usuários também pressionam os modelos o tempo todo", diz Hobbhahn. "O que estamos vendo é um fenômeno real. Não estamos inventando nada".
Muitos internautas falam nas redes sociais de "um modelo que mente para eles ou inventa coisas. E não se tratam de alucinações, mas de duplicidade estratégica", insiste o cofundador da Apollo Research.
Embora Anthropic e OpenAI recorram a empresas externas, como a Apollo, para estudar seus programas, "uma maior transparência e um acesso maior" da comunidade científica "permitiriam investigar melhor para compreender e prevenir a farsa", sugere Chen, do METR.
Outro obstáculo: a comunidade acadêmica e as organizações sem fins lucrativos "dispõem de infinitamente menos recursos informáticos que os atores da IA", o que torna "impossível" examinar grandes modelos, assinala Mantas Mazeika, do Centro para a Segurança da Inteligência Artificial (CAIS).
As regulamentações atuais não estão desenhadas para enfrentar estes novos problemas.
Na União Europeia, a legislação se centra principalmente em como os humanos usam os modelos de IA, não em prevenir que os modelos se comportem mal.
Nos Estados Unidos, o governo de Donald Trump não quer nem ouvir falar em regulamentação, e o Congresso americano poderia, inclusive, proibir em breve que os estados regulem a IA.
- A IA no banco dos réus? -
"Por enquanto há muito pouca conscientização", diz Simon Goldstein, que, no entanto, avalia que o tema passará ao primeiro plano nos próximos meses com a revolução dos agentes de IA, interfaces capazes de realizar sozinhas uma multiplicidade de tarefas.
Os engenheiros estão em uma corrida atrás da IA e suas aberrações, com resultado duvidoso, em um contexto de forte concorrência.
A Anthropic pretende ser mais virtuosa que suas concorrentes, "mas está tentando idealizar um novo modelo para superar a OpenAI", segundo Goldstein. O ritmo dá pouco tempo para comprovações e correções.
"Como estão as coisas, as capacidades [da IA] estão se desenvolvendo mais rápido que a compreensão e a segurança", admite Hobbhahn, "mas ainda estamos em condições de nos atualizarmos".
Alguns apontam na direção da interpretabilidade, ciência que consiste em decifrar, do lado de dentro, como funciona um modelo de IA generativa, embora muitos, como o diretor do Centro para a Segurança da IA (CAIS), Dan Hendrycks, se mostrem céticos.
As trapaças da IA "poderiam obstaculizar a adoção caso se multipliquem, o que supõe um forte incentivo para que as empresas [do setor] resolvam" este problema, afirma Mazeika.
Goldstein, por sua vez, menciona o recurso aos tribunais para enquadrar a IA, dirigindo-se às empresas caso se desviem do caminho. Mas ele vai além, ao propor que os agentes da IA sejam "legalmente responsabilizados" em caso "de acidente ou delito".
E.Schubert--BTB