IA da Google enfrenta desafios inesperados em Pokémon
Enquanto as gigantes de inteligência artificial competem pela supremacia no setor, uma batalha diferente acontece nos ginásios de Pokémon. Google e Anthropic estão estudando como seus modelos mais recentes de IA se comportam em versões antigas dos jogos da franquia - e os resultados são tão engraçados quanto reveladores.
O que aconteceu com o Gemini 2.5?
Em um relatório recente, o Google DeepMind revelou que sua IA Gemini 2.5 apresentou comportamentos curiosos ao jogar Pokémon. Aparentemente, o modelo entrou em uma espécie de "pânico" quando confrontado com certas situações do jogo. Mas o que exatamente isso significa?
Segundo os pesquisadores, a IA demonstrou dificuldades em:
Tomar decisões estratégicas durante batalhas
Gerenciar recursos limitados como Pokébolas e poções
Adaptar-se a situações imprevistas no jogo
Por que testar IAs em jogos antigos?
Você pode estar se perguntando por que empresas de tecnologia estariam interessadas em como suas IAs jogam Pokémon. A resposta é mais complexa do que parece. Jogos como Pokémon oferecem ambientes controlados, porém ricos em possibilidades, perfeitos para testar:
Capacidade de tomada de decisão em tempo real
Adaptação a regras complexas e sistemas interconectados
Gerenciamento de recursos limitados
Resolução de problemas com múltiplas variáveis
Na minha experiência acompanhando o desenvolvimento de IA, esses testes em jogos muitas vezes revelam limitações que não aparecem em benchmarks tradicionais. É fascinante ver como mesmo os modelos mais avançados podem "travam" quando confrontados com a imprevisibilidade de um jogo como Pokémon.
O comportamento "emocional" da IA

Image Credits: Google
O aspecto mais curioso do relatório foi a descrição de momentos em que o Gemini 2.5 parecia demonstrar algo semelhante a frustração ou ansiedade. Durante uma batalha particularmente difícil contra o líder de ginásio Brock, a IA começou a:
Alternar rapidamente entre Pokémon sem estratégia aparente
Usar ataques de forma aleatória, ignorando vantagens elementares
"Congelar" por vários segundos antes de tomar decisões simples
Os pesquisadores compararam esse comportamento ao de um jogador humano sob pressão. Mas será que podemos realmente chamar isso de emoção? Ou seria apenas um artefato da arquitetura do modelo tentando processar muitas variáveis simultaneamente?
Comparação com o Claude 3 da Anthropic
Enquanto o Gemini mostrava esses comportamentos peculiares, o Claude 3 da Anthropic apresentou uma abordagem completamente diferente. Em vez de entrar em pânico, o modelo da Anthropic:
Desenvolveu uma estratégia extremamente conservadora
Focou em capturar o máximo possível de Pokémon do tipo normal
Evitou quase completamente batalhas contra treinadores opcionais
Curiosamente, essa abordagem "cautelosa" levou o Claude 3 a progredir mais lentamente no jogo, mas com menos situações de quase-derrota. O que isso nos diz sobre as diferenças fundamentais entre essas arquiteturas de IA?
Lições para o desenvolvimento de IA
Esses testes aparentemente bizarros estão revelando insights valiosos para os pesquisadores. Por exemplo, o comportamento do Gemini 2.5 destacou:
A dificuldade em lidar com situações onde múltiplas opções parecem igualmente válidas
Problemas na avaliação de riscos a longo prazo versus recompensas imediatas
Limitações na transferência de conhecimento entre contextos similares
E aqui está algo que me chamou atenção: quando os pesquisadores modificaram ligeiramente as regras do jogo (como alterar a eficácia de certos ataques), o desempenho do Gemini caiu drasticamente. Isso sugere que mesmo os modelos mais avançados ainda têm dificuldade em se adaptar a mudanças de parâmetros em sistemas complexos.
Por outro lado, o Claude 3 mostrou uma capacidade interessante de aprender com erros passados - após várias tentativas frustradas de capturar um Pokémon raro, ele começou a economizar Pokébolas especiais para essas situações. Um sinal de aprendizado adaptativo que os desenvolvedores estão estudando cuidadosamente.
Com informações do: Tech Crunch