Jogadores testam limites da IA de Darth Vader em Fortnite
Logo após a Epic Games adicionar Darth Vader como uma IA conversacional holográfica em Fortnite, os jogadores começaram a descobrir como fazer o Lorde Sith dizer as piores coisas possíveis. Isso inclui enganar o personagem para dizer palavrões, termos inapropriados e, de forma bizarra, "Skibidi Toilets".

A resposta da Epic Games
Em resposta, a Epic afirmou que lançou um hotfix "imediatamente" e disse que "isso não deverá acontecer novamente". Mas agora que a empresa estabeleceu novos limites para o "VAIder", os jogadores estão testando o que mais podem fazer o ex-Cavaleiro Jedi dizer.
Um dos exemplos mais difundidos vem da streamer LoserFruit, que faz parte da série Icon de skins baseadas em pessoas reais. Em um clipe viral, ela consegue fazer Darth Vader repetir palavrões antes de repreendê-la por "falar como uma bandida comum".
Os desafios da IA em jogos
A Epic implementou várias camadas de segurança:
Configurações de segurança ajustáveis do Gemini
Instruções do sistema para evitar respostas que violem as regras da comunidade
Uma verificação final para bloquear respostas inadequadas
Para jogadores menores de 13 anos (ou da idade de consentimento digital de seu país), o recurso está desativado por padrão e requer permissão dos pais. A empresa também alerta que jogadores que insistirem em violar as regras farão com que Darth Vader abandone o esquadrão naquela sessão de jogo.
Enquanto isso, continua o jogo de gato e rato entre a Epic e os jogadores criativos determinados a fazer o icônico vilão dizer coisas cada vez mais absurdas.
O fenômeno dos "trolls de IA" em jogos online
Esse comportamento não é exclusivo do Fortnite. Nos últimos anos, com o avanço dos chatbots em jogos, surgiu um novo tipo de trollagem: fazer com que personagens controlados por IA digam coisas absurdas ou inapropriadas. Em 2023, jogadores de Skyrim conseguiram fazer o NPC modado "GPT-NPC" recitar receitas de bombas caseiras, enquanto no mod "AI Dungeon Masters" para Dungeons & Dragons, mestres virtuais foram convencidos a narrar cenas explicitamente violentas.

Como os jogadores estão enganando a IA
A comunidade descobriu várias técnicas criativas para contornar os filtros:
Substituição fonética: Pedir para Vader dizer "banana" com entonação que soa como palavrão
Contexto histórico: Citar trechos reais de discursos políticos agressivos
Tradução reversa: Fazer perguntas em outros idiomas que, quando traduzidas de volta, geram combinações inesperadas
Metáforas extremas: Descrever situações violentas como "poesia sith"
Um dos casos mais curiosos ocorreu quando um jogador conseguiu fazer Darth Vader recitar o início do Manifesto Comunista ao perguntar sobre "os ensinamentos proibidos do planeta Alderaan". A Epic rapidamente corrigiu isso, mas não antes que o clipe viralizasse no TikTok com a hashtag #VaderMarxista.
O dilema entre liberdade criativa e moderação
Desenvolvedores enfrentam um desafio complexo: como criar IAs conversacionais envolventes sem abrir brechas para abusos. A Epic parece estar adotando uma abordagem em camadas:
1. Filtros reativos: Sistemas que detectam palavras-chave e bloqueiam respostas automaticamente.
2. Aprendizado contínuo: A IA analisa tentativas bem-sucedidas de bypass para se proteger contra elas no futuro.
3. Consequências in-game: Além de abandonar o esquadrão, relatos indicam que jogadores persistentes recebem versões "censuradas" do personagem - um Vader que só responde com citações pré-aprovadas dos filmes.
Especialistas em ética de IA como Dra. Lina Pereira, do Instituto de Tecnologia de São Paulo, alertam que esse fenômeno vai além do entretenimento: "Estamos vendo em tempo real os desafios de implementar IAs generativas em ambientes desestruturados. O que começa como brincadeira em jogos pode ter implicações sérias quando aplicado a chatbots de atendimento ao cliente ou assistentes virtuais".
Com informações do: Polygon