A reformulação da Busca do Google com respostas geradas por IA colocou holofotes em um problema desconcertante: o sistema falha em tarefas básicas de ortografia e contagem de letras, inclusive ao lidar com a própria palavra “Google”. Erros semelhantes foram observados com termos simples e recorrentes, o que expõe um limite estrutural de modelos de linguagem de grande porte e levanta dúvidas sobre a confiabilidade da camada de IA em consultas que exigem precisão literal.
A empresa reconheceu que contar letras dentro de palavras é um desafio conhecido para modelos generativos e afirmou estar trabalhando em correções. O episódio reacende um debate central: essas IAs são formidáveis em entendimento semântico e síntese de informações, mas ainda escorregam em tarefas determinísticas de nível caractere — como soletração exata, contagem de letras e manipulação precisa de strings.
Além do constrangimento público, o caso tem implicações práticas. Se a resposta de IA se torna um elemento dominante da página de resultados, falhas aparentemente triviais podem distorcer a percepção do usuário, afetar marcas e atrapalhar fluxos de trabalho que dependem de acurácia literal.
O que está acontecendo na prática
Usuários identificaram respostas de IA na Busca que erram a contagem de letras em palavras simples, inclusive “Google”, e tropeçam em termos cotidianos como “poop” e “journalism”. Em alguns casos, a reformulação de nomes próprios também saiu embaralhada. Esses deslizes não parecem ser casos isolados e têm sido reproduzíveis em diferentes consultas, com pequenas variações de prompt produzindo resultados inconsistentes.
O momento é sensível. Dias antes, uma consulta por “disregard” mostrou um comportamento anômalo, devolvendo uma resposta no estilo de assistente em vez de uma definição objetiva. Embora esse episódio tenha sido corrigido rapidamente, os erros de ortografia e contagem persistiram tempo suficiente para ganhar visibilidade e críticas públicas.
Por que modelos de linguagem tropeçam em ortografia e contagem
Modelos de linguagem não “enxergam” texto como humanos. Em vez de processar letra por letra, eles convertem palavras em unidades estatísticas chamadas tokens. Dependendo do tokenizador, uma palavra pode virar um único token, vários fragmentos ou até partições que não respeitam fronteiras claras entre letras e radicais. O resultado é que operações que exigem precisão no nível de caractere — como contar letras de uma palavra — ficam frágeis.
Há outros agravantes. Repetições de letras, variações morfológicas e palavras fora do vocabulário ideal do tokenizador podem ser decompostas de maneiras inesperadas. O modelo, otimizado para prever o próximo token com base em padrões semânticos e contextuais, tende a “alucinar” em tarefas que não dependem de significado, e sim de regras determinísticas. Em termos práticos, ele é excelente em sintetizar um resumo, mas pouco confiável para responder “quantas letras há em X”.
Não existe um tokenizador perfeito
Especialistas observam que não há um tokenizador universalmente ideal. Toda segmentação impõe compromissos: privilegiar granularidade de caracteres eleva custo computacional; privilegiar subpalavras aumenta eficiência, mas sacrifica precisão em tarefas de string. Mesmo com ajustes, é difícil eliminar integralmente esse tipo de erro sem adicionar mecanismos auxiliares específicos para caracteres.
Como a empresa respondeu e caminhos de mitigação
O Google afirmou que “contar dentro de palavras” é uma dificuldade conhecida para modelos generativos e que está trabalhando em melhorias. Sem detalhar prazos, a sinalização é que haverá ajustes na lógica que decide quando e como a camada de IA responde a consultas que exigem literalidade.
Há caminhos técnicos plausíveis — e amplamente usados na indústria — para mitigar o problema sem reinventar todo o sistema:
- Fazer fallback para componentes determinísticos (dicionários, algoritmos de contagem por caractere) quando a consulta exigir precisão literal.
- Acoplar validadores pós-geração que checam consistência entre a resposta do modelo e uma verificação baseada em caracteres.
- Hibridizar a geração com recuperação de fatos de fontes estruturadas, priorizando respostas exatas em consultas objetivas.
- Ajustar o prompting e o roteamento de consultas para evitar que o modelo “adivinhe” quando há uma regra simples disponível.
Qualquer solução adotada tende a combinar engenharia de produto (quando exibir a resposta de IA), curadoria de fontes e verificações determinísticas para tarefas de baixa ambiguidade.
Impacto para usuários, marcas e o ecossistema de busca
Para usuários finais, a lição é pragmática: desconfie de respostas generativas em consultas que exigem exatidão literal, como contagem de letras, soletração, códigos e strings. Nesses casos, é preferível conferir dicionários, resultados tradicionais ou ferramentas dedicadas.
Para marcas, há um risco reputacional: erros em nomes próprios e termos de marca podem gerar confusão e afetar a percepção pública. Empresas devem monitorar como seus nomes e produtos aparecem nas respostas de IA, especialmente em mercados onde a busca com IA já está amplamente distribuída.
Para criadores de conteúdo e equipes de SEO, a mensagem é dupla. Por um lado, respostas generativas podem reduzir cliques em páginas que antes resolviam dúvidas simples. Por outro, inconsistências e imprecisões abrem espaço para conteúdo que agrega valor com demonstrações verificáveis, ferramentas interativas e explicações com checagem automática — especialmente em tópicos onde a precisão literal importa.
O que observar daqui para frente
Esses erros não invalidam o avanço dos modelos generativos em entendimento e síntese. Eles evidenciam um descompasso entre habilidades semânticas e necessidades de exatidão computacional. A tendência é que grandes plataformas adotem guard-rails mais rigorosos, delegando a tarefas determinísticas módulos especializados e limitando a liberdade do gerador quando a pergunta demanda literalidade.
Se o Google alinhar bem esse mix — IA para contexto e linguagem, algoritmos determinísticos para exatidão — a experiência pode ganhar fluidez sem abrir mão de confiança. Até lá, a melhor prática para o usuário é manter senso crítico e usar fontes de verificação quando uma resposta depender de contagem, soletração ou estruturas de string.
Fecho: a Busca com IA continuará evoluindo, mas a confiança é construída na precisão. Resolver bem o “problema de caracteres” é um passo necessário para que a camada generativa realmente some à experiência de pesquisa, em vez de introduzir novas incertezas.
Fonte: https://techcrunch.com/2026/05/27/why-googles-ai-cant-spell-google-or-anything-else/


