O Google “Venceu” a Guerra das IAs? O Que os Números de 2025 Realmente Dizem

Benjamin

2 meses atrás

Se você acompanha um pouco a evolução das LLMs, deve perceber as mudanças constantes e, inclusive, suas preferências pessoais de uso. Ao olhar para o gráfico abaixo (figura da LMArena – Goldman Sachs Global Investment Research), ficam claras as mudanças. O gráfico da Goldman Sachs é brutal: o que era uma briga de foice entre startups virou um monólogo do Google.

2024: O Ano da Insônia e das Trocas de Trono

Para entender o choque de 2025, precisamos lembrar o quão frenético foi 2024. Foi o ano da “Guerra de Atrito”:

Anthropic chocou o mundo em março com o Claude 3 Opus, sendo a primeira a desbancar o reinado de quase um ano da OpenAI.
A OpenAI não deixou barato e retomou o topo com o GPT-4o em maio, apenas para ser desafiada novamente pelo Claude 3.5 Sonnet em junho.
Terminamos o ano com o surgimento dos modelos de “raciocínio” (o1), onde a OpenAI tentava desesperadamente segurar sua coroa.

Em 2024, o topo do LMArena era um hotel de rotatividade alta. Ninguém conseguia dormir tranquilo.

2025: O “Chão de Fábrica” do Google Limpou o Gráfico

Agora, observe a mancha azul que domina quase 100% do lado direito da imagem. O que aconteceu?

O Google, que passou boa parte de 2024 sendo chamado de “atrasado”, resolveu levar a sério o retorno do cofundador Sergey Brin. O resultado foi uma ocupação territorial sem precedentes. Enquanto OpenAI e Anthropic acumulavam dias de glória no passado (os 540 dias da OpenAI na cor verde), em 2025 elas foram empurradas para a base do pódio.

Os fatos curiosos de 2025:

Gemini Dominante: O Google ocupou o topo em mais de 90% dos dias de 2025. Foram 302 dias (e contando) de soberania absoluta.
O “Intruso” Grok: A única empresa que conseguiu furar o bloqueio do Google — ainda que por apenas 34 dias — não foi a OpenAI, mas a xAI de Elon Musk. O Grok foi o único respiro de alternância em um ano pintado de azul.
OpenAI e Anthropic no “Quase”: Elas continuam excelentes, mas o gráfico não mente: em termos de ser “o melhor modelo do mundo” no LMArena, elas perderam o fôlego da liderança.

A pergunta que fica é: O Google finalmente encontrou a fórmula da hegemonia ou a OpenAI está apenas guardando munição para um contra-ataque histórico? Se 2024 foi o ano da disputa, 2025 está sendo o ano do domínio.

Uma complementação importante: Como a xAI desbancou o Google por 34 dias?

Olhando para o gráfico, a pequena “onda cinza” no meio do oceano azul do Gemini parece um erro estatístico, mas foi um dos momentos mais comentados de 2025. Como uma empresa muito mais jovem que o Google conseguiu o topo do LMArena?

Enquanto o Google otimizava o Gemini para ser eficiente em escala, Elon Musk ativou o Colossus, o maior cluster de GPUs do mundo.

O Grok-3 (o modelo que provavelmente causou esse pico) foi treinado com uma capacidade computacional sem precedentes em um curto espaço de tempo.
No LMArena, isso se traduziu em um modelo que raramente “alucinava” em lógica complexa, batendo o Gemini em tarefas de codificação pura e raciocínio matemático pesado durante o mês de seu lançamento.

Além disso, o ranking do LMArena é baseado em preferência humana (Crowdsourcing).

O Google é conhecido por ser extremamente cauteloso (e às vezes “travado”) com segurança e viés.
O Grok, por outro lado, foi ajustado para ser mais direto e espirituoso. Em testes cegos, muitos usuários preferiram as respostas do Grok simplesmente porque elas pareciam menos “robóticas” e mais assertivas que as do Gemini, o que elevou seu Elo Score rapidamente.

Resumo da Ópera: O Grok provou que, com poder computacional massivo e uma abordagem menos conservadora, é possível desbancar gigantes. Mas o gráfico deixa claro: chegar no topo é uma coisa, manter-se nele é o jogo do Google.

E como estão os modelos chineses no LMArena?

Embora o gráfico de 2025 mostre uma luta visual entre Gemini, OpenAI e Grok, há uma força silenciosa comendo as beiradas: os modelos chineses. Nomes como Qwen e DeepSeek já não são mais ‘promessas’. Em 2025, eles dominam as categorias de Programação e Matemática do LMArena, provando que o domínio dos EUA agora é desafiado não por uma empresa, mas por um ecossistema inteiro vindo do outro lado do mundo.

Característica	Google Gemini (Líder 2025)	Qwen / DeepSeek (China)
Ponto Forte no LMArena	Multimodalidade (Vídeo/Áudio) e Janela de Contexto Gigante.	Raciocínio Lógico, Matemática e Programação (Coding).
Estilo de Resposta	Polido, seguro e altamente informativo.	Direto, técnico e com menos “filtros” de segurança ocidentais.
Disponibilidade	Ecossistema fechado (Google Cloud/Vertex).	Modelos com pesos abertos (Open Weights) para a comunidade.
Custo-Benefício	Alto (focado em empresas e usuários premium).	Entregam performance de GPT-4 por uma fração do preço.

Se o gráfico da Goldman Sachs mostra que o Google venceu a batalha pelo tempo no topo, o LMArena também nos conta que a China venceu a batalha pela democratização da potência.