O Google “Venceu” a Guerra das IAs? O Que os Números de 2025 Realmente Dizem

Se você acompanha um pouco a evolução das LLMs, deve perceber as mudanças constantes e, inclusive, suas preferências pessoais de uso. Ao olhar para o gráfico abaixo (figura da LMArena – Goldman Sachs Global Investment Research), ficam claras as mudanças. O gráfico da Goldman Sachs é brutal: o que era uma briga de foice entre startups virou um monólogo do Google.

2024: O Ano da Insônia e das Trocas de Trono

Para entender o choque de 2025, precisamos lembrar o quão frenético foi 2024. Foi o ano da “Guerra de Atrito”:

  • Anthropic chocou o mundo em março com o Claude 3 Opus, sendo a primeira a desbancar o reinado de quase um ano da OpenAI.
  • A OpenAI não deixou barato e retomou o topo com o GPT-4o em maio, apenas para ser desafiada novamente pelo Claude 3.5 Sonnet em junho.
  • Terminamos o ano com o surgimento dos modelos de “raciocínio” (o1), onde a OpenAI tentava desesperadamente segurar sua coroa.

Em 2024, o topo do LMArena era um hotel de rotatividade alta. Ninguém conseguia dormir tranquilo.

2025: O “Chão de Fábrica” do Google Limpou o Gráfico

Agora, observe a mancha azul que domina quase 100% do lado direito da imagem. O que aconteceu?

O Google, que passou boa parte de 2024 sendo chamado de “atrasado”, resolveu levar a sério o retorno do cofundador Sergey Brin. O resultado foi uma ocupação territorial sem precedentes. Enquanto OpenAI e Anthropic acumulavam dias de glória no passado (os 540 dias da OpenAI na cor verde), em 2025 elas foram empurradas para a base do pódio.

Os fatos curiosos de 2025:

  • Gemini Dominante: O Google ocupou o topo em mais de 90% dos dias de 2025. Foram 302 dias (e contando) de soberania absoluta.
  • O “Intruso” Grok: A única empresa que conseguiu furar o bloqueio do Google — ainda que por apenas 34 dias — não foi a OpenAI, mas a xAI de Elon Musk. O Grok foi o único respiro de alternância em um ano pintado de azul.
  • OpenAI e Anthropic no “Quase”: Elas continuam excelentes, mas o gráfico não mente: em termos de ser “o melhor modelo do mundo” no LMArena, elas perderam o fôlego da liderança.

A pergunta que fica é: O Google finalmente encontrou a fórmula da hegemonia ou a OpenAI está apenas guardando munição para um contra-ataque histórico? Se 2024 foi o ano da disputa, 2025 está sendo o ano do domínio.


Uma complementação importante: Como a xAI desbancou o Google por 34 dias?

Olhando para o gráfico, a pequena “onda cinza” no meio do oceano azul do Gemini parece um erro estatístico, mas foi um dos momentos mais comentados de 2025. Como uma empresa muito mais jovem que o Google conseguiu o topo do LMArena?

Enquanto o Google otimizava o Gemini para ser eficiente em escala, Elon Musk ativou o Colossus, o maior cluster de GPUs do mundo.

  • O Grok-3 (o modelo que provavelmente causou esse pico) foi treinado com uma capacidade computacional sem precedentes em um curto espaço de tempo.
  • No LMArena, isso se traduziu em um modelo que raramente “alucinava” em lógica complexa, batendo o Gemini em tarefas de codificação pura e raciocínio matemático pesado durante o mês de seu lançamento.

Além disso, o ranking do LMArena é baseado em preferência humana (Crowdsourcing).

  • O Google é conhecido por ser extremamente cauteloso (e às vezes “travado”) com segurança e viés.
  • O Grok, por outro lado, foi ajustado para ser mais direto e espirituoso. Em testes cegos, muitos usuários preferiram as respostas do Grok simplesmente porque elas pareciam menos “robóticas” e mais assertivas que as do Gemini, o que elevou seu Elo Score rapidamente.

Resumo da Ópera: O Grok provou que, com poder computacional massivo e uma abordagem menos conservadora, é possível desbancar gigantes. Mas o gráfico deixa claro: chegar no topo é uma coisa, manter-se nele é o jogo do Google.


E como estão os modelos chineses no LMArena?

Embora o gráfico de 2025 mostre uma luta visual entre Gemini, OpenAI e Grok, há uma força silenciosa comendo as beiradas: os modelos chineses. Nomes como Qwen e DeepSeek já não são mais ‘promessas’. Em 2025, eles dominam as categorias de Programação e Matemática do LMArena, provando que o domínio dos EUA agora é desafiado não por uma empresa, mas por um ecossistema inteiro vindo do outro lado do mundo.

CaracterísticaGoogle Gemini (Líder 2025)Qwen / DeepSeek (China)
Ponto Forte no LMArenaMultimodalidade (Vídeo/Áudio) e Janela de Contexto Gigante.Raciocínio Lógico, Matemática e Programação (Coding).
Estilo de RespostaPolido, seguro e altamente informativo.Direto, técnico e com menos “filtros” de segurança ocidentais.
DisponibilidadeEcossistema fechado (Google Cloud/Vertex).Modelos com pesos abertos (Open Weights) para a comunidade.
Custo-BenefícioAlto (focado em empresas e usuários premium).Entregam performance de GPT-4 por uma fração do preço.

Se o gráfico da Goldman Sachs mostra que o Google venceu a batalha pelo tempo no topo, o LMArena também nos conta que a China venceu a batalha pela democratização da potência.

Deixe um comentário