Se você acompanha um pouco a evolução das LLMs, deve perceber as mudanças constantes e, inclusive, suas preferências pessoais de uso. Ao olhar para o gráfico abaixo (figura da LMArena – Goldman Sachs Global Investment Research), ficam claras as mudanças. O gráfico da Goldman Sachs é brutal: o que era uma briga de foice entre startups virou um monólogo do Google.
2024: O Ano da Insônia e das Trocas de Trono
Para entender o choque de 2025, precisamos lembrar o quão frenético foi 2024. Foi o ano da “Guerra de Atrito”:
- Anthropic chocou o mundo em março com o Claude 3 Opus, sendo a primeira a desbancar o reinado de quase um ano da OpenAI.
- A OpenAI não deixou barato e retomou o topo com o GPT-4o em maio, apenas para ser desafiada novamente pelo Claude 3.5 Sonnet em junho.
- Terminamos o ano com o surgimento dos modelos de “raciocínio” (o1), onde a OpenAI tentava desesperadamente segurar sua coroa.
Em 2024, o topo do LMArena era um hotel de rotatividade alta. Ninguém conseguia dormir tranquilo.
2025: O “Chão de Fábrica” do Google Limpou o Gráfico
Agora, observe a mancha azul que domina quase 100% do lado direito da imagem. O que aconteceu?
O Google, que passou boa parte de 2024 sendo chamado de “atrasado”, resolveu levar a sério o retorno do cofundador Sergey Brin. O resultado foi uma ocupação territorial sem precedentes. Enquanto OpenAI e Anthropic acumulavam dias de glória no passado (os 540 dias da OpenAI na cor verde), em 2025 elas foram empurradas para a base do pódio.
Os fatos curiosos de 2025:
- Gemini Dominante: O Google ocupou o topo em mais de 90% dos dias de 2025. Foram 302 dias (e contando) de soberania absoluta.
- O “Intruso” Grok: A única empresa que conseguiu furar o bloqueio do Google — ainda que por apenas 34 dias — não foi a OpenAI, mas a xAI de Elon Musk. O Grok foi o único respiro de alternância em um ano pintado de azul.
- OpenAI e Anthropic no “Quase”: Elas continuam excelentes, mas o gráfico não mente: em termos de ser “o melhor modelo do mundo” no LMArena, elas perderam o fôlego da liderança.
A pergunta que fica é: O Google finalmente encontrou a fórmula da hegemonia ou a OpenAI está apenas guardando munição para um contra-ataque histórico? Se 2024 foi o ano da disputa, 2025 está sendo o ano do domínio.
Uma complementação importante: Como a xAI desbancou o Google por 34 dias?
Olhando para o gráfico, a pequena “onda cinza” no meio do oceano azul do Gemini parece um erro estatístico, mas foi um dos momentos mais comentados de 2025. Como uma empresa muito mais jovem que o Google conseguiu o topo do LMArena?
Enquanto o Google otimizava o Gemini para ser eficiente em escala, Elon Musk ativou o Colossus, o maior cluster de GPUs do mundo.
- O Grok-3 (o modelo que provavelmente causou esse pico) foi treinado com uma capacidade computacional sem precedentes em um curto espaço de tempo.
- No LMArena, isso se traduziu em um modelo que raramente “alucinava” em lógica complexa, batendo o Gemini em tarefas de codificação pura e raciocínio matemático pesado durante o mês de seu lançamento.
Além disso, o ranking do LMArena é baseado em preferência humana (Crowdsourcing).
- O Google é conhecido por ser extremamente cauteloso (e às vezes “travado”) com segurança e viés.
- O Grok, por outro lado, foi ajustado para ser mais direto e espirituoso. Em testes cegos, muitos usuários preferiram as respostas do Grok simplesmente porque elas pareciam menos “robóticas” e mais assertivas que as do Gemini, o que elevou seu Elo Score rapidamente.
Resumo da Ópera: O Grok provou que, com poder computacional massivo e uma abordagem menos conservadora, é possível desbancar gigantes. Mas o gráfico deixa claro: chegar no topo é uma coisa, manter-se nele é o jogo do Google.
E como estão os modelos chineses no LMArena?
Embora o gráfico de 2025 mostre uma luta visual entre Gemini, OpenAI e Grok, há uma força silenciosa comendo as beiradas: os modelos chineses. Nomes como Qwen e DeepSeek já não são mais ‘promessas’. Em 2025, eles dominam as categorias de Programação e Matemática do LMArena, provando que o domínio dos EUA agora é desafiado não por uma empresa, mas por um ecossistema inteiro vindo do outro lado do mundo.
| Característica | Google Gemini (Líder 2025) | Qwen / DeepSeek (China) |
| Ponto Forte no LMArena | Multimodalidade (Vídeo/Áudio) e Janela de Contexto Gigante. | Raciocínio Lógico, Matemática e Programação (Coding). |
| Estilo de Resposta | Polido, seguro e altamente informativo. | Direto, técnico e com menos “filtros” de segurança ocidentais. |
| Disponibilidade | Ecossistema fechado (Google Cloud/Vertex). | Modelos com pesos abertos (Open Weights) para a comunidade. |
| Custo-Benefício | Alto (focado em empresas e usuários premium). | Entregam performance de GPT-4 por uma fração do preço. |
Se o gráfico da Goldman Sachs mostra que o Google venceu a batalha pelo tempo no topo, o LMArena também nos conta que a China venceu a batalha pela democratização da potência.
