A OpenAI lançou o GPT-5.5 hoje (23), sob o codinome “Spud”, apresentando o modelo como seu sistema mais avançado para trabalhos autônomos e de múltiplas etapas.
O lançamento ocorreu uma semana após a Anthropic apresentar o Claude Opus 4.7, estabelecendo uma comparação direta entre os dois modelos de fronteira.
GPT-5.5 foca em trabalho autônomo e programação
O GPT-5.5 foi desenvolvido para planejar, executar, verificar e iterar entre ferramentas sem supervisão humana constante. A OpenAI define o modelo como “uma nova classe de inteligência para trabalho real e para impulsionar agentes”.
“… Acreditamos em implantação iterativa; embora o GPT-5.5 já seja um modelo avançado, esperamos melhorias rápidas. Essa distribuição gradual é parte central da nossa estratégia de segurança; estamos convencidos de que, dessa forma, o mundo estará melhor preparado para lidar coletivamente com a resiliência frente à Inteligência artificial”, escreveu Sam Altman, CEO da OpenAI, em publicação no X.
O modelo já está disponível para usuários do ChatGPT Plus, Pro, Business e Enterprise. Também há uma versão Pro ainda mais potente. O preço da API parte de US$ 5 por milhão de tokens de entrada e US$ 30 por milhão de tokens de saída, considerando uma janela de contexto de um milhão de tokens.
Benchmarks da OpenAI indicam que o GPT-5.5 supera o Claude Opus 4.7 em diversas tarefas autônomas. O modelo atingiu 82,7% no Terminal-Bench 2.0, ante 69,4% do Opus 4.7.
Nos testes FrontierMath Tiers 1 a 3, o GPT-5.5 alcançou 51,7% ante 43,8%. Avaliações independentes iniciais apontam tendência semelhante nos testes de programação e tarefas de conhecimento.
Onde o Claude Opus 4.7 ainda se destaca?
O modelo da Anthropic mantém vantagens em produção acadêmica, raciocínio jurídico e financeiro, além de maior precisão no seguimento de instruções, segundo avaliações independentes.
O Opus 4.7 também oferece visão computacional com resolução superior de até 3,75 megapixels, mais que o triplo do modelo anterior.
Em tarefas de uso de computadores, a diferença diminuiu. O GPT-5.5 registrou 78,7% no OSWorld-Verified, enquanto o Opus 4.7 atingiu 78,0%.
Em benchmarks de navegação, os modelos alternam liderança, com o GPT-5.5 Pro alcançando 90,1% ante 79,3% do Opus 4.7.
Corrida por IA acelera em 2026
Lançamentos em sequência refletem uma tendência mais ampla. A OpenAI apresentou vários modelos GPT-5.x este ano, enquanto a Anthropic aprimorou o Claude por meio de atualizações sucessivas.
O Gemini 3.1 Pro do Google também disputa o mesmo mercado corporativo.
Para desenvolvedores diante da escolha entre os dois, a decisão pode depender do caso de uso. O GPT-5.5 demonstra maior capacidade em automação autônoma e programação de longo prazo.
O Claude Opus 4.7 pode ser mais eficiente em fluxos analíticos que demandam precisão. Se benchmarks independentes vão confirmar os dados publicados pela OpenAI ficará mais claro nos próximos dias.





