O modelo Claude Sonnet 4 da Anthropic agora suporta até 1 milhão de tokens

AIbase基地

Publicado emNotícias e Informações de IA · 5 minutos de leitura · Aug 13, 2025

20.5k

A empresa de tecnologia emergente Anthropic anunciou recentemente que seu modelo altamente aguardado Claude Sonnet4 agora suporta até 1 milhão de tokens de contexto. Antes, a API deste modelo suportava apenas 200 mil tokens. Esta expansão permite que os desenvolvedores enviem mais de 75.000 linhas de código em uma única solicitação, aumentando significativamente a flexibilidade e a conveniência do uso.

Atualmente, o suporte a longo contexto expandido já está disponível para testes públicos na API da Anthropic e no Amazon Bedrock. O Google Cloud Vertex AI também lançará essa funcionalidade em breve. No entanto, essa função de longo contexto está atualmente disponível apenas para desenvolvedores da Tier4 e requer limites de taxa personalizados. A Anthropic afirma que abrirá essa funcionalidade para mais desenvolvedores nas próximas semanas.

Para atender à demanda maior por capacidade computacional de janela de tokens maiores, a Anthropic também lançou um novo plano de preços. Para prompts com menos de 200 mil tokens, o custo do Sonnet4 é de 3 dólares por milhão de tokens de entrada e 15 dólares por milhão de tokens de saída. Para prompts com mais de 200 mil tokens, o custo é de 6 dólares por milhão de tokens de entrada e 22,5 dólares por milhão de tokens de saída. Os desenvolvedores também podem reduzir os custos usando técnicas de cache rápido e processamento em lote, onde o processamento em lote fornece um desconto de 50% no preço para janelas de contexto de 1 milhão.

Na última sessão AMA do Reddit, executivos da OpenAI discutiram a possibilidade de oferecer suporte a janelas de contexto longas para seus modelos. O CEO da OpenAI, Sam Altman, disse que ainda não encontraram uma demanda forte dos usuários por contexto longo, mas considerariam adicionar esse suporte se houver interesse suficiente. Devido às limitações de capacidade computacional, a equipe da OpenAI prefere focar em outros projetos prioritários. Além disso, Michelle Pokrass, membro da equipe da OpenAI, mencionou que eles esperavam suportar contextos de até 1 milhão de tokens no GPT-5, especialmente para aplicações de API, mas não conseguiram realizar isso devido ao alto consumo de GPUs.

A suporte a 1 milhão de tokens da Anthropic cria uma competição direta com o Google Gemini em funções de contexto longo, o que também exerce pressão sobre a OpenAI para reconsiderar sua estratégia de produtos.

Destaque:
🆕 O modelo Claude Sonnet4 da Anthropic agora suporta até 1 milhão de tokens de contexto, aumentando significativamente a flexibilidade do desenvolvimento.
💰 Novo plano de preços foi lançado, com custos diferentes para prompts com menos ou mais de 200 mil tokens; os desenvolvedores podem reduzir custos com processamento em lote.
🤖 A OpenAI está atenta à demanda por contexto longo e pode ajustar sua estratégia de produtos para enfrentar a concorrência no futuro.

Anthropic adquire equipe principal da Humanloop! Aumenta a disputa por ferramentas de IA para empresas

A Anthropic, empresa de segurança de IA, adquiriu a equipe principal da Humanloop para fortalecer sua presença no mercado corporativo. Os fundadores e engenheiros da Humanloop se juntarão à Anthropic, contribuindo com expertise em avaliação de modelos de linguagem e gerenciamento de prompts. Essa aquisição ocorre durante a expansão da Anthropic no mercado governamental e corporativo.....

A dupla face da onda de codificação com IA: a Anthropic tem um valor elevado, mas enfrenta dificuldades por relacionamentos com clientes de alto risco

A empresa líder no setor de codificação com IA, a Anthropic, enfrenta preocupações com seu desenvolvimento: seu faturamento anual atinge 5 bilhões de dólares, mas dois grandes clientes contribuem com quase um quarto da receita, apresentando riscos de concentração. Seu Claude lidera o mercado de programação com 42% de participação, e seu novo modelo apresenta desempenho superior ao da OpenAI, mas o GitHub Copilot, financiado pela Microsoft, está em competição direta com ele. Com o GPT-5 entrando no mercado a um preço mais baixo, apresentando desempenho semelhante, mas com vantagem de custo clara, a estratégia de precificação alta da Anthropic enfrenta desafios. A empresa está

Cursor oferece gratuitamente suporte ao GPT-5 e lança nova ferramenta CLI

Cursor oferece acesso gratuito ao GPT-5 por tempo limitado, com benefícios para usuários pagos. O GPT-5 supera modelos como Claude Sonnet4 em codificação e matemática, destacando-se em engenharia de software. Inclui ferramenta CLI para desenvolvedores e lidera no LMArena, gerando grande interesse na comunidade.....

Product Finder

Product Submit

AI Models Finder

MCP Servers

MCP Client

MCP Inspector

Case Tutorials

Latest AI News

AI Daily Brief

O modelo Claude Sonnet 4 da Anthropic agora suporta até 1 milhão de tokens

AIbase基地

Este artigo é do AIbase Daily

Notícias de IA Relacionadas Recomendadas

Anthropic lança novo modo de aprendizagem, o Claude AI ajuda os desenvolvedores a melhorar a experiência de aprendizado

Anthropic lança novo modo de aprendizagem para Claude, visando o mercado de educação em IA e combatendo a dependência de respostas imediatas

A unicórnio de IA da Espanha lança dois modelos ultra pequenos: podem ser executados de forma suave em relógios e eletrodomésticos

Anthropic adquire equipe principal da Humanloop para fortalecer segurança em IA e capacidade de serviço corporativo

Anthropic adquire equipe principal da Humanloop! Aumenta a disputa por ferramentas de IA para empresas

Atualização importante da Anthropic! O modelo Claude Sonnet 4 suporta 1 milhão de tokens

Anthropic fornece serviços de inteligência artificial ao governo dos Estados Unidos por 1 dólar, abrangendo os órgãos legislativo, judicial e executivo

Anthropic aposta no combate ao IA governamental, Claude entra nos três departamentos dos EUA por 1 dólar por ano

A dupla face da onda de codificação com IA: a Anthropic tem um valor elevado, mas enfrenta dificuldades por relacionamentos com clientes de alto risco

Cursor oferece gratuitamente suporte ao GPT-5 e lança nova ferramenta CLI