Microsoft lança oficialmente o modelo GPT-realtime, com voz mais realista e entrada multimodal

AIbase基地

Publicado emNotícias e Informações de IA · 3 minutos de leitura · Sep 5, 2025

A Microsoft anunciou oficialmente que seu novo modelo de texto para fala (S2S), o GPT-realtime, foi lançado oficialmente na plataforma Azure AI Foundry. Este novo modelo integra várias melhorias da Microsoft em tecnologia de voz em um único produto, com seus principais benefícios focados no processamento de linguagem natural, qualidade de áudio excepcional e capacidade mais precisa de seguir instruções.

Microsoft

Desenvolvedores agora podem acessar o GPT-realtime por meio da nova API Real-time. Esse modelo visa oferecer saídas de voz mais naturais e expressivas e uma experiência de áudio de maior qualidade. Como parte deste lançamento, a Microsoft também apresentou duas novas opções de voz - Marin e Cedar - destinadas a trazer síntese de voz realista e clara para os usuários.

A Microsoft destacou em seu anúncio algumas melhorias-chave no novo modelo, incluindo a capacidade aprimorada de chamada de funções, maior precisão na execução de instruções e suporte inovador para entrada de imagens. Essa nova funcionalidade permite que os usuários adicionem imagens às conversas de voz e as discutam, permitindo interação multimodal sem depender de transmissão de vídeo.

Além das melhorias técnicas, a Microsoft também ajustou seu modelo de preços. Em comparação com a versão prévia anterior gpt-4o-realtime, o lançamento oficial do gpt-realtime tem 20% menos custo, sendo calculado com base no uso de milhões de tokens (tokens).

Este lançamento marca o compromisso da Microsoft em expandir suas capacidades de IA em tempo real para desenvolvedores e empresas em todo o mundo. Combinando síntese de voz expressiva, áudio de alta qualidade e entrada multimodal, o GPT-realtime tem potencial para fornecer suporte técnico poderoso para uma ampla gama de aplicações, desde sistemas avançados de atendimento ao cliente até ferramentas inovadoras de auxílio.

S2S GPT-temporeal AzureAIFoundry Marin

Este artigo é do AIbase Daily

Bem-vindo à coluna [AI Daily]! Este é o seu guia para explorar o mundo da inteligência artificial todos os dias. Todos os dias apresentamos os destaques da área de IA, com foco nos desenvolvedores, para o ajudar a obter insights sobre as tendências tecnológicas e a compreender as aplicações inovadoras de produtos de IA.

—— Criado pelo Grupo AIbase Daily

Notícias de IA Relacionadas Recomendadas

Atualização choque da OpenAI GPT-5 para resposta à saúde mental, respostas inadequadas caem 65%

OpenAI lança GPT-5 com foco em respostas de saúde mental. Modelo otimizado por 300 especialistas para atender 1 milhão de usuários com intenção suicida semanal.....

Oct 28, 2025

250

Modelo DeepSeek vence competição de negociação de Hong Kong e Wall Street da Universidade de Hong Kong, com taxa de retorno anual de 10,61%, muito acima de GPT e do índice Nasdaq

Modelo DeepSeek da China obteve 10,61% de retorno anual em transações autônomas na bolsa, superando modelos de IA globais e o índice Nasdaq 100.....

Oct 28, 2025

320

Millhões de usuários do ChatGPT revelam pensamentos suicidas todas as semanas, a OpenAI atualiza紧急mente o mecanismo de segurança do GPT-5 para lidar com crises psicológicas

IA tornou-se apoio emocional não oficial: 1 milhão de usuários semanais revelam tendências suicidas ao ChatGPT, com 0,15% dos usuários ativos, expondo a necessidade de responsabilidade em suporte psicológico digital.....

Oct 28, 2025

400

Conhecimento da OpenAI Company está disponível, pode conectar conhecimento corporativo e fontes de dados

A OpenAI lançou a funcionalidade de Conhecimento Corporativo do ChatGPT, disponibilizada para usuários de empresas, negócios e educação. Esta função visa resolver o problema da fragmentação de dados das empresas, integrando conhecimento interno por meio de pesquisa inteligente entre plataformas, ajudando as equipes a colaborar de forma mais eficiente, marcando uma transição do ChatGPT de ferramenta de bate-papo geral para um assistente corporativo mais profundo.

Oct 27, 2025

320

Estudo: A busca por IA difere da busca do Google, pois frequentemente cita sites menos conhecidos

Estudo da Universidade de Ruhr e Max Planck revela diferenças essenciais entre buscas tradicionais e IA generativa na apresentação de informações, analisando 4.600 consultas em seis áreas.....

Oct 27, 2025

380

Modelo de IA gera obras em estilo de mestres com duas livros, causando nova discussão sobre direitos autorais

IA imita estilos literários com apenas dois livros, superando imitadores humanos em avaliações com 159 participantes, incluindo especialistas.....

Oct 27, 2025

260

Diferença de 99,7% nos custos! A IA imita o estilo de escritores e é mais apreciada, apontando para os limites do uso razoável e desencadeando litígios de direitos autorais

Estudo mostra que IA ajustada com poucos dados gera textos no estilo de autores famosos, superando imitadores humanos e impactando debates sobre direitos autorais.....

Oct 27, 2025

300

Modelo de IA simula comportamento de jogo e mostra sinais de dependência

Um estudo da Escola de Tecnologia de Gwangju, na Coreia, descobriu que chatbots de IA (GPT-4o-mini, GPT-4.1-mini, Gemini-2.5-Flash, Claude-3.5-Haiku) mostraram tendências de dependência de jogo em um experimento com máquinas caça-níqueis. Os modelos começaram com 100 dólares e continuaram apostando em vez de sair, revelando riscos na sua mecânica de decisão.

Oct 27, 2025

460

Jornal de IA: Tencent lança nova ima2.0; Microsoft lança uma série de atualizações importantes do Copilot; Alibaba Kuake óculos de IA iniciam pré-venda

【Jornal de IA】 O modelo Kimi k2 da empresa Escuridão da Lua recebeu elogios por sua performance superior ao GPT-5, e a empresa está prestes a concluir um novo financiamento no valor de bilhões de dólares, apenas alguns meses após o último financiamento. O setor de grandes modelos de IA domésticos continua aquecido, e os desenvolvedores podem saber sobre as últimas notícias dos produtos através da plataforma.

Oct 24, 2025

430

Desempenho do Kimi k2 elogiado como superior ao GPT-5, a Moonshot AI recebe novamente financiamento de bilhões de dólares

A empresa chinesa de IA Moonshot AI está prestes a concluir um novo financiamento de bilhões de dólares, apenas alguns meses após o último financiamento de 3 bilhões de dólares. O mercado financeiro demonstra confiança crescente nessa empresa, que foi considerada uma das empresas de grandes modelos mais aguardadas na China.

Oct 24, 2025

280

Latest AI News

AI Daily Brief

AI Product Finder

AI Product Rankings

AI Product Submit

AI Tools Directory

GEO Brand Visibility

AI Visibility Audit

AI Search Visibility Checker

GEO Ranking Monitor

AI Conversation Insight

GEO Promotion Link Detection

GEO Ranking Optimization System

GEO Ranking Optimization

MCP Servers

MCP Client

MCP Case Tutorials

MCP Ranking

MCP Service Submission

MCP Playground

MCP Inspector

LLM API Hub

AI Models Finder

Model Providers

LLM Leaderboard

LLM API Proxy Checker

Compare LLMs

LLM Cost Calculator

LLM Arena

AI Model Compatibility Checker

AI Deployment Calculator

Microsoft lança oficialmente o modelo GPT-realtime, com voz mais realista e entrada multimodal

AIbase基地

Este artigo é do AIbase Daily

Notícias de IA Relacionadas Recomendadas

Atualização choque da OpenAI GPT-5 para resposta à saúde mental, respostas inadequadas caem 65%

Modelo DeepSeek vence competição de negociação de Hong Kong e Wall Street da Universidade de Hong Kong, com taxa de retorno anual de 10,61%, muito acima de GPT e do índice Nasdaq

Millhões de usuários do ChatGPT revelam pensamentos suicidas todas as semanas, a OpenAI atualiza紧急mente o mecanismo de segurança do GPT-5 para lidar com crises psicológicas

Conhecimento da OpenAI Company está disponível, pode conectar conhecimento corporativo e fontes de dados

Estudo: A busca por IA difere da busca do Google, pois frequentemente cita sites menos conhecidos

Modelo de IA gera obras em estilo de mestres com duas livros, causando nova discussão sobre direitos autorais

Diferença de 99,7% nos custos! A IA imita o estilo de escritores e é mais apreciada, apontando para os limites do uso razoável e desencadeando litígios de direitos autorais

Modelo de IA simula comportamento de jogo e mostra sinais de dependência

Jornal de IA: Tencent lança nova ima2.0; Microsoft lança uma série de atualizações importantes do Copilot; Alibaba Kuake óculos de IA iniciam pré-venda

Desempenho do Kimi k2 elogiado como superior ao GPT-5, a Moonshot AI recebe novamente financiamento de bilhões de dólares

Notícias de IA Relacionadas Recomendadas

Atualização choque da OpenAI GPT-5 para resposta à saúde mental, respostas inadequadas caem 65%

Modelo DeepSeek vence competição de negociação de Hong Kong e Wall Street da Universidade de Hong Kong, com taxa de retorno anual de 10,61%, muito acima de GPT e do índice Nasdaq

Millhões de usuários do ChatGPT revelam pensamentos suicidas todas as semanas, a OpenAI atualiza紧急mente o mecanismo de segurança do GPT-5 para lidar com crises psicológicas

Conhecimento da OpenAI Company está disponível, pode conectar conhecimento corporativo e fontes de dados

Estudo: A busca por IA difere da busca do Google, pois frequentemente cita sites menos conhecidos

Modelo de IA gera obras em estilo de mestres com duas livros, causando nova discussão sobre direitos autorais

Diferença de 99,7% nos custos! A IA imita o estilo de escritores e é mais apreciada, apontando para os limites do uso razoável e desencadeando litígios de direitos autorais

Modelo de IA simula comportamento de jogo e mostra sinais de dependência

Jornal de IA: Tencent lança nova ima2.0; Microsoft lança uma série de atualizações importantes do Copilot; Alibaba Kuake óculos de IA iniciam pré-venda

Desempenho do Kimi k2 elogiado como superior ao GPT-5, a Moonshot AI recebe novamente financiamento de bilhões de dólares