O Perplexity AI lançou um novo recurso de assistente de voz em seu aplicativo iOS, aprimorando ainda mais a utilidade e a experiência interativa do assistente de IA. De acordo com o AIbase, o novo recurso suporta várias tarefas, como definir alarmes, encontrar rotas, enviar mensagens e reservar restaurantes. Combinado com a poderosa pesquisa em tempo real e a integração com vários aplicativos, ele oferece aos usuários uma experiência de vida inteligente perfeita. A atualização relevante já está disponível na App Store, com grande repercussão na comunidade, marcando uma forte entrada da Perplexity no campo dos assistentes de IA abrangentes.

image.png

Funcionalidades principais: processamento de várias tarefas e interação em tempo real

O assistente de voz Perplexity, por meio da entrada multimodais e da interação com aplicativos, melhora significativamente a capacidade de automação de tarefas diárias. O AIbase analisou suas principais funcionalidades:

Execução de tarefas por voz: os usuários podem usar comandos de voz para definir alarmes, enviar mensagens de texto, fazer chamadas telefônicas ou gerenciar calendários, como "Definir um alarme para amanhã às 7h" ou "Enviar um convite para uma reunião para Sarah".

Planejamento de rotas em tempo real: em conjunto com serviços de localização como o Google Maps, o assistente de voz pode encontrar e planejar rotas de acordo com as instruções, como "Encontrar a rota mais rápida para uma cafeteria próxima", e fornecer atualizações de trânsito em tempo real.

Integração com vários aplicativos: suporta a interação com serviços de mídia como Spotify e YouTube Music para reproduzir música, podcasts ou vídeos; também pode reservar restaurantes ou serviços de transporte por meio de aplicativos de terceiros.

Interação com tela e câmera: suporta a consulta da câmera "Live View" e a funcionalidade "On-Screen Context", que pode analisar o conteúdo da tela ou objetos reais, como traduzir placas de rua ou resumir textos da web.

Suporte multilíngue: adiciona interação de voz em japonês, espanhol e outros idiomas, combinada com processamento de linguagem natural, para garantir a fluidez de conversas em diferentes idiomas.

O AIbase observou que, nos testes da comunidade, os usuários concluíram todo o processo de busca, seleção e reserva usando o comando de voz "Encontrar um restaurante para esta noite e reservar uma mesa para quatro pessoas", com uma experiência geral intuitiva e eficiente, comparável à Siri e ao Google Assistant.

Arquitetura tecnológica: IA multimodal e reconhecimento de contexto

O assistente de voz Perplexity é baseado em seu modelo de IA principal (como Claude3.7Sonnet, GPT-4o, Gemini2.5Pro) e na pilha de tecnologia multimodal. A análise do AIbase indica que suas tecnologias principais incluem:

Reconhecimento automático de voz (ASR): usa redes neurais profundas para reconhecer com precisão a entrada de voz multilíngue, suporta instruções complexas e análise de sotaques, com um baixo tempo de resposta de milissegundos.

Mecanismo de reconhecimento de contexto: ao memorizar o histórico de conversas, o assistente pode processar perfeitamente as instruções subsequentes, como reservar um restaurante diretamente após a busca, sem precisar repetir o contexto.

Processamento multimodal: integra visão (entrada da câmera), áudio (comandos de voz) e texto (conteúdo da tela), suportando tarefas multimodais, como "Traduzir a placa de rua em francês nesta imagem".

Pesquisa e citação em tempo real: combinada com a tecnologia de busca da Perplexity, fornece respostas com fontes, garantindo a precisão das informações, como anexar um link para um site meteorológico ao consultar "Clima de Barcelona hoje".

Segurança e privacidade: executado em um ambiente de sandbox, com dados criptografados em trânsito, as consultas de voz são registradas no histórico mesmo no modo oculto, mas precisam ser excluídas manualmente pelo usuário.

Atualmente, o assistente de voz está disponível para iOS (requer iOS 16.0+), enquanto alguns recursos da versão Android precisam ser ativados por meio da atualização 2.37.0, e a versão para Mac será lançada em breve. O AIbase acredita que sua API de código aberto e a seleção de vários modelos oferecem aos desenvolvedores um espaço de personalização flexível.

Cenários de aplicação: da conveniência diária ao suporte profissional

A multifuncionalidade do assistente de voz Perplexity atende a diversas necessidades, desde a vida pessoal até o trabalho. O AIbase resume suas principais aplicações:

Gerenciamento da vida diária: definir lembretes, enviar mensagens, reproduzir mídia ou reservar serviços, simplificando tarefas diárias, como "Me lembrar de assistir à nova série da Netflix às 20h".

Viagens e navegação: encontrar rotas em tempo real, traduzir placas ou reservar hotéis, adequado para viajantes e usuários internacionais, como "Encontrar a rota de ônibus para a Torre de Tóquio".

Melhora da eficiência no trabalho: gerenciar calendários, redigir e-mails ou resumir notificações, ajudando os profissionais a trabalhar de forma eficiente, como "Resumir meus e-mails não lidos e marcar as prioridades".

Educação e pesquisa: consultar materiais acadêmicos por voz ou analisar o conteúdo da tela, para apoiar estudantes e pesquisadores, como "Resumir os pontos principais deste PDF".

Suporte de acessibilidade: fornece controle por voz e percepção ambiental para usuários com deficiência visual ou mobilidade reduzida, melhorando a acessibilidade do dispositivo.

O feedback da comunidade mostra que a memória de contexto e o suporte multilíngue do assistente de voz se destacam na comunicação intercultural, sendo elogiado como um "substituto da Siri para usuários de iPhone". O AIbase observou que a integração com o Telegram Bot expandiu ainda mais os cenários de uso em várias plataformas.

Guia de início rápido: ativação simples e experiência rápida

O AIbase descobriu que o assistente de voz Perplexity já está disponível para todos os usuários por meio do aplicativo Perplexity para iOS, enquanto os usuários do Android precisam atualizar para a versão 2.37.0. Os usuários podem começar rapidamente seguindo estas etapas:

Atualize o aplicativo Perplexity na App Store ou Google Play (iOS 16.0+ ou Android 10+);

Abra o aplicativo, clique no banner da página inicial ou acesse as configurações para ativar o assistente de voz (Configurações > Ativar Assistente);

Conceda as permissões necessárias (microfone, câmera, localização, contatos, etc.), ative o assistente por gestos (como pressionar o botão liga/desliga) ou pela interface;

Use comandos de voz, como "Definir um alarme para amanhã às 9h" ou "Encontrar a rota para Paris", e veja os resultados em tempo real.

A comunidade recomenda ativar o "Modo Mãos Livres" para permitir conversas contínuas e comandos claros para otimizar o processamento de várias tarefas. O AIbase lembra que os usuários do Android podem precisar instalar o APK 2.37.0 para obter todas as funcionalidades, enquanto os usuários do iOS devem prestar atenção às configurações de privacidade para gerenciar o histórico de consultas.

Feedback da comunidade e direções de melhoria

Após o lançamento do assistente de voz, a comunidade elogiou muito a integração com vários aplicativos e a interação natural. Os desenvolvedores o descreveram como "uma combinação perfeita de busca e automação de tarefas", especialmente em termos de planejamento de rotas e reprodução de mídia, superando o Google Assistant. Os usuários japoneses elogiaram especialmente o feedback da IU e a fluidez da voz, proporcionando uma "sensação de segurança". No entanto, alguns usuários apontaram a falta de uma palavra-chave de ativação semelhante a "Hey Google" e o fato de o histórico de consultas ser registrado mesmo no modo oculto, o que pode causar preocupações com a privacidade. A comunidade também espera suporte para mais idiomas (como chinês) e recursos de análise de vídeo. A Perplexity respondeu que as atualizações futuras otimizarão a palavra-chave de ativação e melhorarão o controle de privacidade. O AIbase prevê que o assistente pode ser integrado ao navegador Comet ou à API empresarial para construir um ecossistema de IA em vários dispositivos.

Perspectivas futuras: evolução do ecossistema de assistentes inteligentes

O lançamento do assistente de voz Perplexity demonstra sua ambição de se transformar de uma ferramenta de busca em um assistente de IA abrangente. O AIbase acredita que a combinação de interação multimodal e busca em tempo real estabelece uma base para desafiar gigantes como Siri e ChatGPT. A comunidade já está discutindo a integração com o Home Assistant ou o protocolo MCP para construir fluxos de trabalho de automação residencial e inteligente. A longo prazo, a Perplexity pode lançar um "mercado de assistentes de IA", oferecendo modelos de voz personalizados e plug-ins de terceiros, semelhante ao modelo de ecossistema do Alexa Skills. O AIbase espera o lançamento completo das versões Android e Mac do assistente em 2025, além de avanços no suporte a tarefas multimodais e dispositivos de baixo consumo.