Perplexity AI a lancé une nouvelle fonctionnalité d'assistant vocal dans son application iOS, améliorant ainsi la praticité et l'expérience interactive de son assistant IA. Selon AIbase, cette nouvelle fonctionnalité permet de définir des alarmes, de rechercher des itinéraires, d'envoyer des messages, de réserver des restaurants et bien plus encore. Combinée à une puissante recherche en temps réel et à une intégration multi-applications, elle offre aux utilisateurs une expérience de vie intelligente transparente. La mise à jour correspondante est disponible sur l'App Store et a été très bien accueillie par la communauté, marquant une avancée significative de Perplexity dans le domaine des assistants IA complets.

image.png

Fonctionnalités principales : traitement multitâche et interaction en temps réel

L'assistant vocal Perplexity, grâce à une entrée multimodale et à une interaction avec les applications, améliore considérablement l'automatisation des tâches quotidiennes. AIbase a répertorié ses principales fonctionnalités :

Exécution de tâches vocales : les utilisateurs peuvent utiliser des commandes vocales pour définir des alarmes, envoyer des SMS, passer des appels ou gérer leur calendrier, par exemple : « Mettre une alarme à 7 h 00 demain matin » ou « Envoyer une invitation à la réunion à Sarah ».

Planification d'itinéraire en temps réel : en collaboration avec des services de géolocalisation comme Amap, l'assistant vocal peut rechercher et planifier des itinéraires en fonction des instructions, par exemple : « Trouver l'itinéraire le plus rapide pour aller au café le plus proche », et fournir des informations sur le trafic en temps réel.

Intégration multi-applications : prend en charge l'interaction avec des services multimédias tels que Spotify et YouTube Music pour lire de la musique, des podcasts ou des vidéos ; il peut également réserver des restaurants ou des services de VTC via des applications tierces.

Interaction avec l’écran et la caméra : prend en charge la consultation de la caméra « Live View » et la fonctionnalité « On-Screen Context », permettant d’analyser le contenu de l’écran ou des objets réels, tels que la traduction de panneaux routiers ou la synthèse de texte sur une page web.

Prise en charge de plusieurs langues : ajout de l'interaction vocale dans des langues telles que le japonais et l'espagnol, combinée à un traitement du langage naturel, pour assurer la fluidité des conversations interlinguistiques.

AIbase a constaté que lors des tests communautaires, les utilisateurs ont pu effectuer l'intégralité du processus de recherche, de filtrage et de réservation de restaurants pour le soir même grâce à la commande vocale « Rechercher un restaurant pour ce soir et réserver une table pour quatre », l'expérience globale étant intuitive et efficace, comparable à Siri et Google Assistant.

Architecture technique : IA multimodale et compréhension contextuelle

L'assistant vocal Perplexity est basé sur son modèle IA principal (tel que Claude3.7Sonnet, GPT-4o, Gemini2.5Pro) et une pile technologique multimodale. AIbase a analysé que les technologies clés incluent :

Reconnaissance automatique de la parole (ASR) : utilise des réseaux neuronaux profonds pour identifier avec précision les entrées vocales multilingues, prend en charge les instructions complexes et l'analyse des accents, avec un délai de réponse aussi faible que quelques millisecondes.

Moteur de compréhension contextuelle : en mémorisant l'historique des conversations, l'assistant peut traiter de manière transparente les instructions suivantes, par exemple, réserver directement un restaurant après l'avoir trouvé, sans répéter le contexte.

Traitement multimodal : intègre la vision (entrée caméra), l'audio (instructions vocales) et le texte (contenu de l'écran), prenant en charge les tâches multimodales, telles que « Traduire le panneau routier français sur cette image ».

Recherche et citation en temps réel : combiné à la technologie de recherche de Perplexity, il fournit des réponses avec des sources, garantissant l'exactitude des informations, par exemple, la consultation de « météo de Barcelone aujourd'hui » avec un lien vers un site météorologique.

Sécurité et confidentialité : fonctionne dans un environnement sandbox, le transfert de données est crypté, les recherches vocales sont enregistrées dans l'historique même en mode invisible, et l'utilisateur doit les supprimer manuellement.

Actuellement, l'assistant vocal est disponible sur iOS (nécessite iOS 16.0 +), certaines fonctionnalités de la version Android nécessitent une mise à jour vers la version 2.37.0, et la version Mac sera bientôt disponible. AIbase estime que son API open source et le choix de plusieurs modèles offrent aux développeurs une flexibilité de personnalisation.

Scénarios d'application : de la commodité quotidienne à l'assistance professionnelle

La polyvalence de l'assistant vocal Perplexity répond à de nombreux besoins, allant de la vie personnelle au travail. AIbase a résumé ses principales applications :

Gestion de la vie quotidienne : définir des rappels, envoyer des messages, lire des médias ou réserver des services, simplifier les tâches quotidiennes, par exemple : « Me rappeler de regarder la nouvelle série Netflix à 20 h 00 ce soir ».

Voyage et navigation : recherche d'itinéraires en temps réel, traduction de panneaux routiers ou réservation d'hôtels, adapté aux voyageurs et aux utilisateurs internationaux, par exemple : « Trouver la ligne de bus pour la Tour de Tokyo ».

Amélioration de l'efficacité au travail : gestion du calendrier, rédaction de courriels ou synthèse de notifications, aide les professionnels à travailler efficacement, par exemple : « Résumer mes e-mails non lus et marquer les priorités ».

Éducation et recherche : recherche de documents universitaires par la voix ou analyse du contenu de l'écran, adapté aux étudiants et aux chercheurs, par exemple : « Résumer les points clés de ce PDF ».

Assistance aux personnes handicapées : offre un contrôle vocal et une perception de l'environnement aux utilisateurs malvoyants ou à mobilité réduite, améliorant l'accessibilité des appareils.

Les commentaires de la communauté montrent que la mémoire contextuelle et la prise en charge de plusieurs langues de l'assistant vocal sont particulièrement performantes dans les échanges interculturels, et il est considéré comme « une alternative à Siri pour les utilisateurs d'iPhone ». AIbase a observé que son intégration avec Telegram Bot a élargi ses scénarios d'utilisation multiplateformes.

Guide de prise en main : activation simple et expérience rapide

AIbase a appris que l'assistant vocal Perplexity est désormais disponible pour tous les utilisateurs via l'application iOS Perplexity. Les utilisateurs Android doivent mettre à jour leur application vers la version 2.37.0. Les utilisateurs peuvent suivre les étapes suivantes pour une prise en main rapide :

Mettre à jour l'application Perplexity depuis l'App Store ou Google Play (iOS 16.0+ ou Android 10+) ;

Ouvrir l'application, cliquer sur la bannière de la page d'accueil ou accéder aux paramètres pour activer l'assistant vocal (Paramètres > Activer l'assistant) ;

Accorder les autorisations nécessaires (microphone, caméra, localisation, contacts, etc.), activer l'assistant par des gestes (comme appuyer sur le bouton d'alimentation) ou via l'interface ;

Utiliser des commandes vocales, telles que « Mettre une alarme à 9 h 00 demain » ou « Trouver l'itinéraire pour Paris », et consulter les résultats en temps réel.

La communauté recommande d'activer le « mode mains libres » pour permettre des conversations continues et de formuler des instructions claires pour optimiser le traitement multitâche. AIbase rappelle que les utilisateurs Android peuvent avoir besoin d'installer l'APK 2.37.0 pour obtenir toutes les fonctionnalités, et que les utilisateurs iOS doivent surveiller les paramètres de confidentialité pour gérer l'historique des recherches.

Réactions de la communauté et axes d'amélioration

Après le lancement de l'assistant vocal, la communauté a salué son intégration multi-applications et son interaction naturelle. Les développeurs l'ont qualifié de « parfaite combinaison de recherche et d'automatisation des tâches », surpassant même Google Assistant en matière de planification d'itinéraire et de lecture multimédia. Les utilisateurs japonais ont particulièrement apprécié la fluidité de l'interface utilisateur et de la voix, procurant une « sensation de sécurité ». Cependant, certains utilisateurs ont signalé l'absence d'un mot de réveil similaire à « Hey Google » et le fait que les recherches soient toujours enregistrées en mode invisible, ce qui peut soulever des inquiétudes concernant la confidentialité. La communauté attend également la prise en charge de plus de langues (comme le chinois) et la fonctionnalité d'analyse vidéo. Perplexity a répondu que les futures mises à jour optimiseront le mot de réveil et amélioreront le contrôle de la confidentialité. AIbase prévoit que l'assistant pourrait être intégré au navigateur Comet ou à l'API entreprise pour créer un écosystème IA multi-appareils.

Perspectives d'avenir : l'évolution de l'écosystème des assistants intelligents

Le lancement de l'assistant vocal Perplexity témoigne de son ambition de passer d'un outil de recherche à un assistant IA complet. AIbase estime que la combinaison de l'interaction multimodale et de la recherche en temps réel lui a permis de se positionner pour défier les géants tels que Siri et ChatGPT. La communauté discute déjà de son intégration avec Home Assistant ou le protocole MCP pour créer une maison intelligente et des flux de travail automatisés. À long terme, Perplexity pourrait lancer un « marché des assistants IA » proposant des modèles vocaux personnalisés et des plugins tiers, similaire à l'écosystème Alexa Skills. AIbase attend avec impatience le lancement complet des versions Android et Mac de l'assistant en 2025, ainsi que des avancées dans les tâches multimodales et la prise en charge des appareils basse consommation.