Perplexity AI ha lanzado una nueva función de asistente de voz en su aplicación para iOS, mejorando aún más la utilidad y la experiencia interactiva del asistente de IA. Según AIbase, la nueva función admite la configuración de alarmas, la búsqueda de rutas, el envío de mensajes, la reserva de restaurantes y muchas otras tareas. Combinada con una potente búsqueda en tiempo real y la integración de múltiples aplicaciones, ofrece a los usuarios una experiencia de vida inteligente sin fisuras. La actualización ya está disponible en la App Store y ha recibido una gran acogida por parte de la comunidad, lo que marca un avance significativo de Perplexity hacia el campo de los asistentes de IA integrales.
Funciones principales: procesamiento de múltiples tareas e interacción en tiempo real
El asistente de voz de Perplexity, mediante la entrada multimodal y la interacción con aplicaciones, mejora significativamente la capacidad de automatización de las tareas diarias. AIbase ha resumido sus funciones principales:
Ejecución de tareas por voz: los usuarios pueden configurar alarmas, enviar mensajes de texto, realizar llamadas o gestionar calendarios mediante comandos de voz, como "poner una alarma a las 7 de la mañana de mañana" o "enviar una invitación a la reunión a Sarah".
Planificación de rutas en tiempo real: en combinación con servicios de geolocalización como Amapolas, el asistente de voz puede buscar y planificar rutas según las instrucciones, como "encontrar la ruta más rápida a la cafetería más cercana", y proporcionar actualizaciones de tráfico en tiempo real.
Integración de múltiples aplicaciones: admite la interacción con servicios de medios como Spotify y YouTube Music para reproducir música, podcasts o vídeos; también puede reservar restaurantes o servicios de transporte a través de aplicaciones de terceros.
Interacción con pantalla y cámara: admite la consulta de la cámara "Vista en vivo" y la función "Contexto en pantalla", que puede analizar el contenido de la pantalla u objetos reales, como escanear y traducir señales de tráfico o resumir textos de páginas web.
Admite varios idiomas: se ha añadido la interacción de voz en japonés, español y otros idiomas, combinada con el procesamiento del lenguaje natural, para garantizar la fluidez de las conversaciones entre idiomas.
AIbase ha observado que, en las pruebas de la comunidad, los usuarios han completado todo el proceso de búsqueda, selección y reserva mediante el comando de voz "buscar restaurantes para esta noche y reservar una mesa para cuatro personas", con una experiencia general intuitiva y eficiente, comparable a Siri y Google Assistant.
Arquitectura técnica: IA multimodal y percepción contextual
El asistente de voz de Perplexity se basa en su modelo de IA central (como Claude3.7Sonnet, GPT-4o, Gemini2.5Pro) y en una pila de tecnología multimodal. AIbase analiza que sus tecnologías clave incluyen:
Reconocimiento automático del habla (ASR): utiliza redes neuronales profundas para reconocer con precisión la entrada de voz en varios idiomas, admite instrucciones complejas y el análisis de acentos, con un retraso de respuesta de tan solo milisegundos.
Motor de percepción contextual: al memorizar el historial de conversaciones, el asistente puede procesar sin problemas las instrucciones posteriores, como reservar directamente después de buscar un restaurante, sin necesidad de repetir el contexto.
Procesamiento multimodal: integra la visión (entrada de la cámara), el audio (instrucciones de voz) y el texto (contenido de la pantalla), admite tareas multimodales, como "traducir la señal de tráfico en francés de esta imagen".
Búsqueda y citas en tiempo real: combinada con la tecnología de búsqueda de Perplexity, proporciona respuestas con fuentes, garantizando la precisión de la información, como al consultar "el tiempo en Barcelona hoy" se incluye un enlace al sitio web meteorológico.
Seguridad y privacidad: se ejecuta en un entorno de espacio aislado, la transmisión de datos está encriptada, las consultas de voz se registran en el historial incluso en el modo de incógnito, y los usuarios deben borrarlas manualmente.
Actualmente, el asistente de voz ya está disponible para iOS (requiere iOS 16.0 o superior), algunas funciones de la versión para Android deben activarse mediante la actualización 2.37.0, y la versión para Mac se lanzará próximamente. AIbase considera que su API de código abierto y la selección de múltiples modelos ofrecen a los desarrolladores un espacio de personalización flexible.
Escenarios de aplicación: desde la comodidad diaria hasta la asistencia profesional
La multifuncionalidad del asistente de voz de Perplexity cubre diversas necesidades, desde la vida personal hasta el trabajo. AIbase resume sus principales aplicaciones:
Gestión de la vida diaria: configurar recordatorios, enviar mensajes, reproducir medios o reservar servicios, simplificando las tareas diarias, como "recordarme a las 8 de esta noche que vea la nueva serie de Netflix".
Viajes y navegación: búsqueda de rutas en tiempo real, traducción de señales de tráfico o reserva de hoteles, ideal para viajeros y usuarios internacionales, como "encontrar la ruta de autobús a la Torre de Tokio".
Mejora de la eficiencia laboral: gestionar calendarios, redactar correos electrónicos o resumir notificaciones, ayudando a los profesionales a trabajar de forma eficiente, como "resumir mis correos electrónicos no leídos y marcar las prioridades".
Educación e investigación: consultar información académica mediante comandos de voz o analizar el contenido de la pantalla, para estudiantes e investigadores, como "resumir los puntos clave de este PDF".
Soporte para la accesibilidad: proporciona control por voz y percepción del entorno a usuarios con discapacidad visual o movilidad reducida, mejorando la accesibilidad del dispositivo.
Los comentarios de la comunidad muestran que la memoria contextual y la compatibilidad con varios idiomas del asistente de voz destacan en los intercambios interculturales, y se le ha calificado como "el sustituto de Siri para los usuarios de iPhone". AIbase ha observado que su integración con Telegram Bot amplía aún más los escenarios de uso entre plataformas.
Guía de inicio: activación sencilla y experiencia rápida
AIbase ha sabido que el asistente de voz de Perplexity ya está disponible para todos los usuarios a través de la aplicación Perplexity para iOS, mientras que los usuarios de Android deben actualizar a la versión 2.37.0. Los usuarios pueden empezar rápidamente siguiendo estos pasos:
Actualizar la aplicación Perplexity desde la App Store o Google Play (iOS 16.0 o superior o Android 10 o superior);
Abrir la aplicación, hacer clic en el banner de la página principal o ir a la configuración para activar el asistente de voz (Ajustes > Activar asistente);
Otorgar los permisos necesarios (micrófono, cámara, ubicación, contactos, etc.), activar el asistente mediante gestos (como presionar el botón de encendido) o la interfaz;
Utilizar comandos de voz, como "poner una alarma a las 9 de mañana" o "encontrar la ruta a París", y ver los resultados en tiempo real.
La comunidad recomienda activar el "Modo manos libres" para lograr conversaciones continuas y dar instrucciones claras para optimizar el procesamiento de múltiples tareas. AIbase recuerda que los usuarios de Android pueden necesitar instalar el APK 2.37.0 para obtener todas las funciones, y los usuarios de iOS deben prestar atención a la configuración de privacidad para gestionar el historial de consultas.
Comentarios de la comunidad y direcciones de mejora
Tras el lanzamiento del asistente de voz, la comunidad ha elogiado su integración con múltiples aplicaciones y su interacción natural. Los desarrolladores lo califican como "la perfecta combinación de búsqueda y automatización de tareas", especialmente en la planificación de rutas y la reproducción de medios, superando al Asistente de Google. Los usuarios japoneses han elogiado especialmente la retroalimentación de la interfaz de usuario y la fluidez de la voz, lo que les proporciona una "sensación de tranquilidad". Sin embargo, algunos usuarios han señalado que al asistente le falta una palabra de activación similar a "Hey Google", y que el historial de consultas se registra incluso en el modo de incógnito, lo que puede generar preocupaciones sobre la privacidad. La comunidad también espera que se admitan más idiomas (como el chino) y funciones de análisis de vídeo. Perplexity ha respondido que las futuras actualizaciones optimizarán la palabra de activación y mejorarán el control de la privacidad. AIbase predice que el asistente podría integrarse con el navegador Comet o la API de la versión empresarial para construir un ecosistema de IA entre dispositivos.
Perspectivas futuras: la evolución del ecosistema de asistentes inteligentes
El lanzamiento del asistente de voz de Perplexity demuestra su ambición de pasar de ser una herramienta de búsqueda a un asistente de IA integral. AIbase considera que la combinación de interacción multimodal y búsqueda en tiempo real sienta las bases para desafiar a gigantes como Siri y ChatGPT. La comunidad ya está estudiando la posibilidad de integrarlo con Home Assistant o el protocolo MCP para construir flujos de trabajo de automatización del hogar inteligente. A largo plazo, Perplexity podría lanzar un "mercado de asistentes de IA", ofreciendo modelos de voz personalizados y complementos de terceros, similar al modelo de ecosistema de Alexa Skills. AIbase espera el lanzamiento completo de las versiones para Android y Mac del asistente en 2025, así como avances en las tareas multimodales y el soporte para dispositivos de bajo consumo.