# Google lance SignGemma : Un modèle innovant pour convertir la langue des signes en texte vocal

AIbase

Publié leActualités IA · 6 minutes de lecture · May 29, 2025

Récemment, Google a prévisualisé un nouveau modèle d'intelligence artificielle appelé SignGemma sur sa plateforme de médias sociaux. Ce modèle sera capable de convertir la langue des signes en texte vocal. Cette innovation est prévue pour être ajoutée à la série open-source Gemma plus tard cette année et appliquée ultérieurement à plusieurs produits de Google, comme Gemini Live.

L'arrière-plan de la technologie de conversion de la langue des signes

En tant qu'outil important pour que les personnes sourdes et muettes communiquent avec les autres, l'utilisation de la langue des signes devient de plus en plus répandue. Cependant, en raison des différences entre la langue des signes et les langues parlées, de nombreux utilisateurs non initiés à la langue des signes trouvent souvent cela difficile à comprendre. Le modèle SignGemma lancé par Google cette fois vise à briser cette barrière de communication grâce à une technologie d'intelligence artificielle avancée. Non seulement ce modèle peut améliorer l'efficacité de la communication entre les personnes sourdes et muettes et les personnes entendants, mais il peut également promouvoir la compréhension et l'acceptation de la langue des signes dans la société.

Détails techniques de SignGemma

Le développement de SignGemma repose sur les connaissances approfondies de Google en traitement du langage naturel et en vision par ordinateur. Ce modèle combinera les technologies d'apprentissage automatique et d'apprentissage profond pour identifier précisément les gestes de la langue des signes et les convertir en textes vocaux correspondants. Google a déclaré que la conception de SignGemma prendra pleinement en compte la diversité et l'inclusivité, visant à couvrir les expressions de la langue des signes dans différentes régions et contextes culturels.

Conversion en temps réel** : SignGemma permet la conversion en temps réel de la langue des signes, générant instantanément du texte vocal pendant la communication.
Support multilingue** : Le modèle prévoit de supporter la conversion de plusieurs langues des signes et langues parlées à l'avenir, élargissant ainsi son champ d'application.
Partage open-source** : En tant que partie de la série Gemma, SignGemma sera publié sous forme open-source, encourageant les développeurs et chercheurs à innover et à améliorer.

Impact social et perspectives futures

Le lancement de SignGemma n'est pas seulement une innovation technologique, mais aussi un puissant soutien aux droits des personnes sourdes et muettes. En offrant un moyen de communication plus pratique, ce modèle est attendu de renforcer la participation des personnes sourdes et muettes dans la vie quotidienne, l'éducation et le travail. Par ailleurs, la nature open-source de SignGemma encouragera davantage de développeurs à participer au développement d'applications connexes, promouvant ainsi le développement de la communication assistée par la technologie.

Avec les progrès continus de la technologie, le mouvement de Google montre également sa position de leader dans le domaine de l'intelligence artificielle et son sens des responsabilités sociales. À l'avenir, l'application réussie de SignGemma pourrait inspirer davantage d'entreprises et d'institutions à prêter attention et à répondre aux défis auxquels sont confrontées les personnes sourdes et muettes dans leur communication quotidienne.

En résumé, le modèle SignGemma de Google ne fournit pas seulement des outils de communication plus pratiques pour les personnes sourdes et muettes, mais conduit également une nouvelle tendance dans la combinaison de la langue des signes et de l'intelligence artificielle, avec une signification sociale profonde et un potentiel de marché considérable.

[traitement du langage naturel apprentissage automatique vision par ordinateur apprentissage en profondeur intelligence artificielle]

Cet article provient d'AIbase Daily

Bienvenue dans la section [AI Quotidien] ! Voici votre guide pour explorer le monde de l'intelligence artificielle chaque jour. Chaque jour, nous vous présentons les points forts du domaine de l'IA, en mettant l'accent sur les développeurs, en vous aidant à comprendre les tendances technologiques et à découvrir des applications de produits IA innovantes.

—— Créé par le groupe AIbase Daily

Recommandations d'actualités IA connexes

Tesla prévoit de lancer le service Robotaxi à Austin le 12 juin

Tesla s'apprête à lancer le service de taxi autonome. Selon des sources proches, la société Tesla prévoit de lancer son attendu service de Robotaxi pour véhicules autonomes à Austin le 12 juin 2025. Ce fait marque un pas important dans le plan stratégique d'Elon Musk, fondateur de Tesla, dans les domaines des voitures sans conducteur et de l'intelligence artificielle. Contexte : La vision de Tesla en matière de conduite autonome Tesla, depuis sa création, a toujours cherché à renouveler l'industrie automobile, notamment dans le domaine de la technologie de conduite autonome.

May 29, 2025

# Anthropic présente le mode vocal de Claude pour améliorer l’expérience d’interaction des utilisateurs

Récemment, la société d'intelligence artificielle Anthropic a annoncé la mise en place d'un nouveau mode vocal dans son application mobile Claude, visant à améliorer l'expérience d'interaction des utilisateurs anglophones. La mise en œuvre de cette fonctionnalité offre aux utilisateurs diverses nouvelles méthodes d'échange, notamment un choix varié de personnalités vocales et une transcription en direct des conversations.

May 29, 2025

ByteDance lance le programme Top Seed pour recruter des talents en IA parmi les doctorants de la promotion 2026

ByteDance a récemment annoncé le lancement officiel du programme de recrutement Top Seed 2026 pour les grands modèles, visant à recruter environ 30 doctorants exceptionnels. Ce programme se concentre sur les domaines de pointe de l'intelligence artificielle, couvrant les grands modèles de langage, les algorithmes et systèmes d'apprentissage automatique, la génération et la compréhension multimodales, le traitement de la parole, etc. ByteDance espère attirer ainsi les jeunes talents prometteurs et passionnés par la recherche sur les grands modèles. Contrairement aux programmes de recrutement précédents, le Top Seed de cette année met l'accent sur l'absence de restriction de formation.

Apr 28, 2025

SYMPLEX : le premier modèle d'apprentissage profond pour la découverte de gènes au monde, développé par l'Université de Pékin, révolutionne la biofabrication

L'Université de Pékin a développé SYMPLEX, un modèle d'apprentissage profond révolutionnaire pour la découverte de gènes. Ce modèle ouvre la voie à une nouvelle ère de la biofabrication, en accélérant le processus de découverte et de conception de nouvelles molécules et processus biologiques.

Apr 14, 2025

Pusa : un modèle vidéo open source créé pour moins de 100 € - basé sur l'ajustement fin de Mochi et reproduisant une haute qualité à faible coût

Découvrez comment nous avons créé un modèle vidéo open source performant, Pusa, pour un coût inférieur à 100 €. En utilisant la méthode d'ajustement fin de Mochi, nous avons réussi à reproduire des résultats de haute qualité à un prix abordable. Ce projet démontre la faisabilité de créer des modèles vidéo avancés sans un budget important.

Apr 14, 2025

Hugging Face ajoute une fonctionnalité pratique : vérifiez en un clic les modèles pouvant être exécutés sur votre ordinateur

Hugging Face, plateforme phare de la communauté open source pour l'intelligence artificielle, lance une fonctionnalité très attendue : les utilisateurs peuvent désormais rapidement vérifier quels modèles d'apprentissage automatique leur matériel informatique peut exécuter via les paramètres de la plateforme. Il suffit, paraît-il, d'ajouter les informations sur son matériel (par exemple, le modèle de GPU) dans les paramètres personnels de Hugging Face (en haut à droite, Avatar > Paramètres > Applications locales et matériel).

Apr 3, 2025

L'ère de l'IA expose les chaînes d'approvisionnement logicielles à des risques majeurs : une augmentation de 64 % des fuites de données confidentielles

JFrog a récemment publié son rapport sur l'état de la chaîne d'approvisionnement logicielle 2025, qui met en lumière les défis de sécurité importants auxquels sont confrontées les chaînes d'approvisionnement logicielles dans le contexte du développement rapide de l'intelligence artificielle (IA). Selon ce rapport, l'équipe de recherche, grâce à une enquête menée auprès de plus de 1 400 professionnels et à l'analyse de données provenant de plus de 7 000 clients, dresse un tableau alarmant de la sécurité. Le rapport indique que les vulnérabilités de sécurité de la chaîne d'approvisionnement logicielle ont considérablement augmenté au cours de l'année écoulée, avec une augmentation de 64 % des cas d'exposition d'informations « confidentielles » ou secrètes.

Apr 1, 2025

130

Netflix recrute des scientifiques et ingénieurs en apprentissage automatique pour stimuler l'intelligence du contenu

Feb 28, 2025

Meta AI lance V-JEPA, un nouveau modèle d'apprentissage vidéo : une percée dans la compréhension vidéo

L'équipe Meta AI a récemment lancé le modèle V-JEPA (Video Joint Embedding Predictive Architecture), une innovation visant à faire progresser l'intelligence artificielle. Les humains traitent naturellement les informations provenant de signaux visuels pour identifier les objets et les schémas de mouvement qui les entourent. Un objectif important de l'apprentissage automatique est de révéler les principes fondamentaux qui sous-tendent l'apprentissage non supervisé chez l'homme. Les chercheurs ont proposé une hypothèse clé – le principe de prédiction des caractéristiques – selon laquelle les représentations des entrées sensorielles successives devraient pouvoir se prédire mutuellement. Les premières approches reposaient sur l'analyse des caractéristiques lentes...

Feb 24, 2025

2.5k

Figure lance Helix, un nouveau modèle d'IA intelligent permettant aux robots humanoïdes de suivre des instructions vocales pour les tâches ménagères

Récemment, Brett Adcock, fondateur et PDG de Figure, a dévoilé Helix, un nouveau modèle d'apprentissage automatique visant à améliorer les capacités des robots humanoïdes dans un environnement domestique. Cette annonce intervient seulement deux semaines après l'annonce de la fin de la collaboration de Figure avec OpenAI, démontrant ainsi sa détermination dans le domaine de la robotique. Helix est un modèle vision-langage-action (VLA) « universel » capable de traiter les données visuelles

Feb 21, 2025

2.3k

Actualités IA

IA Quotidien

Chronologie de l'IA

Al hardware

Derniers cas

Collection d'images

Collection de vidéos

Collection audio

Collection de contenu

Derniers tutoriels

Classement des produits IA

Classement de la croissance du trafic IA

Classement de la baisse du trafic IA

Classement hebdomadaire de l'IA

États-Unis

Chine

Inde

Brésil

Génération d'images

Assistant personnel

Génération de personnages

Génération de vidéos

Classement des projets IA

Classement de la croissance des projets IA

Classement des développeurs IA

Classement des organisations IA

Deepseek

TTS

LLM

ChatGPT

Aperçu