Récemment, AIbase a obtenu des informations les plus récentes sur les plateformes de médias sociaux et appris que Shisa.AI, un fournisseur de modèles HuggingFace spécialisé dans le fine-tuning du japonais, a attiré une grande attention dans l'industrie avec son tout dernier modèle bilingue japonais-anglais. Cet article vous présentera une analyse détaillée des dernières réalisations de Shisa.AI et de ses progrès significatifs dans le domaine de l'intelligence artificielle japonaise.

Shisa V2405B : Le modèle open source japonais le plus puissant est né
Selon AIbase, Shisa.AI a récemment publié le modèle Shisa V2405B basé sur Llama3.1, ce modèle open source étant considéré comme « le modèle de langue large le plus puissant jamais formé au Japon ». Ce modèle se distingue non seulement par ses excellentes performances en tâches japonaises, mais conserve également une capacité de traitement anglaise impressionnante, montrant ainsi d'excellentes performances dans les modèles bilingues japonais-anglais.
Les données de test montrent que Shisa V2405B surpassait GPT-4 et GPT-4Turbo dans plusieurs tests de référence japonais, et était à égalité avec les derniers GPT-4o et DeepSeek-V3 dans les tâches japonaises. Cette percée marque la montée en puissance des laboratoires d'IA japonais sur la scène mondiale de la compétition IA, ouvrant de nouvelles perspectives pour les applications d'IA japonaise.
Optimisation exclusive du japonais, amélioration des techniques de fine-tuning
Shisa.AI est une startup basée à Tokyo qui se concentre sur le développement et le déploiement de modèles de langage et vocaux avancés open source pour le marché japonais. AIbase a appris que, comparé aux anciens modèles, la série Shisa V2 a abandonné l'entraînement continu coûteux et l'extension du tokenizer, se concentrant sur l'amélioration du processus post-entraînement. Grâce à une méthode basée sur des données synthétiques, elle a sensiblement amélioré les performances du modèle.
Le dataset central ultra-orca-boros-en-ja-v1, après avoir été filtré, régénéré et re-samplé, est considéré comme l'un des datasets bilingues japonais-anglais les plus puissants actuellement disponibles, permettant d'améliorer presque n'importe quel modèle de base pour sa capacité en japonais. Ce dataset est désormais disponible gratuitement sous licence Apache2.0, offrant une ressource précieuse aux développeurs du monde entier.
Famille de modèles largement applicable, couvrant de 7B à 405B paramètres
La série Shisa V2 couvre des modèles de différentes tailles allant de 7B à 405B paramètres, répondant aux besoins diversifiés des appareils légers à la haute performance. AIbase a appris que ces modèles se distinguent particulièrement bien dans des tâches telles que la grammaire japonaise, le jeu de rôle et la traduction. En particulier, ils surpassent leurs modèles de base dans les tests shisa-jp-ifeval (test japonais d'obéissance aux instructions), shisa-jp-rp-bench (benchmark de jeu de rôle japonais) et shisa-jp-tl-bench (benchmark de traduction japonais-anglais), entre autres.
Il est à noter que Shisa V2405B intègre également une petite quantité de données coréennes et de chinois traditionnel pendant l'entraînement, renforçant ainsi sa capacité multi-langue et offrant davantage de possibilités pour les scénarios de traduction interlinguistique.
Esprit open source, promouvoir l'innovation mondiale de l'IA
L'effort de Shisa.AI n'a pas seulement amélioré les performances de l'IA japonaise, mais a aussi promu le développement de la communauté mondiale de l'IA via l'open source. AIbase a remarqué que les journaux d'entraînement de la série Shisa V2 sont publiés sur la plateforme Weights and Biases, utilisant un cluster AWS Sagemaker à 4 nœuds H100, combiné avec des technologies avancées telles qu'Axolotl, DeepSpeed et Liger Kernel, garantissant ainsi un développement efficace des modèles.
De plus, Shisa.AI prévoit d'ouvrir ses outils de benchmark spécifiques au japonais, aidant à la recherche et à l'évaluation des grands modèles linguistiques japonais, offrant ainsi plus de soutien aux développeurs du monde entier.
Perspectives futures : la compétitivité mondiale de l'IA japonaise
Le succès de Shisa.AI montre que même les petits laboratoires d'IA peuvent se tailler une place sur la scène mondiale de la compétition IA. La publication de ses modèles et jeux de données open source fournit un soutien solide à l'utilisation généralisée des applications d'IA japonaises. AIbase pense que, avec la mise à jour continue de ses modèles et ressources par Shisa.AI, la position du Japon dans le domaine mondial de l'IA sera consolidée.
Pour les développeurs ayant des besoins complexes en matière de tâches japonaises, la série Shisa V2 constitue sans aucun doute un outil puissant à essayer. AIbase recommande de suivre le site Web officiel de Shisa.AI et la page HuggingFace pour obtenir davantage de détails techniques et des opportunités d'essai de modèles.
Avec sa série de modèles Shisa V2, Shisa.AI a montré la force d'innovation du Japon dans le domaine de l'IA. Que ce soit pour la recherche académique ou l'application commerciale, ces modèles open source ouvrent la voie à l'avenir de l'IA japonaise.




