Japanische AI besiegt die Welt! Shisa V2 405B Open-Source veröffentlichen

Japanische AI besiegt die Welt! Shisa V2 405B Open-Source veröffentlichen – das ultimative japanische Wunder ist da!

AIbase基地

Veröffentlicht amKI-Nachrichten und -Informationen · 7 Minuten Lesezeit · Jun 5, 2025

Kürzlich hat AIbase von sozialen Medienplattformen die neuesten Informationen erhalten und erfahren, dass Shisa.AI, ein Anbieter von HuggingFace-Modellen, der sich auf die Feinjustierung des Japanischen spezialisiert, mit seiner kürzlich veröffentlichten bilingualen japanisch-englischen KI-Methode die Aufmerksamkeit der Branche erregt hat. In diesem Artikel werden wir Ihnen eine detaillierte Interpretation der neuesten Ergebnisse von Shisa.AI sowie deren bahnbrechenden Fortschritten im Bereich der japanischsprachigen KI vorstellen.

Shisa V2405B: Die stärkste Open-Source-Modelle in Japan

AIbase hat erfahren, dass Shisa.AI das auf Llama3.1 basierende Shisa V2405B-Modell veröffentlicht hat, welches als „das bisher stärkste große Sprachmodell, das je in Japan trainiert wurde“, gilt. Dieses Open-Source-Modell zeigt nicht nur herausragende Leistungen bei japanischen Aufgaben, sondern behält auch eine starke englische Verarbeitungsfähigkeit, was das herausragende Potential eines bilingualen Modells unterstreicht.

Die Testergebnisse zeigen, dass das Shisa V2405B-Modell in mehreren japanischen Benchmarktests das GPT-4 und sogar das neuere GPT-4o und DeepSeek-V3 übertreffen konnte. Diese Durchbrüche markieren den Aufstieg japanischer lokaler KILabors auf der globalen AI-Wettbewerbsbühne und öffnen neue Möglichkeiten für japanischsprachige AI-Anwendungen.

Fokussiert auf die Optimierung des Japanischen, Fortschritt in der Feinjustierung

Shisa.AI ist ein in Tokio ansässiges Start-up, das sich auf die Entwicklung und Bereitstellung fortschrittlicher Open-Source-KI-Sprach- und Sprachmodelle für den japanischen Markt konzentriert. AIbase hat erfahren, dass die Shisa V2-Reihe gegenüber früheren Modellen auf teure kontinuierliche Vortraining und Tokenizer-Erweiterungen verzichtet hat und sich stattdessen auf die Optimierung der Nachtrainingsprozesse konzentriert. Durch den Einsatz synthetischer Daten verbesserte Methoden wurden die Modellleistungen signifikant gesteigert.

Der Kerndatensatz ultra-orca-boros-en-ja-v1 wurde gefiltert, regeneriert und remultipliziert und gilt als einer der stärksten bilingualen japanisch-englischen Datensätze, der es ermöglicht, die japanischen Fähigkeiten nahezu jeder Grundlage zu verbessern. Dieser Datensatz ist unter der Apache2.0-Lizenz kostenlos verfügbar und stellt Entwicklern weltweit wertvolle Ressourcen zur Verfügung.

Verschieden skalierbare Modellfamilie von 7B bis 405B

Die Shisa V2-Reihe umfasst Modelle mit unterschiedlichen Parametern von 7B bis 405B, um die vielfältigen Anforderungen von leichten Geräten bis hin zu Hochleistungscomputern zu decken. AIbase hat erfahren, dass diese Modelle in Aufgaben wie japanische Grammatik, Rollenspiele und Übersetzungen hervorragend performen, insbesondere in Tests wie shisa-jp-ifeval (Japanische Befolgungsinstruktionstests), shisa-jp-rp-bench (Japanische Rollenspiel-Benchmark) und shisa-jp-tl-bench (Japanisch-Englisch-Übersetzungsbenchmark), wo sie ihre Basismodelle übertrumpfen.

Bemerkenswert ist, dass Shisa V2405B während des Trainings kleine Mengen an koreanischem und traditionellem Chinesisch-Daten integrierte, was seine multilinguale Fähigkeit weiter stärkte und mehr Möglichkeiten für crosslinguale Anwendungen eröffnete.

Open-Source-Geist fördert globales AI-Innovation

Die Bemühungen von Shisa.AI haben nicht nur die Leistungsfähigkeit von japanischsprachigen KIs verbessert, sondern auch durch Open-Source-Wege die Entwicklung der globalen AI-Gemeinschaft vorangetrieben. AIbase hat bemerkt, dass die Trainingsprotokolle der Shisa V2-Reihe auf der Plattform Weights and Biases veröffentlicht sind und dass der Trainingsprozess AWS Sagemaker mit einem vierknotigen H100-Cluster verwendet hat, kombiniert mit fortschrittlichen Technologien wie Axolotl, DeepSpeed und Liger Kernel, um effizientes Modellentwicklung zu gewährleisten.

Außerdem plant Shisa.AI, seine speziell für Japanisch entwickelten Benchmarktools zu open-source zu machen, um die Forschung und Evaluierung von japanischen großen Sprachmodellen zu unterstützen und Entwicklern weltweit weitere Unterstützung zu bieten.

Zukunftsaussichten: Japanische KI auf der globalen Bühne

Das erfolgreiche Shisa.AI zeigt, dass selbst kleine KILabors auf der globalen AI-Wettbewerbsszene einen Platz erobern können. Der Release ihrer Open-Source-Modelle und Datensätze bietet starke Unterstützung für die Popularität japanischsprachiger AI-Anwendungen. AIbase glaubt, dass mit der ständigen Aktualisierung ihrer Modelle und Ressourcen die Position Japans auf der globalen AI-Szene weiter verstärkt wird.

Für Entwickler mit komplexen japanischsprachigen Anforderungen ist die Shisa V2-Reihe zweifellos eine wertvolle, starke Werkzeugreihe. AIbase empfiehlt, die offizielle Website von Shisa.AI und ihre HuggingFace-Seite zu verfolgen, um weitere technische Details und Gelegenheiten für Modelltest zu erhalten.

Durch seine Shisa V2-Reihe zeigt Shisa.AI die innovative Kraft Japans im Bereich der KI. Ob für akademische Forschung oder kommerzielle Anwendungen, diese Open-Source-Modelle bereiten den Weg für die Zukunft der japanischsprachigen KI.

Midjourney-Video Revolution in Sicht! Video-Upscaler und Niji-Video-Modell im Entstehen: Neue Kreativgrenzen entdecken!

Kürzlich gab Midjourney bekannt, dass es an der Entwicklung eines Video-Upscalers sowie eines speziell für Anime-Stil konzipierten Niji-Video-Modells arbeitet. Diese Ankündigung löste bei Schöpfern und AI-Technikbegeisterten weltweit ein starkes Interesse aus. Der Redaktion von AIbasis wurden die neuesten Entwicklungen zusammengestellt, um diese beiden innovative Technologien und ihre Potenzial nachhaltigen Einfluss zu analysieren. Midjourney Video-Upscaler: Qualität erhöhen, Kreativität vergrößern Der Midjourney Video-Upscaler zielt darauf ab, mit fortschrittlichen AI-Algorithmen niedrigauflösende Videos auf eine höhere Auflösung zu verbessern.

Rakuten veröffentlicht erstes japanisches großes Sprachmodell Rakuten AI 2.0

Die Rakuten-Gruppe hat die Einführung ihres ersten japanischen großen Sprachmodells (LLM) und kleinen Sprachmodells (SLM) namens Rakuten AI 2.0 und Rakuten AI 2.0 mini angekündigt. Die Veröffentlichung dieser beiden Modelle zielt darauf ab, die Entwicklung der künstlichen Intelligenz (KI) in Japan voranzutreiben. Rakuten AI 2.0 basiert auf einer Mixture-of-Experts-(MoE)-Architektur und ist ein 8x7B-Modell, das aus acht einzelnen Modellen mit jeweils 7 Milliarden Parametern besteht, wobei jedes Modell als Experte fungiert. Bei der Verarbeitung eingehender Token...

Japanisches Spieleunternehmen Falcom erwägt KI-Einsatz zur Steigerung der Lokalisierungseffizienz

Auf der Tokyo Game Show sprach Falcoms Präsident Kondou Kouji in einem Interview mit 4Gamer über die mögliche zukünftige Nutzung von künstlicher Intelligenz zur Verkürzung der Lokalisierungszeit von Spielen. Er erwähnte insbesondere seine Einschätzung der KI-Übersetzung und betonte, dass solche Technologien die schnelle Übersetzung japanischer Spiele in verschiedene Sprachen ermöglichen könnten. Bildquelle: Bild wurde mit KI generiert, Bildlizenzierung über Midjourney. Seine Aussage folgte auf die Präsentation einer Software namens ELLA, die darauf abzielt, die Übersetzung von Spieltexten zu unterstützen.

Intel und japanisches AIST eröffnen gemeinsames Forschungszentrum für fortschrittliche Chipherstellung

Intel und das japanische National Institute of Advanced Industrial Science and Technology (AIST) haben in Japan ein gemeinsames Forschungszentrum für die Chipherstellung eröffnet, das mit EUV-Lithographieanlagen (Extreme Ultraviolet) ausgestattet ist. Die EUV-Technologie wird für die Herstellung von 5-nm-Chips und kleineren eingesetzt und bietet japanischen Chipdesignern die Möglichkeit, mit dem AIST und Intel zusammenzuarbeiten, um von den neuesten Technologien zu profitieren und ihre globale Wettbewerbsfähigkeit zu stärken. Der Aufbau des Zentrums wird voraussichtlich drei bis fünf Jahre dauern und mehrere hundert Millionen US-Dollar kosten. Es wird als kostenpflichtige Ressource für Halbleiterhersteller und Materialunternehmen dienen. Diese Zusammenarbeit wird dazu beitragen...

Japanisches Halbleiter-Forschungsteam kooperiert mit Tenstorrent an KI-Chip, Silicon-Valley-Legende Jim Keller beteiligt

Eine von der japanischen Regierung unterstützte Halbleiter-Forschungsgruppe arbeitet mit dem US-amerikanischen Startup Tenstorrent Inc. zusammen, um einen KI-Chip zu entwickeln. Tenstorrent entwickelt in Zusammenarbeit mit der japanischen Regierung einen KI-Chip basierend auf dem Open-Source-Standard RISC-V. Die japanische Regierung investiert 670 Milliarden US-Dollar, um die führende Rolle im Halbleitersektor zurückzugewinnen. Tenstorrent kooperiert mit dem staatlich geförderten Startup Rapidus Corp. bei der Produktion des KI-Chips. Jim Keller ist ein bekannter Experte aus dem Silicon Valley.

Stability AI veröffentlicht zwei japanische Sprachmodelle

Stability AI Japan hat kürzlich zwei bemerkenswerte japanische Sprachmodelle veröffentlicht: "Japanese Stable LM 3B-4E1T" und "Japanese Stable LM Gamma 7B". Diese Modelle basieren auf zuvor veröffentlichten englischen Sprachmodellen und wurden durch die Verwendung umfangreicher japanischer und englischer Daten weiter trainiert, um ihre Fähigkeiten in der japanischen Sprachverarbeitung zu verbessern. Die Modelle verfügen über 3 Milliarden bzw. 7 Milliarden Parameter.

ELYZA veröffentlicht 7 Milliarden Parameter großes japanisches LLM basierend auf Llama 2, das mit GPT-3.5 mithalten kann

ELYZA hat ein japanisches LLM namens "ELYZA-japanese-Llama-2-7b" veröffentlicht, das auf Metas Llama 2 basiert und 7 Milliarden Parameter umfasst. Seine Leistung ist mit der von GPT-3.5 vergleichbar. Das Modell wurde durch zusätzliches Pre-Training und ein einzigartiges Fine-Tuning verbessert und erreichte die höchste Punktzahl in einer manuellen 5-stufigen Bewertung. Obwohl es noch nicht das Niveau eines geschlossenen LLMs erreicht hat, ist es bereits mit GPT-3.5 vergleichbar. ELYZA hat erfolgreich auch andere Sprachen wie Englisch integriert.

So schön, dass sie für KI gehalten wird? Japanisches Mädchen beweist: Ich bin ein Mensch!

Die süße Fujisaki Nagi wurde im Internet berühmt, weil sie "zu schön für eine echte Person, eher eine KI" genannt wurde. Fujisaki Nagi bewies mit Ausweisfotos, Vergleichsbildern und anderen Methoden, dass sie ein Mensch ist. In Zukunft könnte KI die Ästhetik beeinflussen, und die Zweifel an KI-Schönheiten nehmen zu.

Latest AI News

AI Daily Brief

AI Product Finder

AI Product Rankings

AI Product Submit

AI Tools Directory

GEO Brand Visibility

AI Visibility Audit

AI Search Visibility Checker

GEO Promotion Link Detection

GEO Ranking Optimization System

GEO Services​

MCP Servers

MCP Client

MCP Case Tutorials

MCP Ranking

MCP Service Submission

MCP Playground

MCP Inspector

LLM API Hub

AI Models Finder

Model Providers

LLM Leaderboard

Compare LLMs

LLM Cost Calculator

LLM Arena

AI Model Compatibility Checker

AI Deployment Calculator

Japanische AI besiegt die Welt! Shisa V2 405B Open-Source veröffentlichen – das ultimative japanische Wunder ist da!

AIbase基地

Dieser Artikel stammt aus dem AIbase-Tagesbericht

Empfohlene verwandte KI-Nachrichten

Die Inferenzfähigkeit des TRM-Modells mit 7 Millionen Parametern übertrifft sogar Gemini 2.5 Pro und Claude 3.7

Japanisches AI-Unicorn LayerX sammelt 1 Milliarde Dollar ein und will das traditionelle Betriebsmodell von Unternehmen umkrempeln

Midjourney-Video Revolution in Sicht! Video-Upscaler und Niji-Video-Modell im Entstehen: Neue Kreativgrenzen entdecken!

Rakuten veröffentlicht erstes japanisches großes Sprachmodell Rakuten AI 2.0

Japanisches Spieleunternehmen Falcom erwägt KI-Einsatz zur Steigerung der Lokalisierungseffizienz

Intel und japanisches AIST eröffnen gemeinsames Forschungszentrum für fortschrittliche Chipherstellung

Japanisches Halbleiter-Forschungsteam kooperiert mit Tenstorrent an KI-Chip, Silicon-Valley-Legende Jim Keller beteiligt

Stability AI veröffentlicht zwei japanische Sprachmodelle

ELYZA veröffentlicht 7 Milliarden Parameter großes japanisches LLM basierend auf Llama 2, das mit GPT-3.5 mithalten kann

So schön, dass sie für KI gehalten wird? Japanisches Mädchen beweist: Ich bin ein Mensch!

Empfohlene verwandte KI-Nachrichten

Die Inferenzfähigkeit des TRM-Modells mit 7 Millionen Parametern übertrifft sogar Gemini 2.5 Pro und Claude 3.7

Japanisches AI-Unicorn LayerX sammelt 1 Milliarde Dollar ein und will das traditionelle Betriebsmodell von Unternehmen umkrempeln

Midjourney-Video Revolution in Sicht! Video-Upscaler und Niji-Video-Modell im Entstehen: Neue Kreativgrenzen entdecken!

Rakuten veröffentlicht erstes japanisches großes Sprachmodell Rakuten AI 2.0

Japanisches Spieleunternehmen Falcom erwägt KI-Einsatz zur Steigerung der Lokalisierungseffizienz

Intel und japanisches AIST eröffnen gemeinsames Forschungszentrum für fortschrittliche Chipherstellung

Japanisches Halbleiter-Forschungsteam kooperiert mit Tenstorrent an KI-Chip, Silicon-Valley-Legende Jim Keller beteiligt

Stability AI veröffentlicht zwei japanische Sprachmodelle

ELYZA veröffentlicht 7 Milliarden Parameter großes japanisches LLM basierend auf Llama 2, das mit GPT-3.5 mithalten kann

So schön, dass sie für KI gehalten wird? Japanisches Mädchen beweist: Ich bin ein Mensch!

GEO Services