最高の多言語サポート AIツールモデル_厳選多言語サポート情報

AIニュース

小米が全ラウンド音声大モデル MiMo-V2.5 を発表。TTSで1つの文で新しいボイドを生成可能。ASRは方言と多言語の混在に対応し、オープンソースをサポート

小米がMiMo-V2.5全リンク音声モデルシリーズを発表。TTSモデル3種とオープンソースASRモデル1種を含み、音声入力と出力をカバー。TTSモデルは感情、トーン、役割を正確に制御し、音声のプログラミング、創作、複製を可能にし、人機対話の自然さを向上させ、音声インテリジェンスの新時代を切り開く。....

16.1k 7 時間前

アリババ・トンイー研究所が音声認識大モデル「Fun-ASR1.5」を発表。30の言語・方言、古詩も瞬時に変換！

アリババ・トンイー研究所は、音声認識大モデル「Fun-ASR1.5」を公開しました。統一されたアーキテクチャにより、汎用性と正確性のバランスを実現しています。このモデルは世界中の30の主要言語をサポートし、中国語の7つの主要な方言および20以上の地方語に対応しており、多言語、多方言、複雑な文脈において優れた性能を発揮します。

16.5k 9 時間前

小米が本格的にオープンソース！OmniVoiceは600種以上の言語をカバーし、ゼロサンプルの音声クローンTTS：WERは0.84%に達し、40倍速く動作し、小語種も簡単に復活

小米KaldiチームがOmniVoiceモデルをオープンソースした。600種以上の言語をサポートし、中国語および多言語TTSの基準テストで多数の指標がSOTAを達成した。中国語のWERは0.84%に至り、多言語性能は主流の商用モデルを超え、音声合成における新たな突破を遂げた。

18k 15 時間前

マイクロソフトBingチームがHarrier多言語埋め込みモデルをオープンソース化

マイクロソフトBingチームが単語埋め込みモデルHarrierをオープンソース化。100種類以上の言語をサポートし、MTEB v2ベンチマークテストで優れた性能を発揮。20億の例とGPT-5によって生成されたデータに基づいて訓練され、32,000語のコンテキスト窓サイズを持ち、270億パラメータを持つ。多言語タスクの正確性と柔軟性を大幅に向上させた。

12k 1 時間前

マイクロソフトBingチームがHarrier多言語埋め込みモデルをオープンソース化

AI製品

chatgpt image 2.0

OpenAIの次世代AI画像生成ツール。4K解像度、高速生成、高い文字精度を備えています。

画像生成

5.2k

Image 2

Image 2は2Kの高精度なビジュアルを作成でき、多言語に対応し、スタイルが安定しており、クリエイティブを完成品に変えるのをサポートします。

画像生成

5.8k

MkAnime

MkAnimeはワンストップAIマンガドラマスタジオで、インスピレーションから大綱、脚本などを一気に生成できます。

動画生成

ハッピー

HappyHorseはオープンソースのAIビデオ生成器で、一度に1080pのビデオと同期した音声を生成できます。

動画生成

4.6k

モデル

Gemini 2.0 Flash-Lite

Google

$0.49

入力トークン/百万

$2.1

出力トークン/百万

コンテキスト長

GPT-4.1 mini

Openai

$2.8

入力トークン/百万

$11.2

出力トークン/百万

コンテキスト長

Grok 4 Fast

Xai

$1.4

入力トークン/百万

$3.5

出力トークン/百万

コンテキスト長

o3 - mini

Openai

$7.7

入力トークン/百万

$30.8

出力トークン/百万

200

コンテキスト長

GPT-5 Codex

Openai

入力トークン/百万

出力トークン/百万

コンテキスト長

Claude 3 Opus

Anthropic

$105

入力トークン/百万

$525

出力トークン/百万

200

コンテキスト長

Gemini 2.0 Flash

Google

$0.7

入力トークン/百万

$2.8

出力トークン/百万

コンテキスト長

Claude Haiku 4.5

Anthropic

入力トークン/百万

$35

出力トークン/百万

200

コンテキスト長

Gemini 2.5 Flash

Google

$2.1

入力トークン/百万

$17.5

出力トークン/百万

コンテキスト長

Claude Sonnet 4.5

Anthropic

$21

入力トークン/百万

$105

出力トークン/百万

200

コンテキスト長

Claude 3 Sonnet

Anthropic

$21

入力トークン/百万

$105

出力トークン/百万

200

コンテキスト長

Gemini 2.5 Flash-Lite

Google

$0.7

入力トークン/百万

$2.8

出力トークン/百万

コンテキスト長

qwen3-vl-plus

Alibaba

入力トークン/百万

$10

出力トークン/百万

256

コンテキスト長

qwen-image-plus

Alibaba

入力トークン/百万

出力トークン/百万

コンテキスト長

wan2.5-i2i-preview

Alibaba

入力トークン/百万

出力トークン/百万

コンテキスト長

qwen3-max

Alibaba

入力トークン/百万

$24

出力トークン/百万

256

コンテキスト長

Qianfan-Lightning

Baidu

入力トークン/百万

出力トークン/百万

128

コンテキスト長

qwen3-vl-235b-a22b-thinking

Alibaba

入力トークン/百万

$20

出力トークン/百万

コンテキスト長

qwen3-coder-plus

Alibaba

入力トークン/百万

$16

出力トークン/百万

コンテキスト長

qwen-image-edit

Alibaba

入力トークン/百万

出力トークン/百万

コンテキスト長

MCP

Refact

Refact AgentはオープンソースのAIプログラミングアシスタントで、多言語のコード生成、デバッグ、最適化をサポートし、主流の開発ツールと統合し、ローカルにデプロイでき、スマートなコード補完とコード解釈機能を提供します。

typescript

17.1k

5.0ポイント

Serena

セレナは強力なオープンソースのコーディングエージェントツールキットで、大規模言語モデル（LLM）をコードベース上で直接動作するフル機能のエージェントに変えることができます。IDEに似た意味論的なコード検索と編集ツールを提供し、様々なプログラミング言語をサポートし、MCPプロトコルまたはAgnoフレームワークを介して様々なLLMと統合することができます。

python

38.8k

5.0ポイント

FileScope

FileScopeMCPはTypeScriptベースのコード分析ツールで、ファイルの重要度スコアを計算し、依存関係を追跡し、可視化チャートを生成し、ファイルの要約を追加することで、開発者がコードライブラリの構造を迅速に理解するのを支援します。多言語のプロジェクト分析をサポートし、Mermaidチャートの生成と永続的なストレージ機能を提供し、Cursorのモデルコンテキストプロトコルと統合できます。

typescript

3.0ポイント