ElevenLabsのAI音声エージェントがWhatsAppに統合され、テキストと音声のデュアルモードで対話可能。ユーザーは文字チャットや音声通話を通じて、リアルなAIアシスタントと会話できます。企業向けに多言語対応、感情認識、リアルタイム翻訳機能を備えたAI音声アシスタントを簡単に導入でき、カスタマーサポート体験を革新します。....
微信入力法iOS版が3.0.0にアップデートされ、音声優先インタラクションを核に。音声入力の再構築、基盤モデルの強化で速度と精度向上、実用性と多言語対応、プライバシー保護も強化。最大の特徴は広東語など15の中国方言への対応拡大。....
微信入力法iOS新版で音声入力が大幅強化。基盤モデルを最適化し、認識速度と精度向上。最大の特徴は多言語・多方言の自動認識対応で、手動切り替え不要。....
Qwen3-TTSモデルが全面アップグレードされ、多音色・多言語・多方言に対応し、音声の自然さと安定性を大幅に向上。Qwen API経由で簡単にアクセス可能で、49種類以上の高品質音色を提供し、性別・年齢・地域の特徴をカバーし、多様なシーンに対応。....
バイトダンスのSeedance 1.5 Proは、DB - DiTを使用して音画同期の映画レベルのビデオを生成します。
無料のAI検出ツールで、テキストの真偽を検証し、ChatGPT、Geminiなどのモデルで生成された内容を識別できます。
無料のAI画像生成ツールで、ログイン不要で、個人および商用利用に無料です。
ChatGPTなどの複数のモデルのAI生成コンテンツを高精度に検出し、20種類以上の言語に対応し、精度は99.98%を超えます。
Xai
$1.4
入力トークン/百万
$3.5
出力トークン/百万
2k
コンテキスト長
Anthropic
$7
$35
200
$21
$105
Alibaba
-
$6
$24
256
$4
$16
1k
$8
$240
52
Bytedance
$1.2
$3.6
4
$3.9
$15.2
64
Moonshot
Baidu
32
Deepseek
$12
128
Tencent
$1
$0.75
Openai
$8.75
$70
400
$15
ibm-granite
Granite-4.0-H-350MはIBMが開発した軽量指令モデルで、Granite-4.0-H-350M-Baseをベースに微調整されています。このモデルは、オープンソースの指令データセットと内部合成データセットを組み合わせ、監督微調整、強化学習、モデルマージなどのさまざまな技術を用いて開発され、強力な指令追従能力と多言語対応を備えています。
nightmedia
Qwen3-Next-80B-A3B-Instruct-qx64-mlxはQwenシリーズの大規模言語モデルで、MLX形式に変換され、効率的なテキスト生成に使用されます。このモデルは800億のパラメータを持ち、多言語対応で、特に命令追従タスクに最適化されています。
cpatonn
NVIDIA Nemotron Nano 12B v2は、NVIDIAによって最初から訓練された大規模言語モデルで、推論および非推論タスク用に設計されています。混合Mamba2-Transformerアーキテクチャを採用し、多言語に対応し、制御可能な推論能力を備えており、ユーザーの要求に応じて推論過程を生成するか、直接答えを提供することができます。
NVIDIA-Nemotron-Nano-9B-v2はNVIDIAが新たに訓練した大規模言語モデルで、推論タスクと非推論タスクの両方に対応した統一モデルです。このモデルはMamba2-Transformer混合アーキテクチャを採用し、多言語に対応し、制御可能な推論能力を備えています。ユーザーはシステムプロンプトを通じてモデルの推論プロセスを制御できます。このモデルは複数のベンチマークテストで優れた成績を収め、すでに商用可能です。
NexaAI
NexaAI/Qwen3-0.6BはQwen3シリーズに基づく0.6Bパラメータの言語モデルで、推論、指令の遵守、多言語対応などの面で優れた性能を発揮します。思考モードと非思考モードのシームレスな切り替えをサポートし、複雑な論理推論と効率的な汎用対話に適しています。
tensorblock
Nile-Chat-4Bは、MBZUAI-Parisが開発した40億パラメータの多言語対話モデルで、先進的なTransformerアーキテクチャに基づいて構築され、対話シーンに特化して最適化されています。このモデルは複数の言語をサポートし、流暢な自然言語対話が可能で、高品質な応答生成能力を備えています。
RedHatAI
Meta-Llama-3.3-70B-Instruct-NVFP4はMeta-Llama-3.3-70B-Instructの量子化バージョンで、重みと活性化をFP4データ型に量子化することで、ディスクサイズとGPUメモリ要件を大幅に削減しながら、高いパフォーマンスを維持します。このモデルは多言語に対応しており、商業および研究用途に適しています。
汎用タスク、ロールプレイング、ストーリーライティングなどの複数の分野に適した、多目的で多言語対応の大規模言語モデルです。
Qwen3-0.6BはQwen3シリーズに基づく大規模言語モデルで、テキスト生成をサポートし、独特な思考モード切り替え、強力な推論能力、多言語対応などの特性を持っています。
bartowski
HelpingAIのDhanishtha-2.0-previewモデルを定量化処理した多言語テキスト生成モデルで、推論や対話などの様々なシーンに対応しています。
mradermacher
Gama-12Bは多言語対応の大規模言語モデルで、さまざまな量子化バージョンを提供して、異なる性能と精度の要件に対応します。
NikolayKozloff
このモデルはPocketDoc/Dans-PersonalityEngine-V1.3.0-12bを変換したGGUF形式モデルで、多言語・多タスクに対応し、汎用目的、ロールプレイ、ストーリー創作などのシナリオに適しています。
gamer-to
LLaMAアーキテクチャに基づいて微調整された多言語対話モデルで、アラビア語と英語をサポートし、対話タスクに最適化され、高品質な応答を提供します。
nvidia
軽量多言語音声活動検出モデル、中英仏独露西6言語対応、パラメータ数わずか91.5K、リアルタイム音声処理に最適
poltextlab
これはxlm-roberta-largeをファインチューニングした多言語テキスト分類モデルで、英語とデンマーク語に対応し、Comparative Agendas Projectのマイナーなテーマコードでラベル付けされ、さらに7種類のメディアコードが追加されています。
Qwen
Qwen3は通義千問シリーズの大規模言語モデルの最新バージョンで、一連の高密度型と混合専門家(MoE)モデルを提供し、推論、コマンド対応、エージェント能力、多言語サポートの面で画期的な進歩を遂げています。
Triangle104
Qwen3-1.7B-Q8_0-GGUFはQwen/Qwen3-1.7Bを変換したGGUF形式モデルで、テキスト生成タスクをサポートし、多言語対応と効率的な推論能力を備えています。
CreitinGameplays
Mistral-Small-3.1-24B-Instruct-2503をベースに構築された画像テキストをテキストに変換するモデルで、多言語処理に対応しています。
bullerwins
Gemma 3はGoogleが開発した軽量で最先端のマルチモーダルオープンモデルで、テキストと画像の入力を処理し、テキスト出力を生成できます。128Kの大きなコンテキストウィンドウと多言語対応を備え、さまざまなテキスト生成と画像理解タスクに適しており、リソースが限られた環境でもデプロイ可能です。
Qwen3-4Bは通義千問シリーズの最新大規模言語モデルで、40億パラメータを搭載し、思考モードと非思考モードの切り替えをサポート、強力な推論能力、コマンド追従、多言語対応を備えています。
OpenZeppelin Contracts Wizardはインタラクティブなスマートコントラクト構築ツールで、ユーザーがコントラクトタイプ、パラメータ、機能を選択することで、OpenZeppelinコンポーネントに基づくコントラクトコードを生成できます。複数のプログラミング言語をサポートし、APIと埋め込み機能を提供します。
Suppr超能文献のMCPサービスは、文書翻訳と中国語の意味検索によるPubMed文献検索機能を提供し、多様なファイル形式と言語の相互翻訳をサポートし、ClaudeなどのAIアシスタントに統合して使用できます。
Zonos MCP統合プロジェクトはClaudeにテキスト読み上げ機能を提供し、Model Context Protocolを通じて直接音声を生成し、多言語と感情の口調設定に対応しています。
MLX Whisperをベースとした音声文字起こしMCPサーバーで、ローカルファイル、Base64オーディオ、YouTube動画の文字起こしに対応。AppleのMシリーズチップ用に最適化されています。
Zonos TTSとClaudeのMCP統合プロジェクトで、テキストを音声に変換する機能を実現します。
Votars MCP は、多言語対応のツールで、Votars AI プラットフォームと統合し、音声文字起こしと AI タスクを処理します。
Cloudflare Workerに基づくコード解釈サービスで、パターン認識とアーキテクチャ分析を通じてコードの全面的な説明と可視化を提供します。
Cloudflare Workerに基づくコード解釈サービスで、MCPプロトコルを通じてコードの構造、機能、関係を分析し、可視化されたアーキテクチャ図と詳細な説明を提供します。
APIキーが不要な多言語パッケージのドキュメント取得用MCPサービスです。複数のプログラミング言語エコシステムのドキュメントの取得と分析をサポートします。
クロード・エージェンツパワーは、ユーザーのプロジェクトを分析し、100種類以上の専門ロールから最適なチーム構成を提案するインテリジェントなMCPサーバープロジェクトです。多言語に対応しており、技術、データ、プロダクト、マーケティング、オペレーション、財務、人事、管理職などの様々な専門ロールのエージェントを提供し、自動的にダウンロードしてクロードに統合して使用できます。
Argusは、多言語のコードリポジトリ分析とセキュリティ評価ツールで、コード品質検査、セキュリティスキャン、Git操作をサポートします。
AiryLark MCPは専門レベルの翻訳サービスインターフェースで、三つの段階からなるプロセスにより翻訳品質を保証し、多言語間の相互翻訳と分野用語の識別をサポートし、技術文書、学術論文などの専門シナリオに適しています。
wttr.in サービスに基づく天気照会 MCP サーバーで、世界中の現在の天気と複数日の予報機能を提供し、中国語と英語の場所照会をサポートし、MCP クライアントアプリに簡単に統合できます。
多言語パッケージドキュメント検索と言語サーバープロトコルサポートを提供するMCPサーバー
Claudeデスクトップアプリに多形式の日時サービスを提供するMCPサーバー
このプロジェクトは、YouTube、B站などのプラットフォームから字幕をダウンロードする機能を提供し、多言語に対応し、AITransDub MCPサービスを統合しています。
DeepSRT MCPサーバーは、DeepSRT APIを統合することで、YouTube動画の要約機能を提供するプロトコルサービスで、複数の言語と要約モードをサポートします。
文字数を正確に計算できるMCPサーバーで、マルチバイト文字と複数の使用方法をサポート
リーグ・オブ・レジェンズの模擬対戦予測ツール。過去のデータに基づく召喚師分析とAI駆動の10段階対戦シミュレーションを提供し、多言語と性能比較に対応しています。
Amazon BedrockをベースにしたPowerPoint翻訳ツールで、コマンドラインとFastMCPサービスの統合をサポートし、元の形式を保持して高品質な翻訳を行います。