Amazon KindleがAI翻訳ツール「Kindle Translate」をテスト公開。自費出版の著者が電子書籍を無料で多言語翻訳可能。現在は英語とスペイン語の相互翻訳、ドイツ語から英語への翻訳をサポート。著者は翻訳言語を選択し、バージョンを管理できる。....
GoogleがDS STARを発表。ビジネス課題を自動でPythonコードに変換し、CSVやJSONなど多様なデータ形式を直接処理可能。Analyzerコンポーネントで完全自動化を実現。....
美团LongCatチームがUNO-Benchを発表。44種類のタスクと5つのモーダルをカバーし、1250の全モーダルサンプルと2480の単一モーダルサンプルで、マルチモーダルモデルの性能を包括的に評価。....
科大訊飛は2025年1024開発者祭でAIソフトウェア・ハードウェア統合ソリューションを発表し、アルゴリズムとハードウェアの深く融合することで、高ノイズや遠距離などの複雑な環境下での認識問題を解決し、音声および視覚のインテリジェンスの精度を向上させ、この分野における重要な進展を示した。
AIメールマーケティングツールで、メールの作成、自動化プロセスの設定、インタラクティブ要素の追加が可能で、コンバージョン率を向上させます。
AIツール、通常の製品画像を10秒でプロ写真に変換、テンプレートとカスタマイズ機能あり
無料のオンラインツールで、テキスト、PDF、画像などを処理することができます。ログイン不要で、高速かつプライバシーを保護しています。
GoMim は個人向けの数学 AI コンサルタントであり、無料のオンラインのステップバイステップの解答を提供しています。
xai
$21.6
入力トークン/百万
$108
出力トークン/百万
256k
コンテキスト長
openai
$144
$576
200k
google
$9
$72
1M
deepseek
$3.6
$15.48
128k
chatglm
$0.43
$1.01
131.1k
minimax
-
$2.16
$18
$2.02
$5.98
$0.8
$2
alibaba
$0.72
tencent
32k
anthropic
$2.88
$11.52
upstage
64k
meta
$1.22
$4.32
mistral
unsloth
Qwen3-VLは通義シリーズの中で最も強力なビジュアル言語モデルで、卓越したテキスト理解と生成能力、深いビジュアル感知と推論能力、長いコンテキストのサポート、強力な空間とビデオ動的理解能力、そして優れたインテリジェントエージェント対話能力を備えています。
Qwen3-VLは通義シリーズで最も強力なビジュアル言語モデルで、テキスト理解と生成、ビジュアル認知と推論、コンテキスト長、空間およびビデオの動的理解、エージェントインタラクション能力などの面で全面的にアップグレードされています。このモデルは密集アーキテクチャとハイブリッドエキスパートアーキテクチャを提供し、エッジデバイスからクラウドまでの柔軟なデプロイをサポートします。
Qwen3-VLはQwenシリーズの中で最も強力なビジュアル言語モデルで、卓越したテキスト理解と生成能力、深いビジュアル認知と推論能力、長いコンテキストサポート、強力な空間とビデオ動的理解能力、そして優れたエージェントインタラクション能力を備えています。このバージョンは2Bパラメータの思考強化版で、推論能力が特別に最適化されています。
oberbics
このモデルはMetaのLlama-3.1アーキテクチャをベースに微調整されたテキスト生成モデルで、TRLライブラリとGRPO(Group Relative Policy Optimization)手法を用いて強化学習トレーニングを行い、特に論証生成タスクに最適化されています。
JanusCoder-8Bは、Qwen3-8Bをベースに構築されたオープンソースのコードインテリジェンス基礎モデルで、統一されたビジュアルプログラミングインターフェイスを構築することを目的としています。このモデルは、JANUSCODE-800K(これまでで最大のマルチモーダルコードコーパス)で学習され、データ可視化、インタラクティブなWeb UI、コード駆動のアニメーションなど、さまざまなビジュアルプログラミングタスクを処理できます。
Mungert
gpt-oss-safeguard-20bは、GPT-OSS-20bをファインチューニングした安全推論モデルで、大規模言語モデルの入出力フィルタリング、オンラインコンテンツのラベリング、および信頼と安全のユースケースのオフラインラベリングに特化しています。このモデルはApache 2.0ライセンスを採用しており、カスタムポリシーと透明な決定プロセスをサポートしています。
Qwen
Qwen3-VL-30B-A3B-Instructは通義シリーズで最も強力なビジュアル言語モデルで、ハイブリッドエキスパートモデルアーキテクチャを採用し、優れたテキスト理解と生成能力、深いビジュアル感知と推論能力を備え、256Kの長いコンテキストとビデオ理解をサポートし、さまざまなデバイスで推論が可能です。
OPPOer
Qwen-Image-Editをベースにしたモデルの剪定バージョンで、20層を削除し、40層の重みを保持し、最終的なモデルサイズは13.6Bパラメータです。これは画像編集モデルで、複数の画像入力とテキストによる画像合成と編集をサポートします。
BAAI
Emu3.5は北京智源人工知能研究院(BAAI)によって開発されたネイティブマルチモーダルモデルで、視覚と言語をまたいで次の状態を連合予測し、一貫した世界モデリングと生成を実現し、マルチモーダルタスクで卓越した性能を発揮します。
Qwen3-VL-8B-Thinkingは通義千問シリーズの中で最も強力なビジュアル言語モデルで、強化された推論能力を備えた8Bパラメータ版です。このモデルは、テキスト理解、ビジュアル認知、空間理解、長文脈処理などの面で全面的にアップグレードされ、マルチモーダル推論とエージェントインタラクションをサポートしています。
Qwen3-VLは通義シリーズで最も強力な視覚言語モデルで、優れたテキスト理解と生成能力、深い視覚感知と推論能力、長文脈サポート、強力な空間およびビデオ動的理解能力、ならびにエージェントインタラクション能力を備えています。このリポジトリはGGUF形式の重みを提供し、CPU、GPUなどのデバイスでの効率的な推論をサポートします。
Qwen3-VL-2B-Instruct-GGUFは通義千問シリーズのマルチモーダルビジュアル言語モデルのGGUF量子化バージョンで、20億のパラメータを持ち、画像理解とテキスト生成のシームレスな融合をサポートし、CPUやGPUなどのデバイスで効率的に動作します。
Qwen3-VLはこれまでのQwenシリーズで最も強力なビジュアル言語モデルで、テキスト理解と生成、ビジュアル認識と推論、コンテキスト長、空間と動画の動的理解、エージェントの対話能力などの面で全面的にアップグレードされています。このモデルはハイブリッドエキスパート(MoE)アーキテクチャを採用し、卓越したマルチモーダル処理能力を提供します。
Qwen3-VLは通義大規模モデルシリーズの中で最も強力なビジュアル言語モデルで、卓越したテキスト理解と生成能力、深いビジュアル認識と推論能力、長いコンテキストのサポート、強力な空間とビデオ動的理解能力、そして優れたインテリジェントエージェント対話能力を備えています。このモデルはハイブリッドエキスパート(MoE)アーキテクチャを採用し、推論を強化した思考版です。
Qwen3-VLは通義シリーズの中で最も強力なビジュアル言語モデルで、テキスト理解と生成、ビジュアル感知と推論、コンテキスト長、空間およびビデオの動的理解、エージェントの対話能力などの面で全面的にアップグレードされています。このモデルは密集アーキテクチャとハイブリッドエキスパートアーキテクチャを提供し、エッジデバイスからクラウドまでの柔軟なデプロイをサポートします。
Qwen3-VLは通義シリーズの中で最も強力なビジュアル言語モデルで、卓越したテキスト理解と生成能力、深いビジュアル認識と推論能力、長いコンテキストサポート、強力な空間とビデオ動態理解能力、そして優れたインテリジェントエージェント対話能力を備えています。
Qwen3-VLはアリババが開発した最新世代のビジュアル言語モデルで、テキスト理解、ビジュアル認知、空間理解、ビデオ分析、エージェントインタラクションなどの分野で著しい向上が見られます。このモデルはマルチモーダル入力をサポートし、強力な推論能力と長文脈処理能力を備えています。
bartowski
これはQwen3-VL-2B-Instructモデルの量子化バージョンで、llama.cppツールとimatrix方法を使用して、さまざまな量子化レベルのモデルファイルを生成し、さまざまなハードウェア環境で高効率に動作させることができます。このモデルは20億パラメータのマルチモーダルビジュアル言語モデルで、画像とテキストの相互作用をサポートしています。
mradermacher
Hebrew_Nemoはヘブライ語処理に特化した大規模言語モデルで、指令微調整を行い、テキスト生成と会話インタラクションをサポートしています。このバージョンは元のモデルのGGUF量子化バージョンで、複数の量子化レベルを選択できます。
これはSicariusSicariiStuff/Hebrew_Nemoモデルに基づく量子化バージョンで、ヘブライ語に特化して最適化されたMistralアーキテクチャの大規模言語モデルで、ヘブライ語と英語のテキスト生成および対話タスクをサポートします。
sitemcpは、ウェブサイト全体の内容を取得し、それをMCPサーバーとして使用できるツールで、カスタムマッチングページ、コンテンツセレクターなどの機能をサポートし、ドキュメントやブログサイトの迅速な検索に適しています。
wcgwはMCPサーバープロジェクトで、シェルとコードエディターツールが統合されており、AIがローカルマシン上でコマンドを実行し、ファイルを読み書きし、コードを編集するなどの操作ができます。アーキテクトモード、コード作成モードなどの複数のモードを提供し、タスクチェックポイント保存、ターミナル対話、構文チェックなどの機能をサポートしており、コード開発、問題解決などのシーンに適しています。
これは、ブラウザ制御、芸術と文化、クラウドプラットフォーム、コマンドライン、通信、顧客データプラットフォーム、データベース、開発者ツール、データサイエンスツール、ファイルシステム、金融とフィンテック、ゲーム、知識と記憶、位置サービス、マーケティング、監視、検索、ユーティリティツールなど、複数のカテゴリをカバーする、継続的に更新されるMCPサーバーの選りすぐりのリストです。各プロジェクトにはGitHubリンクとスター数が付属しており、ユーザーがすぐに理解して使用できるようになっています。
HiveChatは中小チーム向けに設計されたAIチャットアプリで、複数の大規模モデルサービスプロバイダーをサポートし、グループ管理、トークン制限、サードパーティログインなどの機能を提供します。
UnityMCPはUnityエディターのプラグインで、モデルコンテキストプロトコル (MCP) を実装し、UnityとAIアシスタントのシームレスな統合を提供します。リアルタイムの状態監視、リモートコマンドの実行、ログ機能が含まれます。
MCPシールドは、MCPサーバーの脆弱性をスキャンするためのセキュリティツールです。ツール投毒攻撃、データ漏洩経路、クロスドメイン違反などのセキュリティリスクを検出することができます。
FastAPI - MCPは、FastAPIエンドポイントをモデルコンテキストプロトコル (MCP) ツールとして公開するライブラリで、組み込み認証機能を備え、柔軟なデプロイとASGI伝送をサポートします。
MCP-Scanは、MCPサーバー用のセキュリティスキャンツールで、提示注入、ツール汚染、クロスドメインアップグレードなどの一般的なセキュリティホールを検出します。
Awesome-MCP-ZHは、中国語ユーザー向けに作成されたMCP(モデルコンテキストプロトコル)のリソースコレクションです。MCPの基本的な説明、使い方、クライアント、サーバー、コミュニティリソースが含まれ、ユーザーがすぐにMCPを使い始めるのに役立ちます。
Genkitは、AI駆動のアプリケーションを構築するためのオープンソースフレームワークで、Node.jsとGoのライブラリを提供し、複数のAIモデルとベクトルデータベースの統合をサポートし、開発ツールとプラグインエコシステムを含んでいます。
MCPアトラシアンは、アトラシアンの製品(ConfluenceとJira)用に設計されたモデルコンテキストプロトコルサーバーで、クラウドとオンプレミスの両方のデプロイをサポートし、AIアシスタントの統合機能を提供します。
FastMCPは、TypeScriptに基づくフレームワークで、クライアントセッションをサポートするMCPサーバーを構築するために使用されます。ツール、リソース、プロンプトの簡単な定義を提供し、認証、セッション管理、画像と音声コンテンツの返却、ログ記録、エラー処理、SSE通信などの機能をサポートし、テストとデバッグ用のCLIツールも含まれています。
OpenSumiは、AIネイティブのIDE製品を迅速に構築するのに役立つフレームワークで、クラウドとデスクトップの開発環境をサポートし、豊富なサンプルプロジェクトとテンプレートを提供します。
Apple MCPツールセットは、MCPプロトコルに基づくAppleのネイティブツールセットで、メッセージ、メモ、連絡先、メール、リマインダー、カレンダーなどのAppleエコシステムの統合サービスを提供します。
XcodeBuild MCPは、AIアシスタントとMCPクライアントにXcode関連のツールを統合するサーバーで、Xcodeプロジェクト管理、シミュレーター制御、アプリユーティリティなどの機能をサポートし、開発プロセスの自動化を実現します。
デスクトップコマンダーMCPは、Claudeデスクトップアプリケーションがターミナルコマンドを実行し、ファイルシステムを管理できるAIアシスタントツールです。コードの検索、編集、プロセス管理、リモートファイルの読み取りなどの機能をサポートします。
Markdownifyは、PDF、画像、音声などのさまざまな形式やウェブページのコンテンツをMarkdown形式に変換することができる多機能ファイル変換サービスです。
EdgeOne Pages MCPは、MCPプロトコルを通じてHTMLコンテンツをEdgeOne Pagesに迅速にデプロイし、公開URLを取得するサービスです。
MiniMax Model Context Protocol (MCP) は公式サーバーで、強力なテキスト読み上げ、ビデオ/画像生成APIとのやり取りをサポートし、Claude Desktop、Cursorなどの様々なクライアントツールに適しています。
Perplexity MCP Serverは、PerplexityのAIモデルを利用して、クエリの複雑度を自動的に分析し、最適なモデルを選択してリクエストを処理するインテリジェントな研究アシスタントです。検索、推論、深掘り研究の3種類のツールをサポートしています。