小米は、自社開発の大規模モデル「MiMo-V2-Flash」のパブリックベータテストの無料期間を20日間延長し、2026年1月20日までに変更した。このモデルのパラメーター数は3090億で、アクティブなパラメーターは150億であり、推論やコード生成において優れた性能を発揮している。この措置はユーザーにさらに長い体験時間を提供することを目的としており、小米がAI分野における継続的な投資と自信を示すためでもある。
Meta AIがPixio画像モデルを発表。MAEフレームワークを改良し、深さ推定や3D再構築などのタスクで優れた性能を発揮し、従来の複雑なアルゴリズムに対するMAEの限界に挑戦。....
クリスマスに、エッジAIスタートアップのLiquid AIがオープンソースモデルのLFM2-2.6B-Expをリリースしました。わずか26億パラメータながら、多くのベンチマークテストで優れた性能を示し、数百億パラメータを持つDeepSeek R1-0528よりも命令に従う能力が優れていると評価されており、「最強の3Bクラスモデル」として注目されています。このモデルは、第2世代のLFM2ベースモデルに基づき、純粋な強化学習により実験的な突破を達成しました。
阿里巴巴がオープンソースの音声大規模モデル「Fun-Audio-Chat-8B」を公開。超低遅延と自然な対話を特徴とし、GPT-4o Audioなどのクローズドモデルに匹敵する性能を持つ。リアルタイム理解と感情認識能力を備え、真のAI音声パートナーを目指す。....
1つのAPIですべてのトップレベルのAIモデルに接続し、高性能でコストパフォーマンスが高く、複数のタイプの生成をサポートします。
Didoo AIはリンクを高性能なMeta広告に変換し、購入者を正確にターゲットにし、継続的に最適化します。
Flux.2 AI画像生成器は、文章から画像の生成や画像から画像の生成をサポートし、高品質で高速な性能を備えています。
AI取引のリアルタイム性能基準プラットフォーム。
Openai
$2.8
入力トークン/百万
$11.2
出力トークン/百万
1k
コンテキスト長
Google
$0.7
Anthropic
$7
$35
200
$2.1
$17.5
$21
$105
Alibaba
$1
$10
256
Baidu
-
128
$4
$16
$3.9
$15.2
64
Bytedance
$0.8
$2
Deepseek
$12
Tencent
32
$1.6
$0.4
$1.75
$14
400
prithivMLmods
Olmo-3-7B-Instruct-AIO-GGUFは、Allen Institute for AIが開発したOlmo-3-7B-InstructモデルのGGUF量子化バージョンです。これは70億パラメータの自己回帰型言語モデルで、Tulu 2やUltraFeedbackなどのデータセットで教師付き微調整と直接的な嗜好最適化を行って訓練され、質問応答と指令の遵守において優れた性能を発揮します。
allenai
Olmo 3は、Allen Institute for AIによって開発された次世代の言語モデルファミリーで、7Bと32Bの指令と思考のバリエーションを含んでいます。このモデルは、長鎖思考において優れた性能を発揮し、数学やコーディングなどの推論タスクの性能を大幅に向上させます。すべてのコード、チェックポイント、およびトレーニングの詳細は公開され、言語モデル科学の発展を促進します。
Olmo 3は、Allen Institute for AIによって開発された次世代の言語モデルシリーズで、7Bと32Bの2種類の規模があり、命令型と思考型の2種類のバリエーションがあります。このモデルはDolma 3データセットで事前学習され、Dolciデータセットで事後学習され、長い連鎖的な思考能力を備えており、数学やコーディングなどの推論タスクで優れた性能を発揮します。
XiaomiMiMo
米モデルのエンボディメントモデル(MiMo-Embodied)は、強力なクロスエンボディメント視覚言語モデルであり、自動運転とエンボディメントAIタスクの両方で卓越した性能を発揮します。これは、この2つの重要な分野を結合した最初のオープンソースの視覚言語モデルであり、動的な物理環境における理解と推論能力を大幅に向上させました。
Olmo 3はAllen Institute for AIによって開発された一連の言語モデルで、7Bと32Bの2種類の規模があり、命令式と思考式の2種類のバリエーションがあります。このモデルは長鎖思考に優れており、数学やコーディングなどの推論タスクの性能を効果的に向上させることができます。多段階訓練方式を採用しており、教師付き微調整、直接嗜好最適化、検証可能な報酬による強化学習が含まれます。
Olmo-3-7B-Think-DPOはAllen Institute for AIが開発した70億パラメータの言語モデルで、長い連鎖的な思考能力を持ち、数学やコーディングなどの推論タスクで優れた性能を発揮します。このモデルは、教師付き微調整、直接的な嗜好最適化、検証可能な報酬に基づく強化学習などの多段階の訓練を経ており、研究や教育目的に特化して設計されています。
Olmo 3はAllen Institute for AI (Ai2)によって開発された一連の言語モデルで、7Bと32Bの2種類の規格があり、InstructとThinkの2種類のバリエーションがあります。このモデルはTransformerアーキテクチャに基づいており、長い思考チェーン能力を持ち、数学やコーディングなどの推論タスクの性能を効果的に向上させることができます。
Olmo 3はAllen Institute for AIによって開発された全新型の言語モデルファミリーで、7Bと32Bの2種類の規模があり、指令(Instruct)と思考(Think)の2種類のバリエーションがあります。このモデルは長鎖型の思考を用いて、数学やコーディングなどの推論タスクの性能を向上させ、言語モデル科学の発展を推進することを目的としています。
Olmo-3-32B-Think-DPOはAllen AIが開発した32Bパラメータの言語モデルで、直接嗜好最適化(DPO)を用いて訓練され、長鎖的な思考推論能力を備え、数学やコーディングなどの複雑な推論タスクで優れた性能を発揮します。
moonshotai
Kimi K2 Thinkingは月の暗面(Moonshot AI)が開発した最新世代のオープンソース思考モデルで、強力な深度推論能力とツール呼び出し機能を備えています。このモデルは混合専門家アーキテクチャを採用し、ネイティブINT4量子化をサポートし、256kのコンテキストウィンドウを持ち、複数のベンチマークテストで優れた性能を発揮します。
pnnbao-ump
VieNeu-TTSは、個人デバイス上で動作可能な最初のベトナム語のテキスト音声変換モデルで、即時音声クローニング機能を備えています。NeuTTS Airをベースに微調整され、自然でリアルなベトナム語音声を生成でき、CPU上でリアルタイム性能を備えています。
LiquidAI
LFM2-VL-3BはLiquid AIが開発したマルチモーダル視覚言語モデルで、LFM2バックボーンアーキテクチャに基づいて構築されており、強力な視覚理解と推論能力を備えており、特に細粒度な感知タスクで優れた性能を発揮します。このモデルは、テキストと画像の入力を効率的に処理することができ、最大512×512解像度の原生画像処理をサポートしています。
Olmo-3-7B-Think-SFTはAllen Institute for AIが開発した7Bパラメータの言語モデルで、長い連鎖的な思考能力を持ち、数学やコーディングなどの推論タスクで優れた性能を発揮します。このモデルはDolma 3データセットで事前学習され、Dolciデータセットで後続の学習が行われています。
unsloth
ApertusはスイスのAIによって開発された完全にオープンな多言語大規模言語モデルで、70億と80億の2種類のパラメータ規模を提供します。このモデルは1000種類以上の言語をサポートし、完全にコンプライアンスでオープンな学習データを使用し、その性能はクローズドソースモデルに匹敵します。Apertusは15Tのトークンで事前学習され、段階的なコース学習方法を採用し、最大65,536トークンのコンテキスト長をサポートします。
redponike
ApertusはスイスのAIによって開発された完全にオープンな多言語大規模言語モデルで、パラメータ規模は80億と700億で、1000種以上の言語と長文脈処理をサポートし、完全にコンプライアンスの取れたオープンな学習データのみを使用し、性能はクローズドソースモデルに匹敵します。
GLM-4.6は智譜AIが発表した次世代のテキスト生成モデルで、GLM-4.5と比較して、長いコンテキストウィンドウ、より優れたコーディング性能、より強力な推論能力など、多くの面で顕著な改善が見られます。このモデルは、いくつかの公開ベンチマークテストで優れた結果を収めており、国内外の主要モデルと比較しても競争力があります。
GLM-4.6は智譜AIが開発した次世代の大規模言語モデルで、GLM-4.5と比較して、文脈処理、コーディング能力、推論性能の面で著しい向上が見られます。このモデルは200Kの文脈長をサポートし、複数の公開ベンチマークテストで優れた成績を収めており、特にコード生成、推論、エージェントタスクの分野で競争力を持っています。
zai-org
GLM-4.6は智譜AIが発表した次世代のテキスト生成モデルで、GLM-4.5と比較して、文脈処理、コード化性能、推論能力などの面で著しい向上を実現し、200Kの文脈長をサポートし、より強力なエージェント能力と洗練されたライティング能力を備えています。
GLM-4.6-FP8は智譜AIが発表した次世代のテキスト生成モデルで、GLM-4.5と比較していくつかの重要な点で著しい改善が見られます。このモデルはより長い文脈ウィンドウ、卓越したコーディング性能、高度な推論能力、およびより強力なエージェント機能を備えており、より複雑なタスクを処理することができます。
Salesforce
CoDAはSalesforce AI Researchによって開発された拡散モデルに基づくコード生成言語モデルで、双方向コンテキスト理解能力を備え、強力なコード生成と補完タスク用に設計されています。このモデルはわずか17億のパラメータで、低い計算要件を維持しながら卓越したコード生成性能を実現しています。
TurboVaultは、プロダクションレベルのMCPサーバーで、ObsidianナレッジベースをAI駆動のインテリジェントな知識システムに変換し、ノートの読み書き、検索、分析、管理のための44個の専用ツールを提供し、100ミリ秒未満の性能を発揮します。
MCPインターネット速度テストは、標準化されたMCPプロトコルを通じてAIモデルにネットワーク性能テストツールを提供する実験的なプロジェクトです。ダウンロード/アップロード速度、遅延、ジッター測定などの機能が含まれています。
DistriはRustベースの組み合わせ可能なAIエージェントフレームワークで、MCPプロトコルを通じてインテリジェントエージェントの機能を構築および組み合わせることをサポートし、モジュール化設計と高い性能を提供します。
Vibe Coding方法と知識グラフ技術を統合したMCPサーバーで、Kuzuグラフデータベースを使用してAI支援ソフトウェア開発を行い、多言語コード分析と企業レベルのセキュリティ性能をサポートします。
MyMCPはPythonベースのアプリケーションで、Aiderツールを通じて複数のAIコーディングタスクを並列に実行することをサポートし、並列/順次実行の選択、詳細なレポート、および性能比較機能を提供します。
リーグ・オブ・レジェンズの模擬対戦予測ツール。過去のデータに基づく召喚師分析とAI駆動の10段階対戦シミュレーションを提供し、多言語と性能比較に対応しています。
このプロジェクトは、Notion APIに対する読み取り専用のMCPサーバーを実装しており、AIアシスタントに対して効率的なコンテンツのクエリと検索機能を提供することに焦点を当てています。ツールセットの簡素化、並列処理、自動コンテンツ探索などの最適化手法により、性能が大幅に向上し、AIアシスタントのツール数の制限の問題が解決されました。
Model Context Protocolに基づくサービスで、Google PageSpeed Insightsのウェブページパフォーマンス分析機能を提供し、AIモデルが標準化されたインターフェースを通じてウェブページの読み込み性能を評価できるようにします。
Locust - MCP - Serverは、Model Context Protocolフレームワークに基づく負荷テストサーバーで、AI開発環境を通じてLocust性能テストをシームレスに実行でき、設定可能なテストパラメータとリアルタイムの実行出力を提供します。
BetterPrompt MCPは、モデルコンテキストプロトコル(MCP)に基づくサーバーで、高度なプロンプトエンジニアリング技術を通じて、ユーザーのシンプルなリクエストを構造が明確でコンテキストが豊富な最適化された命令に変換し、AIモデルの性能を大幅に向上させます。
進化アルゴリズムに基づいてAIプロンプトを自動的に最適化するMCPサービスで、遺伝的アルゴリズムを通じてプロンプトの性能を反復的に改善します。