科大訊飛は「星火X2」大モデルを発表しました。これは国内産業の演算力で訓練されており、アルゴリズムとエンジニアリングにおいて突破を遂げています。このモデルは数学、論理推論、言語理解およびインテリジェントエージェントなどの核心的な能力において国際的にトップレベルと対等であり、業界応用のニーズに焦点を当て、国内大モデルの発展を新たな段階へと進めています。
アリババ・ダモ研究院は身体知能の脳の基盤モデルであるRynnBrainを発表し、開発者向けに7つの全シリーズモデルをオープンソース化しました。その中には30BのMoE規模のモデルも含まれます。このモデルは初めてロボットに時間と空間の記憶と空間推論能力を提供し、スマートな相互作用のレベルを顕著に向上させ、国産の身体知能ベースモデルのオープンソースエコシステムの発展を促進しました。
質変科技がマルチモーダル記憶プラットフォーム「MemoryLake」を発表。AIインフラを「データ中心」から「記憶中心」へ転換し、大規模モデルの知識不足や幻覚問題を解決。記憶メカニズムでAIの認知・判断力を向上させ、認知知能への進化を促進。....
アリババが新たに開発した基盤モデル Qwen3.5 が近日リリース予定で、HuggingFaceにコードマージ申請を提出しています。このモデルは新しいミックスドアテンションメカニズムを採用しており、視覚理解をネイティブにサポートする可能性があります。少なくとも2Bの密集型モデルと35B-A3BのMoEモデルがオープンソース化される見込みで、春節に正式なオープンソースリリースが期待されています。
NanoPic AIは先進的なAI創作プラットフォームで、画像やビデオの生成をサポートし、ワンクリックでクリエイティブなニーズを満たします。
SpikAppはAIによるロールプレイ、リアルタイムフィードバック、パーソナライズされた指導を提供し、あなたのコミュニケーション魅力を向上させます。
8000万個の住宅プロキシーアイピーを持ち、世界中でデータをスムーズに収集できます。大規模なデータ抽出をサポートします。
サンタクロースとリアルタイムのビデオチャットを行い、カスタマイズされたビデオを提供し、素敵なクリスマス体験を始めましょう!
Google
$0.49
入力トークン/百万
$2.1
出力トークン/百万
1k
コンテキスト長
Openai
$2.8
$11.2
Xai
$1.4
$3.5
2k
$7.7
$30.8
200
-
Anthropic
$105
$525
$7
$35
$17.5
$21
$0.7
Alibaba
$1
$10
256
Baidu
128
$6
$24
$4
$16
$2
$20
$8
$240
52
Bytedance
$1.2
$3.6
4
MCG-NJU
SteadyDancerは、画像から動画へのパラダイムに基づく強力なアニメーションフレームワークで、高忠実度で時間的に連続した人体アニメーションの生成に特化しています。このフレームワークは、堅牢な最初のフレームの保持メカニズムにより、従来の方法におけるアイデンティティドリフトの問題を効果的に解決し、視覚的な品質と制御性に優れており、同時にトレーニングリソースの必要量を大幅に削減します。
Clemylia
Gheya-1はLES-IA-ETOILESエコシステムにおける次世代の基礎言語モデルで、2.02億のパラメータを持ち、旧版のSmall-laminaシリーズのアップグレード版です。このモデルは専門的な微調整用に設計されており、人工知能、専門言語モデル、生物学の分野で対象的な訓練を行っています。
prithivMLmods
VibeThinker-1.5Bは微博AIが開発した15億パラメータの密集型言語モデルで、Qwen2.5-Math-1.5Bをベースに微調整され、数学やアルゴリズムコーディングの問題に特化して設計されています。「スペクトルから信号への原理」のフレームワークを用いてトレーニングされ、複数の数学コンテストのテストでより大規模なモデルを上回り、トレーニングコストは約7800ドルで、最大約40kトークンの出力をサポートします。
mlx-community
VibeThinker-1.5Bの4ビット量子化バージョンで、MLXフレームワークに基づいてAppleチップ向けに最適化されており、15億のパラメータを持つ密集型言語モデルで、数学的推論とアルゴリズムコーディングの問題に特化しています。
tencent
混元ビデオ - 1.5は軽量級で高性能なビデオ生成モデルで、わずか83億のパラメータでトップレベルのビデオ品質を提供し、使用の敷居を大幅に下げます。消費者向けGPUでスムーズに動作し、テキストからビデオ、画像からビデオの生成をサポートし、すべての開発者やクリエイターが簡単に使用できます。
Guilherme34
Qwen3-32BはQwenシリーズの最新世代の大規模言語モデルで、強力な推論、命令遵守、エージェント間の相互作用、多言語処理能力を備えています。100種類以上の言語と方言をサポートし、思考モードと非思考モードをシームレスに切り替えることができ、ユーザーに自然でスムーズな対話体験を提供します。
Kiy-K
Fyodor-StarCoder2-7B-MoEはStarCoder2-7Bをベースにした強化版で、ハイブリッドエキスパートアーキテクチャを採用し、3つのMoE層、6つのエキスパートネットワーク、top-2ルーティングメカニズムを持ち、コード生成、関数呼び出し、エージェントタスクの分野で優れた性能を発揮します。
nari-labs
Dia2はNari Labsによって開発されたストリーミング対話テキストを音声に変換する(TTS)モデルで、リアルタイム音声生成をサポートし、完全なテキストがなくても音声生成を開始でき、対話のコンテキストに応じて調整し、自然でスムーズな対話体験を実現します。
FastVideo
FastVideoチームが開発した画像を動画に変換するモデルで、CausalWan2.2 I2V A14Bシリーズに属し、8ステップ推論をサポートし、H100から4090までのさまざまなGPUに対応し、Macユーザーも使用できます。
nightmedia
Qwen3-30B-A3B-YOYO-V5-qx86-hiはYOYOシリーズの最新バージョンで、Deckard(qx)定量技術とYOYO-Fusion融合アルゴリズムを採用し、各種ベンチマークテストでバランス良く安定した性能を発揮し、人間の思考方式に近い推論能力を示します。
Qwen
Qwen3-VL-2B-Instruct-GGUFは通義千問シリーズのマルチモーダルビジュアル言語モデルのGGUF量子化バージョンで、20億のパラメータを持ち、画像理解とテキスト生成のシームレスな融合をサポートし、CPUやGPUなどのデバイスで効率的に動作します。
moonshotai
Kimi Linearは混合線形アテンションアーキテクチャで、短文脈、長文脈、および強化学習拡張メカニズムを含むさまざまなシナリオで、従来の全アテンション方法よりも優れています。従来のアテンションメカニズムが長文脈タスクで抱える効率低下の問題を効果的に解決し、自然言語処理などの分野により効率的な解決策をもたらします。
Kimi Linearは、短い文脈、長い文脈、強化学習のシナリオのすべてで、従来の全アテンション方式を上回る高効率な混合線形アテンションアーキテクチャです。Kimi Delta Attention (KDA)メカニズムによりアテンション計算を最適化し、性能とハードウェア効率を大幅に向上させ、特に100万トークンに達する長文脈タスクの処理に優れています。
strangervisionhf
これはDeepSeek - OCRに基づく画像テキスト認識モデルで、最新バージョンのtransformersライブラリでの互換性問題を特別に解決し、モデルがtransformers v4.57.1などの最新バージョンでスムーズに動作できるようにします。
FlameF0X
i3 - 80Mは革新的な混合アーキテクチャの言語モデルで、畳み込み/循環層と全アテンション層の長所を組み合わせています。このモデルはRWKVスタイルの時間混合とMamba状態空間ダイナミクスを採用し、初期層では効率的なシーケンス処理を実現し、深層では標準的なマルチヘッドアテンションメカニズムを使用して複雑なパターン認識を行います。
SamuelBang
AesCoder-4Bは、コードの美学的品質の向上に特化した大規模言語モデルです。インテリジェントな報酬フィードバックメカニズムを通じて、コード生成の美学的表現を最適化し、ウェブデザインやゲーム開発などのビジュアルコーディングタスクで優れた性能を発揮します。
nineninesix
KaniTTSは、リアルタイム対話型人工知能アプリケーション向けに最適化された高速かつ高忠実度のアラビア語テキスト音声変換モデルです。2段階パイプラインアーキテクチャを採用し、大規模言語モデルと効率的なオーディオコーデックを組み合わせることで、卓越した速度とオーディオ品質を実現し、対話型AI、障害者支援、研究など多くの分野の音声合成ニーズを満たすことができます。
nvidia
BR-RMは革新的な2ラウンド推論報酬モデルで、適応的分岐と分岐に基づく反省メカニズムにより、従来の報酬モデルにおける「判断拡散」の問題を解決し、複数の報酬モデリングベンチマークテストで業界をリードする性能を達成しました。
gghfez
このプロジェクトはGLM-4.6モデルにクリエイティブライティング制御ベクトルを提供し、制御ベクトル技術を通じてモデルの特定の次元での性能を調整します。例えば、誠実さとマキアヴェリズム傾向、コミュニケーションスタイルなどです。
EpistemeAI
これは最初の世代の強力なvibe-code大規模言語モデルで、構造が緩やかな「雰囲気コーディング」のプロンプトに基づいて直接自然言語とコードの補完を生成するように最適化されています。初期のモデルと比較して、提示エンジニアリングのコストが低く、潜在空間の補間がよりスムーズで、利用可能なコードを生成しやすくなっています。
Einoは、Golang用に設計されたLLMアプリケーション開発フレームワークで、シンプルで拡張可能で信頼性が高く効率的なコンポーネント抽象化と編成機能により、AIアプリケーションの開発プロセスを簡素化することを目的としています。豊富なコンポーネントライブラリ、強力なグラフ編成機能、完全なストリーム処理サポート、および高度に拡張可能なアスペクトメカニズムを提供し、開発からデプロイまでの全サイクルのツールチェーンを網羅しています。
PraisonAIは、自動反省機能を備えた本番環境で使用可能な多AIエージェントフレームワークです。簡単なタスクから複雑な課題まで、様々な問題を自動的に解決するAIエージェントを作成することを目的としています。PraisonAIエージェント、AG2、CrewAIを低コードソリューションに統合することで、多エージェントLLMシステムの構築と管理を簡素化し、簡単さ、カスタマイズ性、および効果的な人間との協働を重視しています。
ソロンは、高効率、オープン、エコシステムにやさしいJavaのエンタープライズアプリケーション開発フレームワークで、全シナリオの開発に対応し、高性能、低メモリ消費、高速起動、小さなパッケージサイズなどの特徴があり、Java8からJava24まで、およびGraalVMネイティブランタイムと互換性があります。
PlaywrightをベースにしたNode.jsツールで、検索エンジンの反クロールメカニズムを回避してGoogle検索を実行し、結果を抽出できます。コマンドラインツールまたはMCPサーバーとしてAIアシスタントにリアルタイム検索機能を提供できます。
MCPリーゾナーはClaude Desktop用に設計された推論能力を強化するツールで、ビームサーチとモンテカルロ木探索の2つのアルゴリズムを提供し、複雑な問題の解決を最適化するための実験的な戦略シミュレーション層を新たに追加しています。
MCP ReasonerはClaude Desktop用に設計された推論強化ツールで、Beam SearchとMCTSの2つの検索戦略を提供し、実験的なアルゴリズムを通じて複雑な問題解決能力を向上させます。
これは、MCPコード実行モードを実現するサーバーで、単一ツールブリッジとゼロコンテキスト発見メカニズムを通じて、MCPツールの呼び出しオーバーヘッドを数万トークンから約200トークンに削減し、ルートコンテナ内で安全にPythonコードを実行し、データサイエンスとセキュリティ隔離をサポートします。
このプロジェクトはブランチトリガーメカニズムを採用してNPMパッケージとDockerイメージの公開プロセスを管理し、自動バージョン管理、マルチプラットフォームビルド、公開検証機能を備えています。
AgentCraftは、安全で拡張可能なインテリジェントエージェントサービスを提供するエンタープライズレベルのAIエージェントフレームワークです。
Agent.ai APIを統合したMCPサーバーで、ウェブページのテキスト抽出、ウェブページのスクリーンショット、YouTubeの字幕取得機能を提供し、動的な関数ロードとキャッシュメカニズムをサポートします。
Pounding The RockのRSSソースに接続するMCPサーバーで、スパーズチームの最新試合結果とブログ記事へのAIアシスタントアクセスを提供します。
パズルボックスは、MCPプロトコルに基づくサーバーで、マルチエージェントシステム内の有限状態機械(「パズル」と呼ばれます)を管理および調整するために使用され、動的リソースのサブスクライブと状態の更新をサポートします。
Squiggle APIに基づくAFL(オーストラリア・フットボール・リーグ)データのMCPサーバーで、試合結果、チーム情報、シーズン順位などのデータ照会機能を提供します。
TypeScriptベースのMCPサーバーで、ニューヨークタイムズの記事検索機能を提供します。
非公式のReactome MCPサーバーで、Reactome経路およびシステム生物学データへのアクセスを提供するモデルコンテキストプロトコルサービスです。8つの検証済みの機能ツールが含まれ、経路検索、詳細情報取得、遺伝子関連、疾病メカニズムなどのバイオインフォマティクス分析をカバーしています。
FortunaMCPは高度なMCPサーバーで、高品質な乱数生成に特化しており、AIアプリケーションのシミュレーション、モデリング、ゲームメカニズムなどのシナリオに適しています。
MusicMCP.AIの公式MCPサーバーで、自然言語の指示でAIアシスタント(Claudeなど)が高度なAI音楽生成プラットフォームを呼び出せます。インスピレーションモードとカスタマイズモードで曲を生成し、残高確認とヘルスチェック機能も提供します。
Rustを用いて開発されたローカライズされたAI財務管理システムで、自然言語入力、インテリジェント分析、税務計算、債務追跡をサポートし、すべてのデータはローカルのSQLiteデータベースに保存されます。
AIアシスタントがウェブサイトの反クローラーメカニズムを回避してテキストコンテンツを取得するためのMCPサーバーツール
MCPフレームワークに基づくMySQLクエリサーバーで、SSEによるリアルタイムデータベース操作インターフェースとセキュリティ保護メカニズムを提供します。