快手Kling AI 2.6がリリースされ、初めて音声生成機能を統合。中英バイリンガル対話、歌唱、音響効果をサポートし、テキスト、動画、音声をワンクリックで同期生成。拡散トランスフォーマーと3D時空間共同注意アーキテクチャを採用し、複雑な指示遵守率を15%向上、シーン間キャラクター一貫性を強化。動画出力は10秒1080P HDを維持し、生成コストを30%削減。....
アリケンワンは複数の国際試験で優れた成績を収め、SATで1580点を獲得しました。また、アプリの機能をアップグレードし、「写真で質問」と「宿題の添削」を追加し、生徒に専門的な学習支援を提供しています。
Sora2公開後ダウンロードは急増したが、定着率は低く、体験は不満足でコストも高い。動画生成の成功率は5-10%のみで、利用可能な素材を得るには複数回の試行が必要。レンダリング待ち時間や失敗率も高く、OpenAIは日額約1500万ドルの計算コストを負担。年間コストは約55億ドルに達し、有料ユーザー収入では巨額支出を賄えず、ビジネスモデルに課題。....
アリババの通義千問チームがNeurIPS 2025で最優秀論文賞を受賞。論文『Attention Gating Makes Better Foundation Models』は「スライドゲート」機構を提案し、標準アテンション後に学習可能なゲートを追加して重要ヘッドとトークンを動的に選別。1.7Bパラメータモデルが15B MoEモデルと同等性能を達成。応募2万件中4作品の受賞作で唯一の中国成果。....
5000冊以上の書籍の要約と分析を提供し、速読に適しています。
AIフィードバック、予測ヒートマップ、クリアネススコアにより設計プロセスを最適化し、毎週15~20時間を節約します。
イノベーター、クリエイター、起業家、実行者向けに設計された新しいプロフェッショナルなネットワーク。
15種類以上のツールを統合した、ワンストップビジネススイートです。
Deepseek
$2
入力トークン/百万
-
出力トークン/百万
8
コンテキスト長
Bigcode
prithivMLmods
VibeThinker-1.5Bは微博AIが開発した15億パラメータの密集型言語モデルで、Qwen2.5-Math-1.5Bをベースに微調整され、数学やアルゴリズムコーディングの問題に特化して設計されています。「スペクトルから信号への原理」のフレームワークを用いてトレーニングされ、複数の数学コンテストのテストでより大規模なモデルを上回り、トレーニングコストは約7800ドルで、最大約40kトークンの出力をサポートします。
mlx-community
VibeThinker-1.5Bの4ビット量子化バージョンで、MLXフレームワークに基づいてAppleチップ向けに最適化されており、15億のパラメータを持つ密集型言語モデルで、数学的推論とアルゴリズムコーディングの問題に特化しています。
MaziyarPanahi
VibeThinker-1.5B-GGUFはWeiboAI/VibeThinker-1.5BモデルのGGUF量子化バージョンで、MaziyarPanahiによって量子化処理されました。このモデルは15億パラメータのテキスト生成モデルで、2ビットから8ビットまでの複数の量子化レベルをサポートし、さまざまなハードウェアで効率的に動作します。
noctrex
本プロジェクトはカナナ1.5 - 15.7B - A3B指令モデルのMXFP4_MOE量子化バージョンで、特定のシナリオでモデルの実行効率を向上させることができます。このモデルはkakaocorp/kanana-1.5-15.7b-a3b-instructをベースに最適化され、ハイブリッドエキスパートアーキテクチャとMXFP4量子化技術を採用しています。
ServiceNow-AI
Apriel-H1-15b-Thinkerは150億のパラメータを持つ混合推論モデルで、Transformerの注意力機構とMambaの状態空間層を組み合わせており、推論、数学、コーディングなどの分野で優れた性能を発揮し、高効率性と拡張性を備えています。
almanach
Gaperon-Young-1125-1Bは、15億のパラメータを持つバイリンガル(フランス語 - 英語)言語モデルで、フランス国立情報学・自動制御研究所(Inria Paris)のALMAnaCHチームによって開発されました。このモデルは約3兆個の高品質トークンで訓練され、ベンチマークテストの最適化ではなく、言語品質と一般的なテキスト生成能力に特に重点を置いています。
unsloth
ApertusはスイスのAIによって開発された完全にオープンな多言語大規模言語モデルで、70億と80億の2種類のパラメータ規模を提供します。このモデルは1000種類以上の言語をサポートし、完全にコンプライアンスでオープンな学習データを使用し、その性能はクローズドソースモデルに匹敵します。Apertusは15Tのトークンで事前学習され、段階的なコース学習方法を採用し、最大65,536トークンのコンテキスト長をサポートします。
cpatonn
Apriel-1.5-15b-ThinkerはServiceNowが開発した150億パラメータのマルチモーダル推論モデルで、テキストと画像の推論能力を備え、その性能は10倍大きいモデルに匹敵します。人工分析指数で52点を獲得し、企業分野のベンチマークテストで優れた成績を収めています。
birder-project
これはRoPE(回転位置符号化)に基づくVision Transformerモデルで、パラメータ規模は150Mで、14x14のパッチサイズを採用しています。このモデルは約2100万枚の画像からなる多様なデータセットで事前学習されており、汎用的なビジュアル特徴抽出器として使用できます。
Apriel-1.5-15B-Thinkerは、画像理解と推論のために設計された150億パラメータのマルチモーダルモデルで、中期トレーニング方法を採用し、RLHFトレーニングではありません。このバージョンはAppleチップに適したMLX量子化バージョンで、メモリ使用量が少なく、起動速度が速いという特徴があります。
Apriel-1.5-15b-ThinkerはServiceNow Apriel SLMシリーズのマルチモーダル推論モデルで、150億のパラメータを持ち、テキストと画像の推論タスクで規模が10倍大きいモデルと競争できます。このモデルは中期トレーニング方式により卓越した推論能力を実現し、画像SFTトレーニングや強化学習なしでSOTA性能を達成します。
yonigozlan
EdgeTAMはSAM 2の軽量化バリアントで、デバイス上のビデオ分割と追跡用に設計されています。SAM 2より22倍速く、iPhone 15 Pro Maxで16 FPSに達することができ、リアルタイムのビデオオブジェクト分割とフレーム間の追跡をサポートします。
nineninesix
KaniTTSは高速で高忠実度のテキスト音声変換モデルで、リアルタイム対話型人工知能アプリケーション向けに最適化されています。このモデルは2段階の処理フローを採用し、大規模言語モデルと効率的なオーディオコーデックを組み合わせています。Nvidia RTX 5080で15秒の音声を生成する際の遅延は約1秒だけで、MOS自然度評価は4.3/5で、英語、中国語、日本語などの多言語をサポートしています。
Apriel-1.5-15b-ThinkerはServiceNowが開発したマルチモーダル推論モデルで、150億のパラメータを持ち、テキストと画像の推論タスクで優れた性能を発揮し、その10倍の大きさのモデルと競争できる性能を持っています。
ibm-granite
Granite-4.0-Micro-BaseはIBMが開発したデコーダーのみの長文脈言語モデルで、約15兆のトークンを使ってゼロから学習され、四ステージトレーニング戦略を採用しています。このモデルは様々なテキスト生成タスクに特化して設計されており、多言語と穴埋め式のコード補完機能をサポートしています。
olegshulyakov
Qwen2.5-Coder-1.5Bは、Qwenシリーズの基礎モデルに基づいて開発されたコード生成専用モデルで、15億のパラメータを持ち、コード関連のテキスト生成タスクに特化しています。このモデルはGGUFで量子化処理されており、さまざまなデプロイ方法をサポートし、開発者に効率的なコード生成ソリューションを提供します。
LiquidAI
LFM2-Audio-1.5BはLiquid AIが提供する最初のエンドツーエンドの音声基礎モデルで、低遅延とリアルタイム対話に特化して設計されています。このモデルはわずか15億パラメータで、シームレスな対話インタラクションを実現し、パラメータ規模がはるかに大きいモデルと匹敵する能力を持っています。
NetoAISolutions
TSLAM-15BはNetoAI Solutionsによって開発された150億パラメータの電信専用言語モデルで、混合専門家アーキテクチャに基づき、電信分野の専門知識、高度な推論、およびアクション指向のワークフローに対して最適化されています。
jinaai
Jina Code Embeddingsは、コード検索用に特別に設計された埋め込みモデルで、Qwen2.5-Coder-0.5Bに基づいて構築されています。15種類以上のプログラミング言語をサポートし、テキストからコード、コードからコード、コードからテキスト、コード補完などの様々なコード検索タスクや技術的な質問応答に適しています。
DavidAU
これはQwen 3プラットフォームに基づくコーディング/プログラミングモデルで、完全な推論能力を備え、速度が非常に速いです。中程度のハードウェアでは1秒あたり150以上のトークンを処理でき、CPUのみを使用しても1秒あたり50以上のトークンを処理できます。これは汎用的なコーディングモデルで、コードブロックの生成、コーディングのアイデアの構想、およびコード草稿の迅速な生成に適しています。
Python Alfresco MCP Serverは、FastMCP 2.0フレームワークに基づいて構築されたAlfrescoコンテンツサービスモデルコンテキストプロトコルサーバーで、全文検索、ドキュメント管理、メタデータ操作など15種類のツールを提供し、STDIO/HTTP/SSEの複数の伝送プロトコルをサポートし、Alfrescoコミュニティ版とエンタープライズ版に適しています。
TypeScriptに基づくMCPサーバーで、AntVグラフ生成機能を提供し、15種類以上のグラフタイプをサポートします。
Cocos Creator MCP Server Pluginは、Cocos Creator 3.8+向けに設計された包括的なMCPサーバープラグインです。標準化されたプロトコルを通じてAIアシスタントとエディターのインタラクションを実現し、ワンクリックインストールと151種類のツールを提供し、エディターの制御機能の98%をカバーします。
Feather Code MCPサーバーは、Claude Desktop用に設計されたGitHub統合ツールで、Model Context Protocol(MCP)を通じて15種類のGitHub機能ツールを提供し、自動リポジトリ検出、複数の認証方式、ゼロ設定での使用をサポートします。
MockLoop MCPは世界初のAIネイティブなAPIテストプラットフォームで、Model Context Protocol (MCP)を統合し、AI駆動のシナリオ生成、自動化テスト実行、スマート分析機能により、APIテスト方法を革新します。このプラットフォームは5種類のAIプロンプト、15種類のシナリオリソース、16種類のテストツール、10種類のコンテキストツールを提供し、ダブルポートアーキテクチャとステートフルなテストワークフローをサポートし、企業レベルのコンプライアンスと高度な分析ニーズに対応します。
Loaded Vibesは企業向けのAgentic TypeScript Web開発フレームワークで、Next.js 15、React 19、GenAIScriptオーケストレーター、MCPサービスなどの技術を含むフルスタック開発環境とツールチェーンを提供し、18の標準化された開発サイクルを通じて規範的なプロジェクト構築と管理をサポートします。