【AIニュース】へようこそ!ここは毎日人工知能世界を探求するためのガイドです。毎日、AI分野の注目ニュースをお届けし、開発者に焦点を当て、技術のトレンドや革新的なAI製品の応用を理解するお手伝いをします。新鮮なAI製品については以下からご覧ください:https://app.aibase.com/zh1、メタはManusを数十億ドルで買収しました。メタは数十億ドルで人工知能スタートアップ企業Manusを買収し、これは同社史上3番目の買収となります。C
腾讯混元翻訳モデル1.5版がリリース。1.8Bと7Bの2サイズを提供し、効率的で高品質な翻訳を実現。特に1.8Bモデルはモバイル向けに最適化され、1GBメモリでオフライン動作可能。....
腾讯が開源した混元翻訳モデル1.5版は33言語対応で、モバイル端末向けに最適化。1.8Bと7Bの2バージョンを提供し、1.8B版は量子化後1GBメモリで動作可能。オフラインリアルタイム翻訳を実現し、推論速度に優れる。....
2025年、AIプログラミング分野は爆発的成長を遂げ、コード補完からマルチエージェント協調システムへ進化。AIは複雑なタスクを独立処理できる「知的パートナー」となった。スタンフォード大学の報告によると、AIのソフトウェア工学ベンチマークSWE-benchでのスコアは1年で67.3ポイント上昇し71.7%に達し、AIプログラミング能力の大きな進展を示している。....
LLaMA - Factory公式と協力して、ワンストップの低コード大規模モデル微調整プラットフォームを提供し、100種以上のモデルをサポートします。
無料でオンラインで音声をテキストに変換できます。登録不要で、1GBのファイルに対応し、高精度で多言語に対応しています。
1日30分のマーケティングオペレーティングシステムで、アイデアを28日間の戦略的マーケティングキャンペーンに変えます。
1000以上の選りすぐりのナノバナナプロンプト。無料でコミュニティ主導。Gemini Nano Banana用に設計されています。
Xai
$1.4
入力トークン/百万
$3.5
出力トークン/百万
2k
コンテキスト長
Openai
$7.7
$30.8
200
Alibaba
$4
$16
1k
$2
$20
-
256
Bytedance
$0.8
128
$0.15
$1.5
$10.5
$8
Tencent
$1
32
64
$0.63
$3.15
131
Huawei
Iflytek
drbaph
Z-Image(造相)は60億のパラメータを持つ高効率な画像生成基礎モデルで、画像生成分野の効率と品質の問題を専門的に解決します。その蒸留バージョンであるZ-Image-Turboは、たった8回の関数評価でリーディングな競合モデルに匹敵するか、それを上回る性能を発揮し、企業用のH800 GPUでは亚秒級の推論遅延を実現し、16G VRAMの消費者向けデバイスでも動作します。
PrimeIntellect
INTELLECT-3は1060億のパラメータを持つ混合専門家(MoE)モデルで、大規模な強化学習によって訓練されています。数学、コーディング、推論のベンチマークテストで卓越した性能を発揮し、モデル、訓練フレームワーク、環境はすべて緩やかなライセンス契約でオープンソース化されています。
RinggAI
これは通話記録分析用に特別に開発された混合言語AIモデルで、ヒンディー語、英語、およびヒンディー語と英語の混合通話の文字起こし内容を処理できます。モデルはQwen2.5 - 1.5B - Instructをベースに微調整されており、強力な多言語理解と情報抽出能力を備えています。
Shawon16
これはVideoMAE - baseアーキテクチャに基づいて未知のデータセットで微調整された動画理解モデルで、手話認識タスクに特化しています。モデルは20エポックの訓練後に18.64%の正解率を達成しました。
ExaltedSlayer
Gemma 3はGoogleが開発した軽量オープンソースのマルチモーダルモデルです。このバージョンは12Bパラメータの命令調整量子化感知トレーニングモデルで、MLXフレームワークのMXFP4形式に変換されています。テキストと画像の入力をサポートし、テキスト出力を生成します。128Kのコンテキストウィンドウと140種類以上の言語をサポートしています。
これはMCG - NJU/videomae - baseモデルを未知のデータセットで微調整した動画理解モデルで、20エポックの学習を経て、評価セットで13.31%の正解率を達成しました。このモデルは動画分析タスクに特化して最適化されています。
jayn7
騰訊の混元ビデオ1.5モデルの量子化GGUFバージョンで、テキストから動画生成タスクに特化しており、720P高画質動画生成をサポートし、使用効率を最適化するための複数の量子化精度バージョンを提供します。
このプロジェクトは、テンセントの混元ビデオ1.5のテキストから動画へのモデルの量子化GGUFバージョンを提供し、480P動画生成タスクをサポートします。蒸留モデルと完全モデルの2つのバージョンが含まれており、ComfyUI - GGUFなどのツールと連携して使用できます。
騰訊の混元ビデオ1.5モデルの量子化GGUFバージョンで、画像を動画に変換するタスクや動画生成タスクに特化しています。480P解像度の蒸留モデルと標準モデルを提供し、Q4_K_S、Q8_0、FP16などの複数の量子化精度をサポートします。
DreadPoor
Strawberry_Smoothie-TESTは、mergekitツールを使用して3つの12Bパラメータモデルを統合した混合モデルです。Unity-12B、Chaos-Unknown-12b、Smoothie-12B-Model_Stockの長所を組み合わせ、より良いテキスト生成と対話能力を提供することを目的としています。
evilfreelancer
これはai - sage/GigaChat3-10B-A1.8Bモデルの量子化バージョンで、GGUF形式を採用し、特定のllama.cppブランチのサポートが必要です。モデルは混合専門家アーキテクチャを採用し、総パラメータ数は約118億で、そのうち活性化パラメータ数は約18億です。
prithivMLmods
VibeThinker-1.5Bは微博AIが開発した15億パラメータの密集型言語モデルで、Qwen2.5-Math-1.5Bをベースに微調整され、数学やアルゴリズムコーディングの問題に特化して設計されています。「スペクトルから信号への原理」のフレームワークを用いてトレーニングされ、複数の数学コンテストのテストでより大規模なモデルを上回り、トレーニングコストは約7800ドルで、最大約40kトークンの出力をサポートします。
ai-sage
GigaChat3-10B-A1.8BはGigaChatシリーズの対話モデルで、混合専門家(MoE)アーキテクチャに基づいており、合計100億のパラメータがあり、そのうち18億がアクティブなパラメータです。このモデルは、マルチヘッド潜在注意力と多トークン予測技術を採用しており、25.6万トークンの長文脈をサポートし、多言語対話と推論タスクで優れた性能を発揮します。
kayte0342
ChronoEdit-14BはNVIDIAが開発した、時間推論能力を備えた画像編集と世界シミュレーションモデルで、140億のパラメータを持っています。このモデルは、2段階の推論プロセスにより、物理知覚に基づく画像編集と動作条件に基づく世界シミュレーションを実現し、事前学習されたビデオ生成モデルから事前知識を抽出します。
mlx-community
VibeThinker-1.5Bの4ビット量子化バージョンで、MLXフレームワークに基づいてAppleチップ向けに最適化されており、15億のパラメータを持つ密集型言語モデルで、数学的推論とアルゴリズムコーディングの問題に特化しています。
GigaChat3-10B-A1.8B-baseはGigaChatシリーズの基礎事前学習モデルで、混合エキスパート(MoE)アーキテクチャを採用し、総パラメータは100億、アクティブなパラメータは18億です。モデルはマルチヘッド潜在的注意機構(MLA)と多トークン予測(MTP)技術を統合し、推論時に高いスループットの利点を持ちます。
bartowski
これはREAP方法を用いてMiniMax-M2の専門家を均一に25%裁剪した172Bパラメータの大規模言語モデルで、llama.cppに特化して最適化された量子化処理が施されており、複数の量子化レベルをサポートし、LM Studioやllama.cppベースのプロジェクトで動作します。
これはREAP方法に基づいて、MiniMax-M2の40%の専門家を均等に剪定して得られた139Bパラメータの大規模言語モデルです。GLMアーキテクチャと専門家混合(MoE)技術を採用し、llama.cppを通じて様々な量化処理を行い、テキスト生成タスクに適しています。
DevQuasar
このプロジェクトでは、cerebras/MiniMax-M2-REAP-172B-A10Bモデルの量子化バージョンを提供しており、知識を大衆に利用してもらうことを目指しています。これは1720億パラメータの大規模言語モデルで、最適化と量子化処理が施されており、デプロイコストの削減と推論効率の向上を目的としています。
tencent
混元ビデオ - 1.5は軽量級で高性能なビデオ生成モデルで、わずか83億のパラメータでトップレベルのビデオ品質を提供し、使用の敷居を大幅に下げます。消費者向けGPUでスムーズに動作し、テキストからビデオ、画像からビデオの生成をサポートし、すべての開発者やクリエイターが簡単に使用できます。
百度マップMCPサーバーは国内初のMCPプロトコルに対応した地図サービスで、地理コーディング、ルート計画など10個の標準化されたAPIインターフェースを提供し、PythonとTypescriptでの迅速な接続をサポートし、エージェントに地図関連の機能を実現させます。
Jinniは、大規模言語モデルにプロジェクトのコンテキストを効率的に提供するツールで、関連するファイルとそのメタデータを統合することで、1つずつファイルを読み取る制限を克服します。
1Panel MCP Serverは、1Panel用に設計されたモデルコンテキストプロトコルサーバーの実装です。
PMATはゼロコンフィギュレーションのAIコードコンテキスト生成ツールで、コード品質分析、技術的負債評価、ミューテーションテスト、リポジトリ健全性評価、意味検索などの機能を提供し、17種類以上のプログラミング言語をサポートし、MCPプロトコルを通じてClaude CodeなどのAIアシスタントと統合することができます。
MCP - PostgreSQL - Opsは、専門的なPostgreSQLデータベース操作と監視用のMCPサーバーです。PostgreSQL 12 - 17バージョンをサポートし、包括的なデータベース分析、パフォーマンス監視、スマートなメンテナンス提案を提供し、自然言語クエリによるデータベース管理を実現します。
1Panel MCPサーバーは、1Panel用に設計されたモデルコンテキストプロトコルサーバーの実装で、複数のインストールおよび実行方法をサポートします。
Smart TreeはRustをベースに開発された超高速のディレクトリ可視化ツールで、従来のtreeコマンドよりも10~24倍高速で、AI最適化出力、量子圧縮、スマート検索などの機能を備えており、同時に環境保護と省エネにも配慮しています。
Steampipe MCPサーバーは、AIアシスタントとクラウドインフラストラクチャデータを接続する架け橋であり、自然言語によるクエリと分析を通じて、AWS、Azure、GCPなど100以上のクラウドサービスをサポートし、セキュリティコンプライアンス分析、コスト最適化、およびクエリ開発支援機能を提供します。
MCP AI Hubは、Model Context Protocolに基づくサーバーで、LiteLMの統一インターフェイスを通じて100以上のAIモデル(OpenAI、Anthropic、Googleなどを含む)へのアクセスを提供し、複数の伝送プロトコルと柔軟な設定をサポートします。
Insights Knowledge Base (IKB) MCP Serverは、即座に使用可能な無料の知識ベースで、10,000以上の高品質な洞察レポートが組み込まれており、ローカルでの安全な保存とプライベートドキュメントの解析をサポートしています。このプロジェクトはデータ処理の効率を最適化し、毎週のレポート更新を提供し、将来的には埋め込みモデルの統合とレポートシステムの強化を計画しています。
MCPキャラクターツールは、大規模言語モデルに文字レベルのテキスト分析機能を提供するサーバーです。LLMが形態素解析により個々の文字を処理することが困難な問題を解決し、14種類以上の文字カウント、スペル分析、テキスト比較ツールを提供します。
Code Graph RAG MCPは、高度なモデルコンテキストプロトコルサーバーです。インテリジェントなグラフ表現と多言語コード分析機能を備え、コードの理解、関係マッピング、意味検索を行うための13種類の専用ツールを提供します。
TurboVaultは、プロダクションレベルのMCPサーバーで、ObsidianナレッジベースをAI駆動のインテリジェントな知識システムに変換し、ノートの読み書き、検索、分析、管理のための44個の専用ツールを提供し、100ミリ秒未満の性能を発揮します。
Model Context Protocolに基づくOpenAPIドキュメント検索サーバーです。API仕様の読み込み、解析、およびクエリ機能を提供し、JSONおよびYAML形式をサポートし、10のクエリツールを備えており、AIアシスタントがAPIドキュメントにアクセスしやすくなります。
非公式のPubChem MCPサーバーで、分子特性、生物アッセイデータ、および化学情報学ツールを含む、1億1000万種以上の化合物への全面的なアクセスを提供します。
DINO - X MCPは、DINO - XとGrounding DINO 1.6 APIを通じて大規模言語モデルに細粒度の物体検出と画像理解を可能にするプロジェクトです。正確な物体位置特定、数量カウント、属性分析、シーン理解を実現し、自然言語駆動の視覚タスクとワークフロー統合をサポートします。
YaraFlux MCPサーバーは、モデルコンテキストプロトコル(MCP)に基づくYARAスキャンサーバーで、AIアシスタントにファイルのYARAルール分析機能を提供します。このプロジェクトはモジュール化されたアーキテクチャを採用し、19個のMCPツールを統合しており、YARAルール管理、ファイルスキャン、セキュリティストレージなどの機能をサポートし、Claude DesktopなどのAIアシスタントとシームレスに統合できます。
このプロジェクトは、Yahoo Financeなどの様々なデータソースをサポートするMCPサーバーを迅速に構築するチュートリアルです。10分以内にセットアップでき、開発環境の構成、依存関係のインストール、実行手順が含まれています。
PrestaShopの開発ドキュメント向けに設計されたローカライズされたMCPサーバーで、1095以上のオフラインドキュメントの高速な全文検索を提供します。フック、コンポーネント、API、および開発ガイドが含まれています。
Model Context Protocolに基づく12306購票検索サーバーで、チケット情報を照会するためのAPIインターフェースを提供します。