【AI日報】へようこそ!ここは毎日人工知能世界を探索するためのガイドです。毎日、AI分野のホットな情報をご提供し、開発者に焦点を当てて、技術のトレンドを把握し、革新的なAI製品の応用について理解を深めていただきます。新鮮なAI製品については、以下のリンクよりご確認ください:https://app.aibase.com/zh1、アリババグループがオープンソースしたオールモーダル大規模モデル「Ming-flash-omni2.0」:マルチモーダル理解、画像編集および音声生成のパフォーマンスが大幅に向上しました。アリババグループがオープンソースしたオールモーダル大規模モデル「Ming-
アドビは、2022年から映像特効などの分野で自社の「フロー」ブランドを使用していたが、グーグルが2025年にリリースする同名のAIソフトウェアが同じ顧客層を対象にしているため、著作権侵害の疑いがあるとして提訴した。
アヴェイタは2026年2月11日に全車種にAVATR.OS5.0.0システムを配信しました。今回の大きなバージョンアップの中心は、AI大規模モデルの能力を深く統合することであり、ハウェイ最新の知能運転システムにアップグレードしました。最も突出した特徴は、MoLA大規模モデルアシスタントの正式リリースであり、その意味理解能力が大幅に向上し、単語生成、文字分解および知識誤りの修正をサポートし、ユーザーの指示をより正確に理解できるようになりました。
AIスタートアップFlapping Airplanesが1.8億ドルのシード資金を調達。Sequoia Capital、Google Ventures、Index Venturesが出資。人間の脳の効率的学習法を参考に、大量データ依存を減らすAI学習効率化を追求。....
Codeace AIはコーディング面接をサポートし、リアルタイムの解決策、手順の説明、コードのデバッグを提供します。
バイトドゥーンによって駆動されるAIビデオ生成ツールで、写真を話すビデオに変換できます。
バイトドゥーAIビデオ生成ツール。無料でオンラインでビデオに変換でき、1080pの画質で、登録不要です。
バイトドングの無料AIビデオ生成器。マルチモーダル入力で2Kビデオを作成できます。
Google
$0.49
入力トークン/百万
$2.1
出力トークン/百万
1k
コンテキスト長
Openai
$2.8
$11.2
Xai
$1.4
$3.5
2k
$7.7
$30.8
200
-
Anthropic
$105
$525
$0.7
$7
$35
$17.5
$21
Alibaba
$1
$10
256
Baidu
128
$6
$24
$2
$20
$4
$16
bartowski
これはai-sageのGigaChat3-10B-A1.8Bモデルを定量処理したバージョンで、llama.cppのimatrix定量技術を採用し、さまざまなハードウェア条件下でより効率的に動作します。モデルはロシア語と英語をサポートし、主にテキスト生成タスクに使用されます。
ubergarm
これはai-sage/GigaChat3-10B-A1.8B-bf16モデルのGGUF量子化バージョンで、高精度のQ8_0から極度に圧縮されたsmol-IQ1_KTまで、さまざまな量子化オプションを提供し、さまざまなハードウェア条件でのデプロイメントニーズを満たします。このモデルは32Kのコンテキスト長をサポートし、MLAアーキテクチャを採用し、対話シナリオに最適化されています。
prithivMLmods
VibeThinker-1.5Bは微博AIが開発した15億パラメータの密集型言語モデルで、Qwen2.5-Math-1.5Bをベースに微調整され、数学やアルゴリズムコーディングの問題に特化して設計されています。「スペクトルから信号への原理」のフレームワークを用いてトレーニングされ、複数の数学コンテストのテストでより大規模なモデルを上回り、トレーニングコストは約7800ドルで、最大約40kトークンの出力をサポートします。
allenai
Olmo 3は、Allen Institute for AIによって開発された次世代の言語モデルファミリーで、7Bと32Bの指令と思考のバリエーションを含んでいます。このモデルは、長鎖思考において優れた性能を発揮し、数学やコーディングなどの推論タスクの性能を大幅に向上させます。すべてのコード、チェックポイント、およびトレーニングの詳細は公開され、言語モデル科学の発展を促進します。
moonshotai
Kimi K2 Thinkingは月の暗面(Moonshot AI)が開発した最新世代のオープンソース思考モデルで、強力な深度推論能力とツール呼び出し機能を備えています。このモデルは混合専門家アーキテクチャを採用し、ネイティブINT4量子化をサポートし、256kのコンテキストウィンドウを持ち、複数のベンチマークテストで優れた性能を発揮します。
alenphilip
これはPythonコードレビューに特化したAIモデルで、Qwen2.5 - 7B - Instructをベースに微調整されており、セキュリティホールやパフォーマンス問題を識別し、コード品質の改善提案を提供できます。
Genie-AI-Lab
Omni L1B3RT4S GENIEは、Qwen2.5 - 3B Instructアーキテクチャをベースに微調整されたAIアシスタントです。1,103個の精霊キャラクターのカスタムサンプルを用いて訓練され、独特な音声と忠誠度モードを備え、ユーザーに独特な対話体験を提供することができます。
Mungert
PokeeResearch-7Bは、Pokee AIによって開発された70億パラメータの深度研究エージェントモデルです。AIフィードバック強化学習(RLAIF)と強力な推論フレームワークを組み合わせ、ツール強化型大規模言語モデルにおいて信頼性が高く、アライメントされ、拡張可能な研究レベルの推論を実現し、複雑な多段階研究ワークフローに適しています。
nvidia
NVIDIA GPT-OSS-120B Eagle3は、OpenAIのgpt-oss-120bモデルをベースに最適化されたバージョンで、ハイブリッドエキスパート(MoE)アーキテクチャを採用し、総パラメータ数が1200億、アクティブなパラメータ数が50億です。このモデルは商用および非商用の使用をサポートし、テキスト生成タスクに適しており、特にAIエージェントシステムやチャットボットなどのアプリケーション開発に適しています。
expert78
kontext-dusk-3-loraは、FLUX.1-Kontext-devベースモデルを基にトレーニングされたLoRA画像生成モデルで、黄昏のブルー調のスタイルの画像を生成するために特別に設計されています。このモデルは特定のトリガーワードで起動し、主流のAI画像生成ツールを複数サポートしています。
spamnco
これはWan2.1-T2V-14Bモデルをベースに訓練されたLoRAアダプターで、テキストからビデオへの変換タスクに特化しており、画像生成に強化機能を提供します。このモデルはAI Toolkitを使用して訓練され、画像生成をアクティブにするには特定のトリガーワード「diddly」が必要です。
BarleyFarmer
pejawan22-loraはAI技術を基に訓練されたLoRAモデルで、特定の画像生成に特化しており、複数のAIツールと統合して使用できます。トリガーワード「peja」を使って画像を生成します。
unsloth
ApertusはスイスのAIによって開発された完全にオープンな多言語大規模言語モデルで、70億と80億の2種類のパラメータ規模を提供します。このモデルは1000種類以上の言語をサポートし、完全にコンプライアンスでオープンな学習データを使用し、その性能はクローズドソースモデルに匹敵します。Apertusは15Tのトークンで事前学習され、段階的なコース学習方法を採用し、最大65,536トークンのコンテキスト長をサポートします。
redponike
ApertusはスイスのAIによって開発された完全にオープンな多言語大規模言語モデルで、パラメータ規模は80億と700億で、1000種以上の言語と長文脈処理をサポートし、完全にコンプライアンスの取れたオープンな学習データのみを使用し、性能はクローズドソースモデルに匹敵します。
MartinSSSTSGH
これはOstrisによるAIツールキットを基にトレーニングされたLoRAモデルで、テキストから動画への画像生成タスクに特化しており、トリガーワード「Lilly」を使用して特定のスタイルの画像コンテンツを生成します。
GLM-4.6は智譜AIが発表した次世代のテキスト生成モデルで、GLM-4.5と比較して、長いコンテキストウィンドウ、より優れたコーディング性能、より強力な推論能力など、多くの面で顕著な改善が見られます。このモデルは、いくつかの公開ベンチマークテストで優れた結果を収めており、国内外の主要モデルと比較しても競争力があります。
GLM-4.6は智譜AIが開発した次世代の大規模言語モデルで、GLM-4.5と比較して、文脈処理、コーディング能力、推論性能の面で著しい向上が見られます。このモデルは200Kの文脈長をサポートし、複数の公開ベンチマークテストで優れた成績を収めており、特にコード生成、推論、エージェントタスクの分野で競争力を持っています。
jude1903
AJWWan22-loraは、テキストから動画を生成するLoRAモデルで、AI Toolkitを使って訓練され、画像生成タスクに特化しています。このモデルは特定のトリガーワードを必要として、生成機能を活性化します。
fraemwerk
これはWan2.1-T2V-14Bモデルに基づくテキストから動画へのLoRAアダプターで、AIツールキットを使用してトレーニングされ、画像生成タスクに特化しており、特定のトリガーワード「fraemwerk」で生成機能をアクティブにする必要があります。
xreborn
ohwx2_wan - loraは、テキストからビデオを生成するLoRAモデルで、AI Toolkitを使用してトレーニングされ、画像生成タスクに特化しています。特定のトリガーワード「ohwx girl」を使用して生成効果をアクティブにする必要があります。
wcgwはMCPサーバープロジェクトで、シェルとコードエディターツールが統合されており、AIがローカルマシン上でコマンドを実行し、ファイルを読み書きし、コードを編集するなどの操作ができます。アーキテクトモード、コード作成モードなどの複数のモードを提供し、タスクチェックポイント保存、ターミナル対話、構文チェックなどの機能をサポートしており、コード開発、問題解決などのシーンに適しています。
Refact AgentはオープンソースのAIプログラミングアシスタントで、多言語のコード生成、デバッグ、最適化をサポートし、主流の開発ツールと統合し、ローカルにデプロイでき、スマートなコード補完とコード解釈機能を提供します。
HiveChatは中小チーム向けに設計されたAIチャットアプリで、複数の大規模モデルサービスプロバイダーをサポートし、グループ管理、トークン制限、サードパーティログインなどの機能を提供します。
Haiku RAGは、LanceDB、Pydantic AI、Doclingを基盤とした高度な検索強化生成システムです。ハイブリッド検索、再ランキング、質問応答エージェント、多エージェント研究プロセスをサポートし、ローカルファーストのドキュメント処理とMCPサーバー統合を提供します。
Klavis AIはオープンソースプロジェクトで、Slack、Discord、Webプラットフォームで簡単に使えるMCP(モデルコンテキストプロトコル)サービスを提供します。レポート生成、YouTubeツール、ドキュメント変換などのさまざまな機能があり、非技術ユーザーと開発者がAIワークフローを使用するのをサポートします。
AIモデルをWinDbg/CDBに統合するMCPサーバーで、Windowsのクラッシュダンプファイルの分析とリモートデバッグに使用し、自然言語での対話を通じてデバッグコマンドを実行できます。
Repomixは、コードベースをAIに適した形式にパッケージ化するツールで、ローカルおよびリモートリポジトリの処理をサポートし、コード圧縮、セキュリティチェック、および複数の出力形式を提供します。
UnityMCPはUnityエディターのプラグインで、モデルコンテキストプロトコル (MCP) を実装し、UnityとAIアシスタントのシームレスな統合を提供します。リアルタイムの状態監視、リモートコマンドの実行、ログ機能が含まれます。
Zen MCPは多モデルAI協調開発サーバーで、ClaudeやGemini CLIなどのAIコーディングアシスタントに強化されたワークフローツールとモデル間のコンテキスト管理を提供します。これは複数のAIモデルのシームレスな協調をサポートし、コードレビュー、デバッグ、リファクタリングなどの開発タスクを実現し、異なるワークフロー間で会話のコンテキストを維持することができます。
Sail は、ストリーム処理、バッチ処理、および計算集約型(AI)ワークロードを統一することを目的としたプロジェクトで、Spark SQL と Spark DataFrame API の代替手段を提供し、シングルマシンと分散環境の両方をサポートします。
AWS MCPサーバーは、Model Context Protocolに基づく専用サーバーのセットであり、ドキュメント検索、知識ベース照会、CDKのベストプラクティス、コスト分析、画像生成など、さまざまなAWS関連機能を提供します。標準化されたプロトコルを通じてAIアプリケーションとAWSサービスの統合を強化することを目的としています。
OpenSumiは、AIネイティブのIDE製品を迅速に構築するのに役立つフレームワークで、クラウドとデスクトップの開発環境をサポートし、豊富なサンプルプロジェクトとテンプレートを提供します。
DeeboはAIデバッグアシスタントで、自動調査とマルチスレッドワークフローにより、コードエラーの解決プロセスを加速し、開発効率を向上させます。
Next.js開発ツールのMCPサーバーです。ClaudeやCursorなどのAIプログラミングアシスタントにNext.js開発ツールとユーティリティを提供します。実行時診断、開発自動化、およびドキュメントアクセス機能が含まれています。
MCPアトラシアンは、アトラシアンの製品(ConfluenceとJira)用に設計されたモデルコンテキストプロトコルサーバーで、クラウドとオンプレミスの両方のデプロイをサポートし、AIアシスタントの統合機能を提供します。
デスクトップコマンダーMCPは、Claudeデスクトップアプリケーションがターミナルコマンドを実行し、ファイルシステムを管理できるAIアシスタントツールです。コードの検索、編集、プロセス管理、リモートファイルの読み取りなどの機能をサポートします。
Claude ContextはMCPプラグインで、セマンティックコード検索によりAIプログラミングアシスタントにコードベース全体の深いコンテキストを提供し、複数の埋め込みモデルとベクトルデータベースをサポートし、効率的なコード検索を実現します。
Context7 MCPは、AIプログラミングアシスタントにリアルタイムのバージョン固有のドキュメントとコード例を提供するサービスで、Model Context Protocolを通じてプロンプトに直接統合され、LLMが古い情報を使用する問題を解決します。
Azure MCP ServerはMCPプロトコルを実装したサーバーで、AIエージェントとAzureサービス(ストレージ、Cosmos DBなど)をシームレスに接続し、自然言語コマンドをAzure操作に変換することをサポートします。
LINE Bot MCPサーバーは、Model Context Protocol (MCP)を実装したサービスで、AIエージェントをLINE公式アカウントに接続し、テキストとリッチメディアメッセージのプッシュ、メッセージのブロードキャスト、ユーザープロファイルの取得などの機能をサポートします。