【AI日報】へようこそ!ここは毎日、人工知能の世界を探索するためのガイドです。毎日、AI分野の注目ニュースをお届けし、開発者に焦点を当て、技術のトレンドを理解し、革新的なAI製品の応用を学ぶお手伝いをします。新鮮なAI製品については、以下のリンクからご確認ください:https://app.aibase.com/zh1、支付宝が2026年の春節にリリースしたAIメガネで福を掃く機能について詳しく紹介しており、この機能はスマートフォンを使わずに操作し、スマートなインタラクションによりユーザー体験を向上させています。
アリババのアントグループが大規模言語モデル技術革新部門を設立し、ToBシーンに焦点を当て、企業市場での「百霊大モデル」の商業化を推進し、産業のデジタル化を加速させる。....
AI企業Anthropicが音楽出版社連合から著作権侵害で提訴され、AIトレーニングに大量の音楽作品を無断使用したと指摘された。同社のビジネスモデルは「海賊版」に基づいていると主張されている。....
小米はアントグループと協力し、スマートメガネに駐車料金支払いおよびAI健康マネジメント機能を導入し、デバイスの万能アシスタントへのアップグレードを推進しています。駐車料金支払いには非接触決済がサポートされており、ユーザーは音声または注視で完了できます。その利便性は大幅に向上しました。
Seedance 2.0:AIビデオジェネレーター。テキストまたは画像に基づいて15秒の映画レベルのビデオを作成します。
AI駆動で、60秒でCCSS、NGSSなどの基準に合った教案を生成します。初回のレッスンは無料です。
無料のオンラインAIビデオジェネレーターで、テキストや画像の入力に対応し、多ショットの物語構成などの機能があります。
AI UGCビデオジェネレーターは、クリエイターが高転化率のウイルス的なビデオ広告を制作するのを支援し、無料で試用できます。
Openai
$2.8
入力トークン/百万
$11.2
出力トークン/百万
1k
コンテキスト長
Google
$0.49
$2.1
Xai
$1.4
$3.5
2k
$7.7
$30.8
200
-
Anthropic
$105
$525
$0.7
$7
$35
$17.5
$21
Alibaba
Baidu
128
$6
$24
256
$2
$20
$4
$16
Bytedance
$1.2
$3.6
4
ErenAta00
サイバーブレインは、コンテスト(CTF)の挑戦やネットワークセキュリティタスクに特化して微調整された大規模言語モデルです。Llama - 3.1 - 8B - Instructアーキテクチャに基づいており、CTFの問題解決、セキュリティ脆弱性の分析、リバースエンジニアリングや暗号学的挑戦に対応し、倫理規範に沿った脆弱性利用推論を提供します。
yueqis
これはQwen-Coder-14Bモデルをネットワークデータセットで微調整したバージョンで、ネットワークデータシーンに特化して最適化されています。基礎バージョンと比較して、特定のネットワークタスクでより優れた性能を発揮します。モデルは3エポックのトレーニングを行い、学習率は5e-5です。
thenexthub
OpenModel-1T-A50B-InstructはNeXTHubが開発した兆億パラメータのハイブリッドエキスパートモデルで、進化思考チェーントレーニング方法を組み合わせ、推論能力とエネルギー効率のバランスを図り、深度推論能力と128Kの長文脈処理能力を備えています。
Pacific-Prime
INLアーキテクチャは、積分ニューロンダイナミクスに基づくプロダクションレベルのニューラルアーキテクチャで、従来のフィードフォワードネットワーク層を反復ダイナミクスに置き換え、大規模言語モデル、ビジュアルトランスフォーマー、マルチモーダルモデルなどのさまざまなタイプに適用可能です。
codechrl
bert-micro-cybersecurityは、ネットワークセキュリティのテキスト分類タスク用に設計されたコンパクトなトランスフォーマーモデルで、脅威検出やイベントレポート分析などに使用でき、英語とインドネシア語をサポートします。
prithivMLmods
Fathom-DeepResearchは、Fathom-Search-4BとFathom-Synthesizer-4Bから構成されるデュアルモデルのインテリジェントシステムです。長期間のネットワーク検索、証拠検証、および引用が豊富なレポートの生成に最適化されています。このシステムは、検索集中型タスクにおいてオープンソースの重みで最高の性能を達成し、複数のクローズドソースの深度研究インテリジェントエージェントを上回っています。
merve
これはDETRアーキテクチャとDINOv3ビジュアルバックボーンネットワークをベースに微調整されたナンバープレート検出モデルで、評価セットで2.7008の損失値を達成し、専門的にナンバープレート認識タスクに使用されます。
manycore-research
FLUX.1 Wireframe [dev] LoRA は FLUX.1-Layout-ControlNet の改良版で、SpatialGen の重要なコンポーネントとして、テキスト記述に基づいて画像を生成すると同時に、与えられたワイヤーフレーム画像の構造に従います。このモデルは FLUX.1 [dev] フレームワークに適しており、室内シーン生成タスクに特化しています。
lmms-lab
LLaVA-OneVision-1.5は、完全にオープンソースの一連の大型マルチモーダルモデルで、ネイティブ解像度の画像でトレーニングすることで、低コストで高度な性能を実現しています。このモデルは、複数のマルチモーダルベンチマークテストで卓越した性能を発揮し、Qwen2.5-VLなどの競合モデルを上回っています。
Infinigence
梅格レス2-3x7B-A3Bはデバイスネイティブの大規模言語モデルで、ハイブリッドエキスパート(MoE)アーキテクチャを採用し、MoEの正確性と密集モデルのコンパクト性の利点を兼ね備えています。このモデルは8Tトークンのデータで訓練され、32Kの文脈長を持ち、将来的には推論とエージェント機能の向上が計画されています。
llm-semantic-router
bert-base-uncasedをベースに、LoRA(低ランク適応)技術を用いて微調整された意図分類モデルです。テキストをビジネス、技術、科学などのカテゴリに分類でき、意味ルーティングプロジェクトの一部です。RustのCandleフレームワークに対して最適化されています。
BERT基礎大文字小文字区別なしモデルに基づき、LoRA(低ランク適応)技術を使用して微調整された意図分類モデルで、テキストをビジネス、技術、科学などのカテゴリに分類でき、意味ルータープロジェクトの一部で、Rust言語のCandleフレームワークに対して最適化されています。
FLUX.1-Layout-ControlNetはSpatialGenフレームワークの重要なコンポーネントで、セマンティック画像条件付きのControlNetモデルです。これはテキスト記述に基づいて2D画像を生成することができ、同時に入力されたセマンティック画像のレイアウト制約を厳密に遵守し、主に3D室内シーン合成に使用されます。
allenai
MolmoActはアレン人工知能研究所によって開発されたオープンソースのロボット操作動作推論モデルで、Qwen2.5 - 7BとSigLip2視覚バックボーンネットワークに基づいて構築され、家庭およびデスクトップ環境における片腕のフランカロボット操作タスクに特化して最適化されています。
MolmoActは、アレン人工知能研究所によって開発された完全なオープンソースのロボット操作アクション推論モデルで、Qwen2.5 - 7BとSigLip2の視覚バックボーンネットワークに基づいて構築され、家庭やデスクトップ環境でのロボット操作タスクに特化しています。
MolmoActはアレン人工知能研究所によって開発されたオープンソースの動作推論モデルで、ロボット操作タスクに特化しています。このモデルはQwen2.5 - 7BとSigLip2ビジュアルバックボーンネットワークに基づいており、家庭およびデスクトップ環境の93種類の独特な操作タスクで訓練され、優れたビジュアル - 言語 - 動作推論性能を持っています。
cudaLLM-8BはByteDance Seedによって開発された専門の言語モデルで、高性能かつ構文が正しいCUDAカーネルコードを生成するために特別に設計されています。Qwen3-8B基礎モデルをベースに構築され、監督微調整と強化学習の2段階のトレーニングを通じて、開発者が効率的なGPU並列プログラミングコードを記述するのを支援することができます。
Qwen
Qwen3-30B-A3B-Instruct-2507-FP8は、Qwen3-30B-A3B-FP8の非思考モードの更新バージョンで、汎用能力、長尾知識のカバレッジ、ユーザーの嗜好とのアライメント、長コンテキストの理解などの面で著しい向上が見られ、262,144のネイティブコンテキスト長をサポートしています。
NVFP4
Qwen3-235B-A22B-Instruct-2507はQwen3シリーズモデルの更新バージョンで、汎用能力、希少知識のカバレッジ、ユーザーの嗜好アライメント、長文脈理解などの面で著しい向上が見られ、より質の高いテキスト生成サービスを提供できます。このモデルは混合専門家アーキテクチャを採用し、合計235Bのパラメータのうち、22Bのパラメータが活性化され、ネイティブで262,144の文脈長をサポートします。
gaiseras
Kerasフレームワークで構築された畳み込みニューラルネットワーク(CNN)で、64×64グレースケール画像から単一の日本語文字を認識するために特別に設計されており、手書き体と印刷体の両方を認識可能です。
Einoは、Golang用に設計されたLLMアプリケーション開発フレームワークで、シンプルで拡張可能で信頼性が高く効率的なコンポーネント抽象化と編成機能により、AIアプリケーションの開発プロセスを簡素化することを目的としています。豊富なコンポーネントライブラリ、強力なグラフ編成機能、完全なストリーム処理サポート、および高度に拡張可能なアスペクトメカニズムを提供し、開発からデプロイまでの全サイクルのツールチェーンを網羅しています。
Testkubeは、クラウドネイティブアプリケーション向けのテストオーケストレーションと実行フレームワークで、テストの定義、実行、分析を行うための統一プラットフォームを提供します。既存のテストツールとKubernetesインフラストラクチャをサポートします。
ソロンは、高効率、オープン、エコシステムにやさしいJavaのエンタープライズアプリケーション開発フレームワークで、全シナリオの開発に対応し、高性能、低メモリ消費、高速起動、小さなパッケージサイズなどの特徴があり、Java8からJava24まで、およびGraalVMネイティブランタイムと互換性があります。
OpenSumiは、AIネイティブのIDE製品を迅速に構築するのに役立つフレームワークで、クラウドとデスクトップの開発環境をサポートし、豊富なサンプルプロジェクトとテンプレートを提供します。
Apple MCPツールセットは、MCPプロトコルに基づくAppleのネイティブツールセットで、メッセージ、メモ、連絡先、メール、リマインダー、カレンダーなどのAppleエコシステムの統合サービスを提供します。
AIワークフローにshadcn/uiコンポーネントの統合を提供するMCPサーバーで、React、Svelte、Vueフレームワークをサポートし、コンポーネントのソースコード、使用例、メタデータへのアクセス機能を備えています。
これはWeb3モデルコンテキストプロトコル(MCP)サーバーの精選リストで、チェーンのやり取り、取引、DeFi、市場データ、ツール、ソーシャルなどの複数のカテゴリをカバーしています。MCPは、アプリケーションがLLMにコンテキストを提供する方法を標準化するオープンプロトコルで、AIアプリケーションのUSB - Cポートのようなものです。DeMCPは最初の分散型MCPネットワークで、エージェントに独自開発およびオープンソースのMCPサービスを提供し、暗号通貨による支払いをサポートし、TEEとブロックチェーンレジストリを組み合わせてMCPのセキュリティと信頼性を再定義しています。
NotteはオープンソースのフルスタックネットワークAIエージェントフレームワークで、ブラウザセッション、自動化されたLLM駆動エージェント、ウェブページの監視と操作、資格情報管理などの機能を提供し、インターネットをエージェントに優しい環境に変え、自然言語でウェブサイトの構造を記述することでLLMの認知負荷を軽減することを目的としています。
LYRAIOSはモデルコンテキストプロトコル(MCP)に基づく多AIエージェントオペレーティングシステムで、金融ネットワークとブロックチェーンパブリックチェーンを接続することでAIアプリケーションの機能を拡張し、ブロックチェーン操作、金融テクノロジー分析、教育学習などのサービスを提供することを目的としています。
Smart TreeはRustをベースに開発された超高速のディレクトリ可視化ツールで、従来のtreeコマンドよりも10~24倍高速で、AI最適化出力、量子圧縮、スマート検索などの機能を備えており、同時に環境保護と省エネにも配慮しています。
YouTube MCPサーバーは、標準化されたインターフェースの実装で、AI言語モデルがプロトコルを通じてYouTubeコンテンツとやり取りできるようにし、ビデオ情報の取得、字幕管理、チャンネルとプレイリストの管理などの機能を提供します。
ethers.jsに基づくイーサリアムウォレット機能のMCPサービスで、ネットワーク管理、ウォレット操作、コントラクトの相互作用などのブロックチェーンツールセットを提供します。
MCPフロントエンドテストサーバーは、コード分析、テスト生成と実行、Reactコンポーネントテストなどの機能を提供し、JestとCypressフレームワークをサポートします。
Devici MCPサーバーは、Devici APIとのインタラクションに使用されるモデルコンテキストプロトコルサーバーで、ユーザー、コレクション、脅威モデル、コンポーネント、脅威、緩和策、チーム、ダッシュボードデータの管理にLLMツールを提供します。
MCPプロトコルに基づくビットコインとライトニングネットワークのインタラクションサーバーで、鍵生成、アドレス検証、取引デコードなどの機能をサポートします。
Agentify Componentsは、Reactコンポーネントにセマンティックメタデータを追加するフレームワークで、AIシステムや自動化ツールがコンポーネントの機能を理解できるようにします。デコレータを使用してコンポーネントに標準化された説明を追加し、MCPサーバーの設定を生成し、コンポーネントとAIモデルの対話を実現します。
MCPプロトコルに基づくレモネードスタンドゲームサーバーで、Claudeデスクトップクライアントを通じてAI対話型ゲーム体験を提供し、動的な天候、ビジネスシミュレーション、戦略的な意思決定機能を備えています。
Reablocksデザインシステムに基づくインテリジェントなReactコンポーネント生成MCPサーバーで、自然言語処理を通じて本番環境で使用可能なTypeScriptコンポーネントを生成し、レスポンシブレイアウトとアクセシビリティサポートを備えています。
BugBounty MCP Serverは包括的なセキュリティテストツールで、自然言語でLLMと対話し、92種以上の浸透テストツールを提供し、偵察、スキャン、脆弱性評価、Webアプリケーション、ネットワークセキュリティ、OSINT、脆弱性利用、レポート生成などの機能をカバーしています。
Rust MCPファイルシステムは、Rustに基づく高性能、非同期、軽量なMCPサーバーで、ファイルシステム操作を効率的に処理するために設計されており、安全な読み取り専用のデフォルト設定、高度なグローバル検索、およびネストされたディレクトリのサポートを提供します。