【AI日報】へようこそ!ここは毎日人工知能世界を探索するためのガイドです。毎日、AI分野のホットな内容をお届けし、開発者に焦点を当てて技術トレンドや革新的なAI製品の応用を理解するお手伝いをします。新鮮なAI製品についてはこちらから詳しく:https://app.aibase.com/zh1、アリババグループがLingBot-VLAを発表:「二本腕ロボット操作が大規模モデル時代へ」アリババグループは視覚・言語・行動のベースモデルであるLingBot-VLAを発表しました。
ヨーロッパのAI企業であるMistral AIは、プログラミングアシスタントであるMistral Vibe 2.0をリリースしました。この新バージョンは、新しいモデルであるDevstral2で駆動されています。最大のアップグレードは、複数のエージェントを同時に操作でき、自然言語によって複数のファイルを同時に行い、コードベース全体のコンテキストを利用して開発できるマルチエージェントオーケストレーション機能の導入です。これにより、プログラミング体験と効率が大幅に向上しています。
欧州AI企業Mistral AIがプログラミング支援ツール「Mistral Vibe 2.0」を発表。新モデル「Devstral 2」を搭載し、コマンドラインから自然言語で複数ファイルを同時操作可能に。コードベース全体の文脈を活用した開発と、ワークフローを細分化するカスタム「サブエージェント」機能を導入。....
Medeo AIが新バージョンのビデオエージェントをリリース。自然言語による動画編集と効率的な反復処理を実現し、創作のハードルを大幅に下げ、海外市場で注目を集めています。....
2025年に新たにリリースされたAI音声入力ソフトで、ミリ秒単位で応答し、正確に認識し、言語をスマートに再構成します。
AIアバターを使って、学生の入学案内や新入社員の研修をインタラクティブな多言語体験に変え、コストを節約します。
微信AIの新技術を統合した、最新の視覚言語モデルです。
設計言語で思考する革命的なAIモデル。画像生成における新たな基準を打ち立てます。
Anthropic
$7
入力トークン/百万
$35
出力トークン/百万
200
コンテキスト長
Alibaba
$3.9
$15.2
64
-
Deepseek
$4
$12
128
Openai
$8.75
$70
400
$1.75
$14
$105
$525
Chatglm
Iflytek
$2
Tencent
$0.8
32
$0.3
$8
Google
Huawei
$21
$2.4
$9.6
allenai
Olmo 3はAllen Institute for AIによって開発された全新型の言語モデルファミリーで、7Bと32Bの2種類の規模があり、指令(Instruct)と思考(Think)の2種類のバリエーションがあります。このモデルは長鎖型の思考を用いて、数学やコーディングなどの推論タスクの性能を向上させ、言語モデル科学の発展を推進することを目的としています。
Olmo 3は、Allen Institute for AI (Ai2)によって開発された全く新しい32Bパラメータの言語モデルファミリーで、Base、Instruct、Thinkなどのバリエーションが含まれています。このモデルはDolma 3データセットを基に訓練され、65,536の長文脈処理をサポートし、言語モデル科学の発展を推進することを目的としています。モデルは完全にオープンソースで、Apache 2.0ライセンスに従っています。
Mungert
LFM2はLiquid AIによって開発された次世代のハイブリッドモデルで、エッジAIとデバイス端末のデプロイメントに特化して設計されており、品質、速度、メモリ効率の面で新しい基準を確立しています。このモデルは革新的なハイブリッドLiquidアーキテクチャを採用し、乗算ゲートと短い畳み込みを備えており、多言語処理をサポートしています。
Olmo 3は、Allen Institute for AIによって開発された全く新しい7Bパラメータの言語モデルシリーズで、Transformerアーキテクチャに基づき、Dolma 3データセットで訓練され、言語モデル科学の発展を推進することを目的としています。モデルはBase、Instruct、Thinkなどの複数のバリエーションを提供し、最大65,536の文脈長をサポートします。
unsloth
LFM2-350MはLiquid AIによって開発された第2世代のハイブリッドモデルで、エッジAIとデバイス端末のデプロイに特化して設計されています。このモデルは、品質、速度、メモリ効率の面で新しい基準を確立し、3億5000万のパラメータを持ち、複数の言語をサポートし、エッジコンピューティングシナリオに適しています。
zai-org
GLM-4-Z1-9B-0414は智譜AIが発表した新世代の90億パラメータのオープンソース大規模言語モデルで、強力なテキスト生成と推論能力を持っています。このモデルは数学的推論と汎用タスクで優れた性能を発揮し、リソースが制限されたシナリオで効率と効果のバランスを見事に実現し、友好的なローカルデプロイをサポートしています。
scb10x
台風T1 3BはSCB 10Xが開発した新型オープン推論モデルシリーズの最初の製品です。このモデルはLlama 3.2アーキテクチャに基づいており、異分野の推論能力を備え、GPQA、MMLU Pro、AI数学オリンピックなどのベンチマークテストで優れた成績を収めており、特にタイ語の推論過程生成をサポートしています。
IDEA-CCNL
Taiyi-Diffusion-XLは、中国語のテキストから画像生成能力を強化しながら、英語の理解能力も保持するバイリンガル拡散モデルです。Stable-Diffusion-XLアーキテクチャに基づき、高品質のバイリンガルデータセットで訓練され、画像品質、多様性、テキストアライメントの面で優れた性能を発揮し、AIGCとデジタルアート創作に新たな選択肢を提供します。
MCPfinderは、AIエージェントに動的な能力拡張を提供するローカルサーバーツールです。MCPプロトコル互換のツールパッケージを検索してインストールすることで、言語モデルが必要に応じて新しい機能を取得できるようになります。
Gaia - Xは、新しいAIパラダイムに基づく企業向けAIアプリケーションプラットフォームで、革新的な技術アーキテクチャによって企業のAI製品の核心的な問題を解決し、複数のエージェントの協調、自然言語RPA、MCPプロトコルのサポートなどの核心機能を提供します。
Maya MCPサーバープロジェクトはModel Context Protocol (MCP)を実装し、AIアシスタントが自然言語でAutodesk Mayaを制御できるようにします。このプロジェクトは軽量設計で、Mayaにプラグインをインストールする必要はなく、MayaのデフォルトのMELスクリプトポートを介して通信し、新しいツール機能を動的に追加できます。