アリババの通義ラボがFIPOアルゴリズムを発表。Future-KLメカニズムにより、複雑な論理推論における従来の強化学習の課題を解決し、数学問題などの推論精度と効率を大幅に向上させた。....
アリババの通義研究所が新アルゴリズムFIPOを発表。Future-KLメカニズムを導入し、長文推論における純粋強化学習の「推論長停滞」問題を解決し、複雑な論理整合性のトレーニング効果を向上させます。....
西湖ロボティクス社が人形ロボットのタイタンo1を発表しました。このロボットには世界で初めての動作汎化大モデルであるGAEサイボーパークシステムが搭載されています。このロボットはミリ秒単位で模倣する能力を持ち、リアルタイムで人の動きを再現することが可能で、一人で複数台のサイボーパークを操作できるようになり、ロボット分野における新たな突破を示しています。
快手傘下の可霊AIは2026年初頭に急成長し、MAUが1200万人を突破、有料ユーザーは前月比350%増。成長は多モーダル動画モデル「O1」や「音画同出」機能、2026年1月の「動作制御」新機能など迅速な製品改良による。....
専門のAIビデオ生成プラットフォームで、テキストと画像からビデオを作成し、入力されたビデオを幅広く編集することができます。
AI音楽ジェネレーター。歌詞とプロンプトを完全に制作された楽曲に変換し、無制限でロイヤリティフリーです!
o1-proモデルは強化学習により複雑な推論能力を向上させ、より最適な回答を提供します。
网易有道が開発した軽量な推論モデル。単一のGPUで展開でき、o1と同等の推論能力を備えています。
Openai
$14
入力トークン/百万
$56
出力トークン/百万
200
コンテキスト長
Alibaba
$2
-
32
$105
$420
$21
$84
128
XiaomiMiMo
MiMo-7B-RLはMiMo-7B-SFTモデルを基に強化学習で訓練されたモデルで、数学とコード推論タスクで優れた性能を発揮し、OpenAI o1-miniに匹敵する性能を持っています。
MiMo-7B-RLはMiMo-7B-SFTモデルを基に強化学習でトレーニングされたモデルで、数学とコード推論タスクにおいてOpenAI o1-miniと肩を並べる性能を発揮します。
evilfreelancer
GigaChat-20B-A3Bモデルを基に訓練されたLoRAアダプターで、ロシア語の論理的思考プロセスをシミュレートするために特別に設計
Skywork
Skywork o1 Open-PRM-Qwen-2.5-1.5BはQwen2.5-Math-1.5B-Instructをベースに訓練された増分プロセス報酬モデルで、小規模な複雑問題解決能力の強化を目的として設計されています。
Skywork o1 Open-Llama-3.1-8BはLlama-3.1-8Bをベースに訓練された強力な対話モデルで、'スロー思考'推論スタイルのデータにより推論能力が大幅に強化されています。
Skywork o1オープンモデルシリーズの7Bパラメータ規模モデル、Qwen2.5-Math-7B-Instructをベースに訓練、段階的プロセス報酬強化の推論能力を備える
HKAIR-Lab
HK-O1awはO1スタイルの複雑な推理能力を備えた法律アシスタントで、LLaMA-3.1-8Bをベースに香港地域の法律分野向けに設計されています。
このプロジェクトは、OpenAIのo1モデルとFluxの機能を統合するMCPサーバーを提供し、モデルのインタラクションと画像処理機能をサポートします。