DeepScaleR-1.5B-Preview

強化学習によって最適化された大規模言語モデルで、数学問題解決能力の向上に特化しています。

一般製品生産性人工知能強化学習

DeepScaleR-1.5B-Previewは、強化学習によって最適化された大規模言語モデルであり、数学問題解決能力の向上に特化しています。このモデルは分散型強化学習アルゴリズムを用いることで、長文推論における精度を大幅に向上させています。主な利点としては、効率的なトレーニング戦略、顕著な性能向上、そしてオープンソースによる柔軟性などが挙げられます。このモデルはカリフォルニア大学バークレー校のSky Computing LabとBerkeley AI Researchチームによって開発され、特に数学教育や競技数学の分野における人工知能の応用を推進することを目的としています。MITオープンソースライセンスを採用しており、研究者や開発者は無料で利用できます。

AIニュース

AIデイリー

AIタイムライン

Alハードウェアです

最新事例

画像コレクション

ビデオコレクション

オーディオコレクション

コンテンツコレクション

最新チュートリアル

AIプロダクトランキング

AIトラフィック成長ランキング

AIトラフィック減少ランキング

AI週間ランキング

アメリカ合衆国

中国

インド

ブラジル

画像生成

パーソナルアシスタント

キャラクター生成

ビデオ生成

AIプロジェクトランキング

AIプロジェクト成長ランキング

AI開発者ランキング

AI組織ランキング

Deepseek

TTS

LLM

ChatGPT

概要

DeepScaleR-1.5B-Preview

DeepScaleR-1.5B-Preview 最新のトラフィック状況

DeepScaleR-1.5B-Preview 訪問数の傾向

DeepScaleR-1.5B-Preview 訪問地理的分布

DeepScaleR-1.5B-Preview トラフィックソース

DeepScaleR-1.5B-Preview 代替品

RLVR-GSM-MATH-IF-Mixed-Constraints — 強化学習検証のための数学問題データセット

DeepScaleR-1.5B-Preview — 強化学習によって最適化された大規模言語モデルで、数学問題解決能力の向上に特化しています。

Light-R1-14B-DS — 強化学習によって訓練された、140億パラメーターのオープンソース数学モデル。優れた性能を誇ります。

AI数学ソルバー — 人工知能を活用して様々な数学の問題を解決する最先端ツール

DiffusionRL — 拡散モデルへの大規模強化学習

DIAMOND — 拡散ワールドモデルで訓練された強化学習エージェント

JaxMARL — JaxMARL ― 多エージェント強化学習ライブラリ

SorSor — 写真で数学、化学、言語を識別し、スマートな解答を提供します

Parrot — 多目的強化学習フレームワーク。テキストから画像を生成します。

myFuture-AI — 人工知能の開発、提供、教育

Motif — 人工知能からのフィードバックから内発的動機付けを得る

AI数学問題解決ツール — AIを活用し、数学の問題をスマートに解決、学習効率を向上させます。

PRIME-RL — PRIMEは、暗黙的報酬を用いてオンライン強化学習を強化し、言語モデルの推論能力を向上させる技術です。

SERL — SERLは、高効率なロボット強化学習ソフトウェアパッケージです。

DigiRL — 自律型強化学習を用いて、野外機器制御エージェントを訓練します。

EurusPRM-Stage2 — EurusPRM-Stage2は、生成モデルの推論能力向上を目的とした、暗黙的過程報酬に基づく強化学習モデルです。

mwp_ReFT — 深層強化学習に基づくモデル微調整フレームワーク

to-teach.ai — 教育の未来を発見する

agibot_x1_train — 強化学習訓練用モジュール式人型ロボット

EurusPRM-Stage1 — EurusPRM-Stage1は、暗黙的過程報酬に基づく強化学習モデルであり、生成モデルの推論能力向上を目的としています。

Udacity人工知能学院 — AIと機械学習のコースを提供

DeepMind — Google傘下の、最先端の人工知能研究企業

Tülu 3 405B — Tülu 3 405Bは、強化学習によって性能を向上させた大規模なオープンソース言語モデルです。

RLLoggingBoard — 強化学習におけるヒューマンフィードバックによる訓練過程の可視化ツールです。深い理解とデバッグに役立ちます。

Unitree RL GYM — 強化学習のためのUnitreeロボットプラットフォーム

d1 — 強化学習を利用して拡散型大規模言語モデルの推論能力を向上させます。

AI Teacha — AI Teachakey：人工知能を活用して、よりスマートに業務を遂行

Kimi k1.5 — Kimi k1.5は、強化学習によって拡張されたマルチモーダル言語モデルであり、推論能力と論理能力の向上に重点を置いています。

Bytelearn — 24時間365日AIによる数学の無料学習サポート

FormuTodo — クラス最高の学習ツールになりましょう