字节跳动Seed团队开源大模型Seed-OSS-36B,支持51.2万tokens长文本处理,推理能力强。含3个版本:基础版(合成数据)、基础版(无合成数据)和指令调优版。....
巨人ネットワークは、同社のソーシャル推理ゲーム『宇宙殺』にDeepSeek大規模言語モデルを正式に導入し、同技術に基づいたネイティブゲームプレイ「インポスターチャレンジ」を発表しました。現在、このプレイモードはグレースケールテストを実施中で、その後、全ユーザー向けに公開される予定です。これは、DeepSeek大規模言語モデルの能力をゲームプレイの革新に初めて深く適用し、AIによってゲームのコアプレイを駆動し、ゲームの競技性とインタラクション体験を刷新することを意味します。
Jackrong
本プロジェクトでは、革新的な二段階訓練プロセスを通じて、GPTの推理能力をLlama - 3.1 - 8Bモデルに蒸留します。まず、教師付き微調整によって知識の蒸留と形式の整列を行い、次に強化学習によってモデルに自主的に探索し、推理戦略を最適化させます。特に、数学推理分野の能力向上に注力しています。
suayptalha
Sungur-14Bは、トルコ語に特化した大規模言語モデルで、Qwen/Qwen3 - 14Bをベースに派生しています。このモデルは、41,100個のトルコ語サンプルを含むデータセットを使用して微調整され、数学、医学、一般知識などの分野の推理会話をカバーし、トルコ語の地域的な推理能力を強化することを目的としています。
mistralai
魔主小型 1.1は、魔主小型3.1をベースに構築された240億パラメータの効率的な推理モデルで、新たに推理能力が追加され、多言語をサポートし、Apache 2.0ライセンスを採用しており、単一のRTX 4090または32GBメモリのMacBookでローカルにデプロイして実行できます。
Smilyai-labs
Sam-reason-S2.1はSmilyAIが開発した推理に特化したファインチューニング言語モデルで、悪役スタイルと構造化された出力能力を備えています。
SmilyAI推理-Sシリーズの最初のモデルで、推論能力、アイデンティティ特性、個性をオープンドメイン対話エージェントに統合することに焦点を当てています
OLAIR
OLAIR/ko-r1-14b-v2.0.3は、韓国語の理解と推理に特化した大規模言語モデルで、推理タスクで優れた性能を発揮し、韓国語の言語処理に強力な能力を提供します。このモデルはko-r1-7b-v2.0.3の拡張版で、主に実験目的で使用されます。
HKAIR-Lab
HK-O1awはO1スタイルの複雑な推理能力を備えた法律アシスタントで、LLaMA-3.1-8Bをベースに香港地域の法律分野向けに設計されています。
MathGenie
MathCoder2は、MathCode - Pile数学コードデータセットで継続的な事前学習を行うことで作成されたモデルで、高度な数学推理タスクに強力なサポートを提供し、数学推理能力において著しい向上が見られます。
dmis-lab
メングース - 8BはMetaのLlama - 3 - 8B - Instructモデルをベースに開発された医療AIシステムで、合成データセットを使って指令微調整を行い、高度な医学推理能力を備え、複雑な医学問題を解決するために特化しています。