Thrillcrazyer
Qwen-1.5B_THIPは、DeepSeek-R1-Distill-Qwen-1.5Bをベースに、DeepMath-103k数学データセット上でTRLフレームワークを使用してGRPO方法で微調整された数学的推論モデルです。このモデルは、数学問題の解決に特化して最適化されており、強力な数学的推論能力を備えています。
prithivMLmods
Qwen-1.5Bをファインチューニングしたコンパクトな多言語推論モデルで、数学問題解決、論理的推論、コード生成、一般的なタスクに優れています