MA-RLHF

Public

《ICLR 2025论文：基于宏动作的人类反馈强化学习 (MA-RLHF)》

llm-training ma-rlhf ppo rlhf

创建时间：2024-09-27T11:48:28

更新时间：2025-06-30T23:13:18

https://openreview.net/forum?id=WWXjMYZxfH

Stars

Stars Increase

相关项目

Dify

Hot

agent

Dify是一个开源的大型语言模型（LLM）应用开发平台。Dify拥有直观的界面，集成了AI工作流程、RAG管道、智能体功能、模型管理、可观测性功能等，让您可以快速地从原型开发到产品上线。

107430

3个月前

+182today

Gpt4all

ai-chat

GPT4All：在任何设备上运行本地大型语言模型。开源且可用于商业用途。

73833

3个月前

+8today

Browser Use

让网站更容易被人工智能访问

LLMs From Scratch

Hot

一步一步用PyTorch从零开始实现一个类似ChatGPT的大型语言模型。

59176

10个月前

+91today

MetaGPT

agent

多智能体框架：首家AI软件公司，迈向自然语言编程

57286

2天前

+24today

LLaMA Factory

Hot

agent

统一高效微调100多个大型语言模型和视觉语言模型 (ACL 2024)

54488

2天前

+90today

Vllm

Hot

amd

一种高效且内存利用率高的用于大型语言模型推理和服务的引擎

52538

1年前

+95today

Autogen

Hot

agentic

一个用于自主智能体的编程框架？PyPI：autogen-agentchat Discord：https://aka.ms/autogen-discord 办公时间：https://aka.ms/autogen-officehour

47454

2周前

+65today

Anything Llm

Hot

agent-framework-javascript

集桌面端和Docker容器于一体的AI应用程序，内置检索增强生成（RAG）、AI智能体、无需编码的智能体构建器等功能。

46691

2天前

+52today

Llama_index

agents

LlamaIndex 是一个领先的框架，用于基于你的数据构建强大的、由大型语言模型 (LLM) 驱动的智能体。

43175

2天前

+36today

AI开源&商用产品

AI产品提交

模型库

MCP服务端

MCP客户端

MCP服务调试

案例教程

AI热门资讯

今日AI热点

MA-RLHF

相关项目

Dify

Gpt4all

Browser Use

LLMs From Scratch

MetaGPT

LLaMA Factory

Vllm

Autogen

Anything Llm

Llama_index