value-rnn-td

Public

使用时序差分学习 (TD learning) 训练一个循环神经网络 (RNN) 来估计部分可观测马尔可夫决策过程 (POMDP) 中的状态价值。

pomdp pytorch rnn td-learning

创建时间：2022-02-26T23:05:43

更新时间：2025-07-27T13:31:35

Stars

Stars Increase

相关项目

Stable Diffusion Webui

Hot

Stable Diffusion 的网页版界面

158833

3个月前

+73today

Transformers

Hot

bert

Pytorch、TensorFlow和JAX框架下最先进的机器学习转换器

153615

2年前

+136today

LLMs From Scratch

Hot

一步一步用PyTorch从零开始实现一个类似ChatGPT的大型语言模型。

80697

5个月前

+221today

Vllm

Hot

amd

一种高效且内存利用率高的用于大型语言模型推理和服务的引擎

64909

1年前

+236today

Annotated_deep_learning_paper_implementations

Hot

attention

60多个深度学习论文的实现/教程，并附带旁注；涵盖Transformer（原始版、XL、Switch、Feedback、ViT等）、优化器（Adam、AdaBelief、Sophia等）、GAN（CycleGAN、StyleGAN2等）、强化学习（PPO、DQN）、Capsule网络、知识蒸馏等。

64723

1个月前

+52today

Keras

人类的深度学习

Real Time Voice Cloning

deep-learning

只需5秒钟克隆语音，即可实时生成任意语音内容

58986

1个月前

+25today

Yolov5

coreml

将 YOLOv5 模型（基于 PyTorch 框架）转换为 ONNX、CoreML 和 TFLite 格式。

56301

2个月前

+25today

Made With ML

data-engineering

学习如何设计、开发、部署和迭代生产级别的机器学习应用。

44677

1年前

+43today

AI For Beginners

12周，24节课，人人皆可学AI！

44127

1个月前

+44today

AI新闻资讯

最新AI日报

AI 商用·开源产品库

AI 产品排行榜

AI产品提交

AI工具导航

模型库

大模型排行榜

模型供应商

大模型选型对比

大模型费用计算器

大模型竞技场

MCP服务端

MCP客户端

MCP教程与实践

MCP排行榜

MCP服务提交

MCP实验场

MCP服务调试器

GEO全景分析平台

GEO品牌监控分析

GEO排名查询工具

GEO推广链接检测

GEO排名优化系统

GEO 大模型推荐优化

模型个人电脑配置检测器

模型部署服务器配置计算器

value-rnn-td

相关项目

Stable Diffusion Webui

Transformers

LLMs From Scratch

Vllm

Annotated_deep_learning_paper_implementations

Keras

Real Time Voice Cloning

Yolov5

Made With ML

AI For Beginners