AIBase
首页
AI资讯
AI产品库
模型广场
MCP服务
AI服务
算力市场
AI应用指南
ZH

AI资讯

查看更多

开源动作预估模型ViTPose:可以预估每一帧动作,并进行标注

ViTPose是一个开源的动作预估模型,它特别擅长识别人体姿态,就像能看懂你在做什么动作一样。 这个模型最厉害的地方在于它的简洁和高效,它没有采用复杂的网络结构,而是直接使用了一种叫做视觉Transformer的技术。ViTPose 的核心是使用纯粹的视觉Transformer,这就像一个强大的“骨架”,可以提取图像中的关键特征。 它不像其他模型那样需要复杂的卷积神经网络(CNN)来辅助。 它的结构非常简单,就是把多个Transformer层叠在一起。ViTPose 模型可以根据需要调整大小。 就像一个可以伸缩的

14.1k 12-02
开源动作预估模型ViTPose:可以预估每一帧动作,并进行标注

模型

查看更多

Gemini 2.0 Flash

Google

Gemini 2.0 Flash

$0.7

输入tokens/百万

$2.8

输出tokens/百万

1k

上下文长度

Gemini 2.5 Flash

Google

Gemini 2.5 Flash

$2.1

输入tokens/百万

$17.5

输出tokens/百万

1k

上下文长度

GPT-5 nano

Openai

GPT-5 nano

$0.35

输入tokens/百万

$2.8

输出tokens/百万

400

上下文长度

GPT OSS 120B

Openai

GPT OSS 120B

$0.63

输入tokens/百万

$3.15

输出tokens/百万

131

上下文长度

星火医疗大模型 - Lite

Iflytek

星火医疗大模型 - Lite

$2

输入tokens/百万

-

输出tokens/百万

8

上下文长度

Gemini 2.5 Pro

Google

Gemini 2.5 Pro

$8.75

输入tokens/百万

$70

输出tokens/百万

1k

上下文长度

GPT-4.1 nano

Openai

GPT-4.1 nano

$0.7

输入tokens/百万

$2.8

输出tokens/百万

1k

上下文长度

AIBase
智启未来,您的人工智能解决方案智库
English简体中文繁體中文にほんご
友情链接:
AI Newsletters AI ToolsMCP ServersAI NewsAIBaseLLM LeaderboardAI Ranking
© 2025AIBase
商务合作网站地图