哈工大团队联合博实股份发布双形态人形机器人系统,具备双足行走与轮式移动能力,并推出自研关节模组、灵巧手及AI智能控制系统,实现了核心部件与整机集成的系统性突破。
马斯克批评政府医疗体系效率低下,提出由AI大模型Grok进行智能诊断,特斯拉人形机器人执行手术护理,以实现高效普惠医疗。
优必选旗下优奇与火山引擎合作,整合机器人本体与云端AI技术,加速大模型在工业物流领域的应用。双方将围绕多模态大模型、VLA模型、世界模型及豆包生态展开合作,推动技术规模化落地。
北京人形机器人创新中心开源国内首个符合具身智能国家标准的VLA大模型XR-1,并配套发布RoboMIND2.0数据底座和ArtVIP高保真数字资产数据集,旨在推动机器人技术发展,为开发者提供强大支持。
百聆是一个类似GPT-4o的语音对话机器人,通过ASR+LLM+TTS实现,低配置也可运行,支持打断。
大语言模型AI机器人,替代人工客服
为LLM聊天机器人提供强大灵活的长期记忆系统。
基于多模态大型语言模型的Discord机器人
Openai
$2.8
Input tokens/M
$11.2
Output tokens/M
1k
Context Length
Google
$0.49
$2.1
Xai
$1.4
$3.5
2k
$7.7
$30.8
200
-
Anthropic
$105
$525
$0.7
$7
$35
$17.5
$21
Alibaba
$4
$16
$1
$10
256
$2
$20
$6
$24
Baidu
128
jeevanrushi07
OpenLLaMA 3B v2是一个基于Transformer架构的开源大语言模型,拥有30亿参数。该模型采用MIT许可证,主要用于英文文本生成任务,支持聊天机器人等多种应用场景。
VLA-Adapter
VLA-Adapter是一种在Libero-Spatial上训练的微型视觉语言动作模型,采用Prismatic-VLM架构,仅使用Qwen2.5-0.5B作为大语言模型主干。该模型在机器人基准测试中超越了参数规模更大的开源VLA模型,实现了高性能的视觉-语言-动作理解与执行。
nvidia
NVIDIA Qwen3-30B-A3B FP4是阿里巴巴Qwen3-30B-A3B模型的量化版本,采用优化的Transformer架构,通过FP4量化技术将模型大小减少约3.3倍,同时保持较好的性能表现。该模型支持商业和非商业用途,适用于AI代理系统、聊天机器人、RAG系统等应用场景。
metehanayhan
基于Meta LLaMA 3.1 8B大语言模型微调的土耳其语教育问答聊天机器人,专为土耳其语教育场景优化。
senko-sleepy-fox
基于Mistral模型的动漫角色聊天机器人,以《帮助狐仙大人》中的Senko为蓝本,提供情感支持和温暖对话体验
Mungert
Llama-3.1-Nemotron-Nano-4B-v1.1是一款基于Llama 3.1优化的大语言模型,在准确性和效率间取得良好平衡,适用于AI代理、聊天机器人等多种场景。
这是DeepSeek AI的DeepSeek V3-0324模型的量化版本,采用优化的Transformer架构,通过FP4量化技术显著减少了模型大小和GPU内存需求,适用于AI智能体系统、聊天机器人等多种AI应用场景。
SpursgoZmy
Table LLaVA 7B是一个开源的多模态聊天机器人,专门设计用于理解表格图像,能够执行表格问答、表格单元格描述和结构理解等多种表格相关任务。该模型基于LLaVA-v1.5架构,使用CLIP-ViT-L-336px作为视觉编码器,Vicuna-v1.5-7B作为基础大语言模型。
mav23
GPT4All-Falcon是基于Apache 2.0许可的聊天机器人,在Falcon-7B模型基础上进行微调,在大规模精心策划的助手交互语料库上训练,支持多种对话任务和内容生成。
zongzhuofan
MoVA-8B是一个开源的多模态大语言模型,采用从粗到细的机制,自适应地路由和融合特定任务的视觉专家模块,可用于多模态模型和聊天机器人的研究。
ibm-granite
Granite-7b-lab是IBM Research基于Granite-7b-base模型,采用LAB(聊天机器人大规模对齐)方法训练得到的衍生模型,主要用于文本生成任务。
ermu2001
PLLaVA是一款开源的视频语言聊天机器人,通过在视频指令跟随数据上微调图像大语言模型而得,可用于多模态大模型和聊天机器人的研究。
instructlab
Granite-7b-lab是由IBM研究院开发的大语言模型,基于Granite-7b-base模型,采用LAB(大规模聊天机器人对齐)方法训练而成,专注于文本生成任务。
cjpais
LLaVA 1.6 34B是一个开源的多模态聊天机器人模型,通过在多模态指令遵循数据上微调大语言模型开发而成。支持图像文本生成文本任务。
liuhaotian
LLaVA 是一个开源的多模态聊天机器人,通过对多模态指令跟随数据进行大型语言模型微调训练而成。
LLaVA是一款开源的多模态聊天机器人,通过对多模态指令跟随数据进行大语言模型微调训练而成。
LLaVA 是一个开源的多模态聊天机器人,通过在多模态指令跟随数据上微调大语言模型训练而成。
LLaVA是一个开源的多模态聊天机器人,基于大语言模型微调训练而成,支持图像和文本的交互。
stanford-oval
WikiChat是一个基于LLaMA-2 (7B)微调的大语言模型,通过在维基百科上进行少量样本锚定来阻止聊天机器人产生幻觉,显著提高了对话的准确性和事实性。
riotu-lab
ArabianGPT-0.3B是专为阿拉伯语优化的GPT-2模型,由沙特王子大学机器人与物联网实验室研发,针对阿拉伯语复杂特性进行优化。
一个基于大型语言模型和Mineflayer API的Minecraft机器人,通过MCP协议实现Claude等模型控制游戏角色。
基于大模型的智能对话机器人项目,支持多平台接入和多种AI模型,具备文本、语音、图像处理及插件扩展能力,可定制企业AI应用。