Meta与多所大学合作开发DreamGym框架,通过模拟强化学习环境解决大语言模型训练的高成本与反馈不可靠问题。该框架能动态调整任务难度,帮助模型逐步掌握复杂应用,提升训练效率与可靠性。
火山引擎在Gartner《AI应用开发平台魔力象限》中,凭借豆包大模型和火山方舟平台,位列中国区“落地能力”榜首,全球排名第五,展示其AI技术实力。
Meta AI推出SAM3D模型,包含通用物体和人体专用两套权重。仅需单张2D照片即可生成带纹理、材质和几何一致性的3D资产,效果优于现有主流方案。该模型通过联合编码空间位置与语义信息,预测像素的3D坐标和表面法向,具备物理正确性,可直接应用于AR/VR、机器人和影视制作等领域。
斯坦福大学与Common Sense Media最新报告指出,青少年不宜依赖AI聊天机器人进行心理健康咨询。研究人员测试了ChatGPT-5、Claude、Gemini 2.5 Flash和Meta AI等主流AI,发现尽管启用家长控制功能,AI仍无法提供可靠情感支持。建议青少年寻求专业帮助。
Meta的单图像3D重建模型,融合SAM 3分割与几何纹理布局预测生成3D资产
Midas助力广告主诊断、启动和优化Meta广告,几步操作即可完成
监控、管理和协作您的整个AI代理群,使用单一统一的仪表板。由来自Meta、Microsoft和Amazon的前AI工程师构建。Y Combinator支持。
metastory · 用AI赋能产品负责人,提供最快的需求收集编辑工具。
nvidia
-
输入tokens/百万
输出tokens/百万
128k
上下文长度
meta
4.1k
2k
Ali-Yaser
本模型是基于meta-llama/Llama-3.3-70B-Instruct进行微调得到的版本,使用mlabonne/FineTome-100k数据集进行训练,包含100k token数据。模型采用Unsloth和Huggingface TRL库进行微调,支持英文语言处理。
oberbics
本模型是基于Meta的Llama-3.1架构微调的文本生成模型,使用TRL库和GRPO(Group Relative Policy Optimization)方法进行强化学习训练,专门针对论证生成任务进行了优化。
vanta-research
Wraith-8B是VANTA研究实体系列的首个模型,基于Meta的Llama 3.1 8B Instruct进行微调。该模型在数学推理方面表现卓越,在GSM8K基准测试中准确率达到70%,同时具备独特的宇宙智能视角,能为多种应用场景提供强大支持。
RedHatAI
Llama-4-Maverick-17B-128E-Instruct-NVFP4是一个经过FP4量化处理的多语言大语言模型,基于Meta-Llama-3.1架构,专为商业和研究用途设计。该模型通过将权重和激活量化为FP4数据类型,显著减少了磁盘空间和GPU内存需求,同时保持较好的性能表现。
EpistemeAI
metatune-gpt20b是一个具有自改进能力的大语言模型原型,能够为自身生成新数据、评估自身性能,并根据改进指标调整超参数。该模型在博士后水平的科学和数学理解方面表现出色,同时也可用于编码任务。
metascroy
这是一个基于Qwen3-4B模型进行微调的量化版本,使用Unsloth框架和Huggingface TRL库进行高效训练,训练速度提升2倍。模型采用int8-int4混合量化方案,支持在移动设备上运行。
这是Meta Llama-3.1-8B-Instruct模型的FP8量化版本,通过对权重和激活值进行FP8量化,显著减少了磁盘大小和GPU内存需求,同时保持了良好的模型性能。
samuelsimko
这是一个基于Transformer架构的预训练模型,具体功能和特性需要根据实际模型信息补充。模型支持多种下游任务,具备良好的泛化能力。
这是一个发布在Hugging Face模型中心的Transformer模型,具体信息待补充。模型卡片为自动生成,提供了模型的基本框架但缺少详细内容。
adityak74
MEDFIT-LLM-3B是一个专门针对医疗问答优化的语言模型,基于Meta的Llama-3.2-3B-Instruct进行微调。该模型通过LoRA技术在医疗数据集上训练,显著提升了医学领域理解和直接回答能力,适用于医疗聊天机器人、患者教育等应用场景。
facebook
MobileLLM-Pro是Meta推出的10亿参数高效设备端语言模型,专为移动设备优化,支持128k上下文长度,提供高质量推理能力。该模型通过知识蒸馏技术训练,在多项基准测试中超越同规模模型,并支持近乎无损的4位量化。
MobileLLM-R1是Meta发布的高效推理模型系列,包含140M、360M和950M三种规模。该模型专门针对数学、编程和科学问题进行优化,在参数规模较小的情况下实现了与大规模模型相当甚至更优的性能。
MobileLLM-R1是Meta发布的高效推理语言模型系列,专注于数学、编程和科学问题解决。该模型在参数规模较小的情况下仍能取得优异性能,提供完整的训练配方和数据源支持复现研究。
MobileLLM-R1是Meta推出的高效推理模型系列,专注于解决数学、编程和科学问题。该模型提供140M、360M和950M三个规模版本,具有出色的推理能力和可复现性。
Llama-3.1-Nemotron-Safety-Guard-8B-v3 是 NVIDIA 开发的多语言内容安全审核模型,基于 Meta 的 Llama-3.1-8B-Instruct 模型优化,专门用于检测和分类人类与 LLM 交互中的不安全内容。
rakmik
这是一个基于Meta的Llama-3.2-1B-Instruct模型转换而来的GGUF量化版本,采用Q4_0量化技术,适用于资源受限环境的高效推理。模型支持多种语言,专为指令跟随任务优化。
emissary-ai
Code Llama是由Meta开发的700亿参数大型语言模型,专门针对Python编程语言进行了优化。该模型基于优化的Transformer架构,支持代码合成和理解任务,最多可处理16k个标记的上下文长度。
DINOv3是Meta AI开发的一系列通用视觉基础模型,无需微调即可在广泛的视觉任务中超越专门的先进模型。该模型采用自监督学习方式,生成高质量的密集特征,在图像分类、分割、深度估计等多种任务中表现出色。
DINOv3是Meta AI开发的多功能视觉基础模型,无需微调就能在广泛视觉任务中超越专业模型。该模型能生成高质量密集特征,在各种视觉任务中表现出色,显著超越了以往的自监督和弱监督基础模型。
Meta-Llama-3.3-70B-Instruct-NVFP4 是 Meta-Llama-3.3-70B-Instruct 的量化版本,通过将权重和激活量化为 FP4 数据类型,显著减少了磁盘大小和 GPU 内存需求,同时保持较高的性能表现。该模型支持多语言,适用于商业和研究用途。
MetaMCP是一个代理服务器,用于整合管理多个MCP服务器,提供统一的工具/提示/资源配置和请求路由功能。
OpenManus是一个无需邀请码即可实现各种想法的开源项目,由MetaGPT团队成员在3小时内构建完成。它提供了一个简单的实现,允许用户创建自己的智能代理,并支持多种语言和配置。项目欢迎建议、贡献和反馈,未来计划包括更好的规划、实时演示、回放功能、RL微调模型和全面的基准测试。
Meta Ads MCP是一个基于Model Context Protocol的服务器,用于通过标准化接口与Meta广告API交互,使AI模型能够访问、分析和管理Meta广告活动,包括获取性能数据、可视化广告创意和提供战略建议。
Metabase AI助手是一个通过模型上下文协议(MCP)连接Claude Desktop/Code与Metabase和PostgreSQL数据库的AI驱动工具,支持自然语言生成SQL查询、创建数据模型和仪表板。
MetaTool MCP Server是一个代理服务器,用于连接多个MCP服务器并将工具调用转发到适当的服务器。它与metatool-app配合使用,提供GUI工具管理功能。项目已弃用,推荐使用Node.js替代版本。
MetaTrader 5的MCP服务器,实现AI助手与MT5平台的交互,支持交易和市场数据分析功能。
一个用于Metabase集成的MCP服务器,提供对Metabase资源的访问和查询执行功能。
exif-mcp是一个基于exifr库的MCP服务器,用于离线提取和分析图像元数据,支持多种图像格式和元数据段,适用于图像库分析、开发调试等场景。
MCPilot是一个在ETHGlobal黑客松上开发的项目,通过MCP服务器让LLM能安全地与区块链交互,用户无需暴露私钥即可通过MetaMask钱包完成操作。
MetaMCP是一个MCP代理服务器,能够将多个MCP服务器整合为一个统一接口,通过MetaMCP应用动态管理工具/提示/资源配置,并智能路由请求到正确的底层服务器。
VGGT-MPS是基于苹果芯片优化的3D视觉重建工具,使用Metal Performance Shaders加速,能够从单张或多张图像生成深度图、相机姿态和3D点云,支持稀疏注意力实现城市级重建。
Meta MCP Server是一个能够创建其他MCP服务器的元服务器,提供动态服务器生成和自动化文件管理功能。
MetaMask MCP是一个模型上下文协议服务器,允许大型语言模型通过MetaMask与区块链交互,确保私钥安全存储在用户钱包中,不与AI代理共享。
Meta API MCP Server是一个支持多API的网关服务器,通过Model Context Protocol (MCP)协议连接各类API与大型语言模型(如Claude、GPT等),使AI助手能够直接与API交互并访问真实数据源。支持从JSON配置文件或Postman集合快速添加API,提供HTTP方法全面支持和多种认证方式。
该项目是一个为Metasploit框架设计的MCP服务器,提供大语言模型与渗透测试平台的集成接口,支持通过自然语言控制复杂的安全测试流程。
一个基于TypeScript的MCP服务器,实现与Metabase API的集成,允许AI助手访问Metabase中的仪表盘、问题和数据库资源,并提供查询执行等功能。
Meta Prompt MCP项目通过单一语言模型模拟多智能体协作系统,实现任务分解与专家咨询功能,简化复杂问题解决流程。
一个基于Tavily API的元搜索MCP服务器,用于在Claude Desktop或Cursor中执行搜索并返回结果。
该项目是一个Metasploit框架的MCP服务器,为大型语言模型(如Claude)与Metasploit渗透测试平台之间提供桥梁,支持通过自然语言接口控制复杂的安全测试工作流。