当前视频处理系统能识别画面内容,但难以理解复杂物理规律和空间移动,如判断车辆通过顺序或物体轨迹最高点。主要原因是高质量运动参考数据严重不足,现有数据规模小且依赖昂贵人工识别,限制了系统计算能力。
小米发布开源大模型MiMo-V2-Flash,主打高速高效,在推理、代码生成等任务中表现突出,响应速度超越多款热门国产模型。该模型采用稀疏激活架构,参数量达3090亿,以MIT协议开源权重与代码。
MIT研究团队开发出实例自适应缩放技术,可根据问题复杂度动态调整大型语言模型的计算资源,提升效率并降低能耗。该研究获多家机构支持,相关论文已于11月初发布。
MIT科学家通过15年研究,首次绘制出人脑语言网络的毫米级概率图。该网络体积小但功能强大,专门负责词语意义映射和句子拼装,与思考、情绪模块完全分离。通过1400次fMRI扫描,研究确认了“语言芯片”的存在。
Geschenkidee.ai借助AI为用户智能推荐合适礼物,有多种筛选条件。
基于数据仓库的大数据分析解决方案,帮助您更快速、高效地做出决策,推动业务增长。
掌握健康,预测未来,改变健康轨迹。
自动化解释性代理,提升AI模型透明度
Alibaba
-
输入tokens/百万
输出tokens/百万
上下文长度
Deepseek
$4
$12
128
Chatglm
$16
32
$0.7
$1.95
16
$1.8
$5.4
$2
$8
Minimax
Stepfun
Baidu
mitegvg
该模型是基于VideoMAE架构的暴力检测模型,在Kinetics数据集预训练的基础上,针对暴力检测任务进行了92轮微调。模型采用Vision Transformer架构,专门用于视频内容分析,能够识别视频中的暴力行为。
mlx-community
MiniMax-M2-5bit 是基于 MiniMaxAI/MiniMax-M2 模型转换而来的 5 位量化版本,专为 MLX 框架优化。该模型是一个大型语言模型,支持文本生成任务,采用 MIT 许可证发布。
Mitchins
这是一个基于EfficientNet-B0架构的深度学习模型,专门用于对动漫和视觉小说图像进行艺术风格分类。模型能够准确识别6种不同的动漫艺术风格,包括暗黑、扁平、现代、萌系、绘画风和复古风格。
jeevanrushi07
OpenLLaMA 3B v2是一个基于Transformer架构的开源大语言模型,拥有30亿参数。该模型采用MIT许可证,主要用于英文文本生成任务,支持聊天机器人等多种应用场景。
TareksLab
这是一个使用Linear DELLA方法合并的70B参数大语言模型,基于Llama-3.1-Nemotron-lorablated-70B基础模型,整合了多个高性能的Llama-3.3-70B变体模型,旨在提供更强大的语言理解和生成能力。
cpatonn
GLM-4.5-Air-AWQ是基于GLM-4.5-Air基础模型的8位量化版本,专为智能代理设计,采用混合推理模式,支持复杂推理和即时响应,在MIT开源许可下发布。
unsloth
GLM-4.5是为智能代理设计的基础模型,统一了推理、编码和智能代理能力,总参数达3550亿,在12个行业标准基准评估中排名第3,得分63.2。采用MIT开源许可,可用于商业和二次开发。
mradermacher
这是FBogaerts/NextCoder-7B-Finetuned模型的静态量化版本,专门针对代码生成和文本生成任务进行了优化,提供了更高效的推理方案。该模型支持英文,采用MIT许可证发布。
GLM-4.5-Air-AWQ 是基于 zai-org/GLM-4.5-Air 基础模型进行4位AWQ量化的文本生成模型,专为智能代理应用设计,在推理、编码和智能代理能力方面表现优异,采用MIT开源许可证。
lmstudio-community
GLM-4.5-Air是zai-org开发的高效语言模型,经过MLX团队8位量化优化,专门针对苹果硅芯片进行了优化。该模型基于transformers架构,支持文本生成任务,采用MIT许可证发布。
mit-han-lab
经过Nunchaku量化处理的FLUX.1-Kontext-dev版本,能够根据文本指令编辑图像,优化推理效率的同时将性能损失降至最低。
基于Shuttle Jaguar的Nunchaku量化版本,旨在根据文本提示生成高质量图像,优化了高效推理并最小化性能损失。
FLUX.1-Fill-dev的Nunchaku量化版本,能够根据文本描述填充现有图像中的区域,经过量化处理实现高效推理。
Nunchaku量化的FLUX.1-schnell模型,用于根据文本提示生成高质量图像,经过优化以实现高效推理。
Nunchaku团队提供的FLUX.1-Depth-dev量化版本,能够根据文本描述生成图像并保持输入图像结构,优化了推理效率。
FLUX.1-Canny-dev的Nunchaku量化版本,能够根据文本描述生成图像,同时遵循给定输入图像的结构。
NICOPOI-9
基于nvidia/mit-b3微调的图像分割模型,在NICOPOI-9/morphpad_coord_hgo_512_4class_v2数据集上表现优异
基于NVIDIA MIT-B1架构的SegFormer图像分割模型,在特定数据集上微调,擅长高精度图像分割任务
基于nvidia/mit-b3微调的图像分割模型,在NICOPOI-9/morphpad_coord_hgo_512_4class数据集上训练,擅长高精度图像分割任务。
Mungert
GLM-Z1-32B-0414是一个32B参数规模的多语言文本生成模型,支持中文和英文,采用MIT许可证发布。
该项目是一个Vale-MCP协作开发项目,主要用于文本校验与写作辅助,采用MIT开源协议。
该项目包含模型上下文协议的规范及协议模式,提供TypeScript和JSON Schema两种格式定义,并开源贡献指南及MIT许可。
一个实现MCP协议的服务器项目,提供笔记存储和摘要生成功能
项目使用MIT开源许可证
MCP服务器用于访问MITRE ATTACK知识库
Firefox MCP Bridge是Claude网页应用的服务器端程序,为配套的Firefox扩展提供支持,采用MIT和Apache双协议许可。
该项目实现了一个与Miden开发者工具交互的MCP服务器,提供开发者文档搜索功能,基于MCP SDK构建,采用MIT许可。
MITRE ATT&CK MCP服务器是一个AI原生威胁情报工具,通过Model Context Protocol提供对MITRE ATT&CK框架的全面访问,包含200+技术、140+威胁组织、700+软件条目的查询能力,支持ATT&CK Navigator可视化层生成,专为安全团队和AI智能体设计。
该项目为MIT Hack去中心化AI峰会的练习项目,展示了如何在Windows上快速搭建Claude MCP协议服务。包含天气应用和SQLite数据库两个示例,分别演示了政府API数据获取和面包店库存管理功能。
一个名为Yusuke Wada开发的MCP服务器项目,使用Node.js运行游戏服务端,采用MIT许可证