SciencePedia以“深度理解”为核心,联合顶尖机构打造智能知识平台,突破传统百科的词条罗列局限,致力于揭示科学知识的逻辑脉络与演化历程,帮助学习者系统掌握科学思维,实现从孤立知识点到连贯认知的范式变革。
OpenAI CEO萨姆・奥特曼在直播中透露,公司深度学习技术进展迅速。预计2026年9月实现"实习级别研究助理",2028年前开发出完全自动化的"合法AI研究员"。这意味着AI将能自主完成大型研究项目,不再仅是辅助工具。
微软研究院推出深度学习交换-关联泛函Skala,显著提升Kohn-Sham密度泛函理论计算效率。该模型通过模拟非局部效应,在保持与meta-GGA相当速度的同时,达到混合泛函精度水平。测试显示:W4-17分子体系原子化能量评估平均绝对误差仅1.06kcal/mol,单参考子集误差更降至0.85kcal/mol,GMTKN55基准测试表现优异。
DeepMind推出新型机器人AI模型,具备卓越洗衣物分类能力,显著提升通用机器推理水平,推动机器人日常应用。该模型利用深度学习与视觉识别技术,可高效辨别衣物颜色、材质及款式等特征,旨在解决家庭洗衣分类耗时问题,提升生活便利性。
全球首个由深度学习驱动的在线 OCR 工具,97% 准确率。
全球顶尖无限AI聊天一站式超级AI智能体
优秀的图像生成与编辑模型,展示 AI 艺术的新可能。
将文本或图像转换为具有声音的Veo3 AI影片
Mitchins
这是一个基于EfficientNet-B0架构的深度学习模型,专门用于对动漫和视觉小说图像进行艺术风格分类。模型能够准确识别6种不同的动漫艺术风格,包括暗黑、扁平、现代、萌系、绘画风和复古风格。
PokeeAI
PokeeResearch-7B是由Pokee AI开发的70亿参数深度研究智能体,结合基于AI反馈的强化学习(RLAIF)与推理框架,能够执行复杂的多步骤研究工作流程,包括自我修正、验证和综合分析。
maomao0819
BEVANet是一个专为实时语义分割设计的深度学习模型,在Cityscapes等数据集上表现出色,在RTX3090上实现了81.0%的mIoU和32.8FPS的优异性能,平衡了精度与速度的需求。
EpistemeAI
本模型基于GPT-OSS-20B,借助Unsloth强化学习框架进行微调,旨在优化推理效率,同时减少在从人类反馈中进行强化学习(RLHF)式训练期间出现的漏洞。微调过程着重于对齐的鲁棒性和效率,确保模型在不产生过多计算开销的情况下保持推理深度。
WeightedAI
波斯语OCR是一个专门针对波斯语文本设计的光学字符识别深度学习模型,采用CNN+变压器架构,在包含60万张合成波斯语文本图像的数据集上训练,序列准确率达到96%。
facebook
DINOv3是Meta AI开发的一系列通用视觉基础模型,无需微调即可在广泛的视觉任务中超越专门的先进模型。该模型采用自监督学习方式,生成高质量的密集特征,在图像分类、分割、深度估计等多种任务中表现出色。
valentinocc
基于MobileNetV2架构的深度学习模型,专门用于识别和分类120种不同犬种。通过迁移学习技术微调,能够准确识别各类犬种并提供置信度评分。
Acly
BiRefNet是一个用于二分类图像分割的深度学习模型,专门用于背景去除任务。该模型经过GGUF格式转换,可在消费级硬件上通过vision.cpp进行轻量级推理,实现高效的图像分割处理。
minpeter
这是一个发布在Hugging Face Hub上的Transformers模型,具体信息需要从模型页面获取。该模型基于先进的深度学习架构,适用于各种自然语言处理任务。
EleutherAI
深度无知模型套件是一个包含18个69亿参数的大语言模型集合,旨在研究通过过滤预训练数据来防止模型学习不安全技术能力(如CBRN相关能力)的方法。该套件展示了过滤数据可以有效避免不良知识学习,同时保持通用性能并具备抗篡改能力。
SAP
ConTextTab是一个深度学习模型,结合了语义理解和上下文学习,专门处理表格数据。它通过专门的嵌入方法处理不同数据模态,在大规模真实世界表格数据上训练,在多个基准测试中表现出色,特别是在语义丰富的CARTE基准测试中树立了新标准。
PaddlePaddle
SLANeXt_wired 是一个用于表格结构识别的深度学习模型,能够将不可编辑的表格图像转换为可编辑的表格格式(如 HTML)。
salihfurkaan
VoxPolska Auralis是一款先进的波兰语文本转语音(TTS)模型,采用前沿深度学习技术,能够精准捕捉波兰语的细微差别和语调,将书面文本转化为自然、流畅且富有表现力的语音。
Graphlet-AI
基于表示学习的深度模糊匹配系统,专为跨语言人名和公司名实体解析设计
honestlyanubhav
一个基于Unity ML-Agents训练的深度强化学习智能体,专门用于双人足球游戏场景。
nvidia
基于深度学习的数学问题自动求解系统,支持代数、几何、微积分等多种数学题型
kvuong2711
AerialMegaDepth是一个专注于空地重建与视角合成的深度学习模型,能够从航拍图像中重建3D场景并生成新视角。
ayjays132
情感宇宙-2是一个基于BERT的多任务学习模型,专注于情感分析和情绪识别,融合心理学理论和深度学习技术。
zai-org
GLM-4-Z1-32B-0414是GLM家族新一代开源大语言模型,拥有320亿参数,具备深度思考能力。通过冷启动和扩展强化学习训练,在数学、代码和逻辑任务上表现优异,支持便捷的本地部署。
histai
SPIDER-乳腺模型是一个专为乳腺病理切片分类设计的深度学习模型,属于SPIDER数据集计划的一部分。
基于Ultralytics和MCP协议实现的计算机视觉服务器,支持目标检测、图像分割和姿态估计等功能
一个轻量级服务器,通过简单API暴露Mac系统信息,帮助AI助手获取实时硬件和系统数据,主要用于Mac用户的AI和深度学习实验。
MCP翻译服务器是一个专注于满汉双向翻译的高性能系统,集成了先进的形态分析和深度学习技术,提供全面的低资源语言翻译解决方案。
MCP Serve是一个强大的深度学习模型服务器工具,支持通过Shell执行、Ngrok连接或Docker容器部署,集成多种先进AI技术。
该项目是关于自动化医疗编码的研究,提供了在MIMIC-III和MIMIC-IV数据集上训练和评估医疗编码模型的代码,包括多种模型的实现和新数据集的划分。