2025年,超过150个匿名YouTube频道利用廉价AI工具制作大量反工党虚假视频,累计观看超12亿次。这些频道通过煽动性内容从英国政治分歧中获利,已积累530万订阅者,发布视频超5.6万个。其主要攻击目标为首相基尔・斯塔默,相关提及达1.56万次。
优必选科技与国内头部AI大模型公司签署超0.5亿元销售合同,将交付全球首款自主换电工业人形机器人Walker S2,年内完成。公司同时开放机器人数据接口,支持合作方将自有AI大模型与机器人本体深度集成,构建“具身智能+垂直模型+数据”闭环。目前产能已超300台/月,年内将分批交付。
《金融时报》分析显示,美国电网因科技巨头数据中心投资激增而承压。预计到2028年,AI数据中心新增电力需求达44吉瓦,但电网瓶颈仅能供应约25吉瓦,导致近19吉瓦缺口,占总需求40%。亚马逊、谷歌等超大规模企业面临电力供应挑战。
阿里云飞天实验室研发的“析言XiYan-SQL”数据分析智能体,在全球权威SQL诊断评测BIRD-CRITIC中登顶所有开放榜单,超越国内外顶尖团队,刷新行业纪录。该基准由学术界与Google Cloud合作推出,旨在测试大语言模型解决真实数据库应用问题的能力,聚焦企业常见数据库报错的诊断与修复。
用超300个AI演员,几分钟生成专业UGC视频和静态广告
Instories可轻松在数分钟内创建惊艳设计,有超300模板做动画故事。
提供超过 5000 本书籍的摘要与分析。
i10X AI内容创作工具可在几分钟内生成SEO优化的、超越竞争对手的文章。
Openai
$2.8
Input tokens/M
$11.2
Output tokens/M
1k
Context Length
$7.7
$30.8
200
Anthropic
$105
$525
$7
$35
$21
Google
$0.7
Alibaba
$1
$10
256
$3.9
$15.2
64
Bytedance
-
$0.8
$2
128
Baidu
32
Tencent
$0.35
400
Xai
$140
$280
$8.75
$70
lightx2v
本仓库包含为HunyuanVideo-1.5优化的4步蒸馏模型,能够在不使用CFG(无分类器指导)的情况下实现超快速的4步推理,显著减少生成时间,同时保持高质量的视频输出。
vafipas663
基于Qwen-Image-Edit-2509的图像超分辨率LoRA模型,专门用于提升低质量图像的分辨率和视觉效果。该模型在摄影风格的图像上表现出色,能够处理多种图像退化问题。
LeviDeHaan
SecInt是一个针对实时nginx安全日志分类进行微调的SmolLM2-360M模型,旨在自动检测Web服务器日志中的安全威胁、错误和正常流量模式,准确率超过99%,可在CPU上实现实时检测。
unsloth
Apertus是一款由瑞士AI开发的全开放多语言大语言模型,提供70亿和80亿两种参数规模。该模型支持超过1000种语言,使用完全合规且开放的训练数据,性能可与闭源模型相媲美。Apertus在15T标记上进行预训练,采用分阶段课程训练方法,支持长达65,536个标记的上下文长度。
lmms-lab
LLaVA-OneVision-1.5 是一系列完全开源的大型多模态模型,通过在原生分辨率图像上进行训练,以较低的成本实现了先进的性能。该模型在多个多模态基准测试中展现出卓越性能,超越了Qwen2.5-VL等竞争对手。
facebook
MapAnything是一个端到端训练的Transformer模型,能够以多种模态作为输入,直接回归场景的分解度量3D几何结构。该模型支持超过12种不同的3D重建任务,包括多图像SfM、多视图立体视觉、单目度量深度估计等。
tristan-deep
这是一个基于分数生成扩散模型的医学图像处理模型,专门针对心脏超声图像进行去雾处理。该模型在DehazeEcho2025数据集上训练,能够有效去除超声图像中的雾状干扰,提升图像清晰度。
DINOv3是Meta AI开发的一系列通用视觉基础模型,无需微调即可在广泛的视觉任务中超越专门的先进模型。该模型采用自监督学习方式,生成高质量的密集特征,在图像分类、分割、深度估计等多种任务中表现出色。
DINOv3是Meta AI开发的一系列通用视觉基础模型,无需微调就能在多种视觉任务中超越专门的先进模型。该模型采用Vision Transformer架构,在16.89亿张网络图像上预训练,能生成高质量的密集特征,在图像分类、分割、检索等任务中表现出色。
internlm
Intern-S1是目前最先进的开源多模态推理模型,结合了强大的通用任务处理能力和在广泛科学任务中的卓越性能,可与领先的闭源商业模型相媲美。该模型在5T token数据集上进行持续预训练,其中超过50%是专业科学数据,具备动态分词器能够原生理解分子式、蛋白质序列和地震信号。
atalaydenknalbant
YOLOv13是一种准确且轻量级的目标检测器,提出了基于超图的自适应相关性增强机制、全流程聚合与分布范式,并利用深度可分离卷积替换普通大核卷积,有效提升了复杂场景下的检测性能,在MS COCO基准测试中实现了最先进的性能。
Lightricks
基于扩散模型的视频空间分辨率增强工具,专门针对LTX视频模型生成的潜在视频表示进行超分辨率训练
boltuix
专为边缘与物联网设备优化的超轻量级自然语言处理模型,量化后仅约15MB大小,支持掩码语言建模、意图检测、文本分类和命名实体识别。
saurabhati
首个超越基于Transformer的音频分类器的状态空间模型,在AudioSet音频分类任务中实现最先进性能,同时显著减小模型规模。
XiangZ
HiT-SR是一种提升基于变换器的超分辨率方法的通用策略,通过改进现有模型结构,在降低计算负担的同时实现更优的超分辨率性能。
UW
110亿参数大语言模型,采用创新的SuperBPE分词器训练,支持超词单元识别和子词分词能力。
80亿参数模型,采用创新的SuperBPE分词器,结合子词和超词标记,推理效率比传统BPE模型高30%。
kcccat
多语言E5大型指令模型,支持超过100种语言的文本嵌入和分类任务
jfkback
Hypencoder是一种用于信息检索的超网络模型,包含文本编码器和Hypencoder两部分,能够将文本转换为小型神经网络并输出相关性分数。
Hypencoder是一种用于信息检索的双编码器模型,包含文本编码器和超网络(Hypencoder),能够将文本转换为小型神经网络用于计算相关性分数。
CryptoAnalysisMCP是一个基于Swift构建的加密货币技术分析工具,提供实时价格数据、技术指标、图表模式识别和交易信号。最新版本v1.1通过DexPaprika集成支持超过700万种代币,无需API密钥即可获取基础价格数据。
一个结合Claude Code和Google Gemini AI的MCP服务器,通过多模型协作实现深度代码分析,Claude擅长本地上下文操作和CLI工作流,Gemini则利用其超大上下文窗口进行分布式系统调试和长轨迹分析。
MCP Analyst是一个MCP服务器,支持Claude分析本地的CSV或Parquet文件,适用于处理超出上下文窗口限制的大型数据集或需要优化成本的场景。
非官方的PubChem MCP服务器,提供超过1.1亿种化学化合物的全面访问,包括分子特性、生物测定数据和化学信息学工具。
非官方的PubChem MCP服务器,提供超过1.1亿种化合物的全面访问,包括分子属性、生物测定数据和化学信息学工具。
Optuna MCP Server是一个基于Model Context Protocol (MCP)的服务,利用Optuna自动化优化和分析过程。它支持多种应用场景,如LLM自动超参数优化、通过聊天界面交互分析优化结果以及优化其他MCP工具的输入输出。
这是一个基于Runway API的MCP服务器项目,允许用户通过Claude Desktop调用Runway的各种AI生成功能,包括视频生成、图像生成、视频编辑和超分辨率等工具。
一个提供食品价格和营养信息搜索功能的MCP服务器,支持跨超市比价和营养分析