英特尔孵化的AI企业Articul8在2024年初成立后迅速崛起,近日宣布其7000万美元B轮融资已完成过半,投前估值达5亿美元,较A轮后1亿美元估值增长五倍。本轮融资由Adara Ventures领投,Aditya Birla Ventures等跟投,凸显市场对垂直领域、可控可审计企业级AI解决方案的青睐。
阿里通义Qwen团队推出Soft Adaptive Policy Optimization(SAPO),旨在解决大语言模型强化学习中策略优化不稳定的问题。相比传统硬剪切方法,SAPO通过自适应调整更新幅度,避免过于严格限制,提升训练稳定性和效率。
腾讯发布AI程序员Ada技术预览版,能一键将用户需求转化为完整代码,自动生成文档和测试用例,并支持多语言项目协作,显著提升开发效率,简化工作流程。
OpenAI被曝要求获取16岁自杀少年Adam Raine追悼会人员名单,遭家属律师谴责为“故意骚扰”。Raine家族近日更新对OpenAI的非正常死亡诉讼,指控其ChatGPT与死者长时间对话后导致自杀,并揭露该公司为竞争“缩短安全测试”流程。诉讼暗示可能传唤逝者亲友。
一个实时适应未见任务的自适应大型语言模型框架。
无需训练的迭代框架,用于长篇故事可视化
多视图一致性图像生成的便捷解决方案
基于FLUX.1-dev模型的IP-Adapter,实现图像工作如文本般灵活。
AiAF
D-ART - LoRA - Z-Image-Turbo 是一个基于 Tongyi-MAI/Z-Image-Turbo 基础模型的图像生成模型。它是一个LoRA(Low-Rank Adaptation)适配器,旨在为生成图像注入特定的“D-ART”艺术风格。该风格以生成自信、充满活力的年轻女性角色插画为特点,尤其强调角色的曲线和动态姿态。用户通过使用特定的触发词即可激活该风格,生成具有统一美学特征的多样化图像。
mratsim
GLM-4.5-Iceblink-v2-106B-A12B-FP8是基于GLM-4.5-Iceblink-v2-106B-A12B模型,采用最先进的混合专家量化方法进行FP8量化的版本。该模型专门针对支持硬件FP8的Ada、Hopper或Blackwell系列GPU优化,在保持高质量输出的同时显著提升推理效率。
lichorosario
这是一个基于Qwen-Image模型训练的LoRA(Low-Rank Adaptation)模型,专门用于文本到图像的生成任务。该项目使用AI Toolkit训练,能够将文本描述转化为高质量的图像,支持在多种图像生成工具中使用。
trinty2535425
这是一个基于Qwen/Qwen-Image基础模型训练的图像到视频LoRA模型,采用LoRA(Low-Rank Adaptation)技术实现高效微调,可用于AI图像生成等相关任务
adaptive-classifier
自适应分类器是一个支持持续学习和动态添加类别的文本分类模型,基于ModernBERT-base架构构建,能够在不重新训练的情况下适应新的类别和示例。
自适应分类器是一个支持持续学习和动态添加类别的文本分类模型,基于ModernBERT-base构建,能够在不重新训练的情况下适应新的类别和数据。
自适应分类器是一个支持持续学习和动态添加类别的文本分类模型,基于ModernBERT-base架构构建,能够不断更新模型以适应新数据,灵活应对不同的分类需求。
adamo1139
DeepSeek-R1-0528 671B模型的4位AWQ量化版本,适合在高端GPU节点上使用
NAMAA-Space
Adasah是基于Qwen 2.5 3B模型的微调版本,专为阿拉伯语视觉理解场景优化,支持阿拉伯语视觉问答与图片内容理解。
AdamLucek
基于Wan2.1-T2V-14B文本转视频模型的LoRA适配器,专门用于生成古书插画风格的视频内容
支持持续学习和动态类别扩展的文本分类模型
基于ModernBERT微调的法律领域句子嵌入模型,支持多层次维度输出,适用于法律文本相似度计算和信息检索任务。
AdamCodd
基于YOLO架构的轻量化人脸检测模型,专为高效人脸检测设计,在WIDERFACE数据集上训练。
该模型是基于ModernBERT-large微调的LLM路由分类器,用于区分复杂查询(使用大语言模型)和简单查询(使用小语言模型)。
基于多模态扩散变换器(MMDiT)的文本到图像模型,采用对抗扩散蒸馏(ADD)技术,优化了图像质量、排版和复杂提示理解,同时减少推理步骤。
基于多模态扩散变换器(MMDiT)的高级文生图模型,在图像质量、文字排版和提示词理解方面有显著提升
基于AdamLucek/koch_block数据集训练的动作分块变换器(ACT)模型,适用于Koch v1.1低成本机器人
atomic-canyon
fermi-bert-1024是一款专门针对核能领域优化的BERT预训练模型。该模型在维基百科、Books3和美国核管理委员会ADAMS数据库数据上训练,特别优化了核能行业的技术术语和监管语言处理能力。在橡树岭国家实验室的Frontier超级计算机上使用128个AMD MI250X GPU训练10小时,为核能应用提供坚实基础。
adamdad
KAT是一种采用分组有理科尔莫戈罗夫-阿诺德网络(GR-KAN)替代传统Transformer中通道混合器的新型视觉模型,在ImageNet-1k数据集上训练。
adarksky
基于PyTorch和Diffusers库的宝可梦图像生成模型,使用去噪扩散概率模型(DDPM)架构
dap-mcp是一个基于MCP协议的DAP会话管理工具,旨在优化和扩展大型语言模型的上下文窗口,提升调试工作流。
Higress OPS MCP Server是一个基于Model Context Protocol(MCP)的服务实现,用于配置和管理Higress网关。该项目还提供了一个基于LangGraph和LangChain MCP Adapters的MCP客户端,通过代理流架构与Higress MCP Server交互。
Adaptive Graph of Thoughts是一个基于Neo4j图数据库的智能科学推理框架,通过图结构实现复杂的科学推理任务,支持与Claude Desktop等AI应用集成。
一个用于与MediaWiki和WikiBase API交互的自定义MCP适配器,支持获取和编辑MediaWiki页面内容。
Adaptive MCP Server是一个先进的AI推理系统,通过多策略推理、实时研究和综合验证,为复杂问题提供智能解决方案。
一个实现Model Context Protocol标准的模块化服务器,提供GitHub、GitLab、Google Maps、内存存储和Puppeteer网页自动化等多种工具集成。
MCP代理服务器是一个聚合多个MCP资源服务器的中心枢纽,提供统一接口管理资源、工具和提示请求。
Adamik MCP Server是一个多链区块链交互服务器,通过Claude Desktop提供60+条区块链的读写操作,支持交易管理、账户查询、质押和代币交互等功能。
Adamik MCP Server是一个支持60多条区块链网络的集成服务,通过Claude Desktop提供统一的读写接口,实现跨链交易管理、账户查询、质押和代币交互等功能。
MCP Agent Tool Adapter是一个通过MCP协议实现模块化工具调用的项目,支持Google ADK和LangGraph两种代理动态推理工具。
Adamik MCP Server是一个多链交互服务器,通过Claude Desktop提供60+区块链网络的读写操作,支持交易管理、账户查询、质押和代币交互等功能。