在2025年GTC大会上,NVIDIA推出“Omniverse DSX Blueprint”设计方案,专为吉瓦级AI数据中心打造,被称为“AI工厂”。该方案基于Omniverse框架,支持从1亿瓦到10亿瓦不同规模,旨在高效训练和运行大型AI模型,满足日益增长的AI计算需求,是人工智能基础设施的重要进展。
美国政府计划与韩国签署新协议,加强在人工智能、量子计算和6G通信技术领域的合作。协议预计在特朗普亚洲行期间签署,由白宫科技政策办公室主任代表美方执行。内容包括强化AI技术出口管制,并减轻科技企业的监管负担。
OpenAI CEO宣布将投入1.4万亿美元建设AI基础设施,相当于30吉瓦数据中心容量。公司计划每年支出1万亿美元支持人工智能产能扩张,涉及芯片、数据中心及融资合作。
人工智能初创公司Mercor完成3.5亿美元融资,由Felicis领投,Benchmark等跟投。该公司由三位蒂尔研究员创立,业务重心从招聘决策转向为AI模型训练招募高技能人才。
Perplexity AI需验证用户连接安全,完成操作后可继续使用。
Vibe Coding结合氛围感与AI辅助,助初学者轻松掌握编程技能。
免费在线线稿生成器,支持图像、文本转线稿,8种艺术风格
从人类文档在数分钟内生成工程师可用的API,无需数月时间。
xai
$2.16
Input tokens/M
$3.6
Output tokens/M
1M
Context Length
alibaba
-
131.1k
openai
$18
$72
128k
$1.08
$1.44
32.8k
$4.32
anthropic
$108
$540
200k
$21.6
$1.8
$9
Tesslate
WEBGEN DEVSTRAL IMAGES 是一个专注于网页生成的人工智能模型,能够利用 HTML、CSS、JS 和 Tailwind 技术生成单页式网页。该项目基于自定义模板进行训练,采用监督微调方法,使用 GPT-OSS-120B 生成的数据集进行训练。
nineninesix
KaniTTS是一款高速、高保真的文本转语音模型,专为实时对话式人工智能应用而优化。该模型采用两阶段处理流程,结合大语言模型和高效音频编解码器,在Nvidia RTX 5080上生成15秒音频的延迟仅需约1秒,MOS自然度评分达4.3/5,支持英语、中文、日语等多种语言。
mlx-community
这是一个基于MLX框架的4位量化大语言模型,由瑞士人工智能研究所开发,支持多语言文本生成任务,采用Apache-2.0许可证发布。
Quatfit
Isha-1B-preview是一个拥有10亿参数的对话式人工智能模型,模拟名为Isha Verma的青少年形象,能够生成高度拟人、随意且略带羞涩的对话回复,包含内部思考过程。
allenai
MolmoAct是由艾伦人工智能研究所开发的开源机器人操作动作推理模型,基于Qwen2.5-7B和SigLip2视觉骨干网络构建,专门针对家庭和桌面环境中的单臂Franka机器人操作任务进行优化。
MolmoAct是由艾伦人工智能研究所开发的全开源机器人操作动作推理模型,基于Qwen2.5-7B和SigLip2视觉骨干网络构建,专门用于家庭和桌面环境中的机器人操作任务。
MolmoAct是由艾伦人工智能研究所开发的开源动作推理模型,专门用于机器人操作任务。该模型基于Qwen2.5-7B和SigLip2构建,在家庭和桌面环境中的93种操作任务上训练,具有领先的视觉-语言-动作处理能力。
MolmoAct是由艾伦人工智能研究所开发的开源动作推理模型,专门用于机器人操作任务。该模型基于Qwen2.5-7B和SigLip2视觉骨干网络,在家庭和桌面环境中的93种独特操作任务上训练,具有领先的视觉-语言-动作推理性能。
prithivMLmods
基于Qwen3架构构建的专业模型,专注于科学、人工智能设计和通用推理领域。该模型在高难度科学推理数据集上进行了微调,具备出色的通用和创造性推理能力,体积小巧适合本地设备和服务器部署。
Phonepadith
这是一个专门针对老挝语优化的摘要生成模型,基于Google Gemma-3-4B-Instruct模型微调,使用超过5000个高质量老挝语输入-输出对进行训练,主要聚焦人工智能与数字内容(AIDC)主题。
menzo-ai
这是一款基于LLaMA-3-8B微调的对话式人工智能模型,专门为心理健康指导提供富有同理心、无偏见的支持。模型使用精心策划的心理健康数据集进行微调,能够提供体贴、支持性的回复,模拟治疗式对话。
stanfordmimi
MedVAL-4B是一个经过微调的语言模型,能够以接近医生级别的可靠性评估人工智能生成的医学文本输出。它是一个自监督框架,利用合成数据训练评估器大语言模型,无需医生标签或参考输出即可评估大语言模型生成的医学输出与输入之间的事实一致性。
aisingapore
WangchanLION-v3-IT是由VISTEC和新加坡人工智能公司联合开发的多语言大语言模型,专门针对泰语进行指令调优。该模型基于Llama3架构,使用约376万个泰语指令-完成对进行微调,支持英语和泰语处理。
Llama-3.1-8B-Instruct-RM-RB2是Allen人工智能研究所发布的奖励模型之一,基于Llama-3.1-8B-Instruct微调,用于评估和优化生成模型的偏好学习。
Llama-3.1-70B-Instruct-RM-RB2是艾伦人工智能研究所发布的7组奖励模型之一,用于开发基准测试并与下游PPO/Best-of-N性能关联分析。
mradermacher
DrMedra4B是一个专注于医学领域的量化模型,支持英语和罗马尼亚语,适用于医疗人工智能、临床推理、摘要生成和诊断等任务。
Fastweb
FastwebMIIA是由Fastweb开发的70亿参数意大利人工智能模型,专为意大利语和英语设计,支持长文档处理。
Medra27B 的量化版本,提供多种量化类型,适用于文本生成、医疗人工智能等多个领域。
unsloth
Cosmos-Reason1是NVIDIA开发的物理人工智能模型,具备理解物理常识的能力,能通过长链思维推理生成具身决策。该模型支持多模态输入(文本+视频/图像),输出为文本,适用于机器人、自动驾驶等物理AI领域。
Medra是一个基于医疗领域的问答和摘要生成模型,支持英语和罗马尼亚语,适用于医疗人工智能应用。
Essential MCP是一个革命性的人工智能与人类交互协议,通过上下文管理系统、工具集合和测试框架,实现更强大、更智能的协作体验。项目包含SSH服务器、Python API工具中心、统一上下文系统等核心组件,采用现代技术栈构建,并受到猫王创新精神的启发。
Apktool MCP Server是一个基于Model Context Protocol的Android APK分析服务,集成了Apktool工具和Gemini CLI人工智能,提供APK反编译、安全分析、隐私审计和逆向工程指导功能。
神经儿童发展系统是一个突破性的人工智能框架,通过模拟人类心理发展阶段(包括认知、情感和社交成长)来重构神经网络的学习方式。该系统整合了发展心理学理论(如皮亚杰认知发展阶段、依恋理论)和神经科学原理,构建了包含感知处理、情感调节、记忆系统和心理组件的复杂架构,旨在创建具有真实情感智能和自然发展能力的AI。
该项目是一个命令行接口(CLI)工具,整合了Arcee AI、TESS和MCP服务,采用Clean Architecture和DDD设计原则,提供统一访问多个人工智能服务的抽象层。
该项目基于Nasdanika能力构建人工智能系统,专注于在资源集合(互连模型)上操作,通过“叙述者”处理器多角度描述模型元素及其关系,并利用嵌入和向量存储实现语义搜索和RAG(检索增强生成),同时支持OpenAI和Ollama的聊天完成功能。