建筑业正从数字化转型的“慢热者”转变为AI应用的热点。面对成本超支、项目延期和劳动力短缺等挑战,行业正从“经验驱动”转向“数据驱动”。据预测,全球建筑业AI市场规模将从2026年的62亿美元猛增至2033年的320亿美元,年复合增长率高达26.4%,迎来爆发式增长。
埃隆·马斯克旗下SpaceX、xAI与特斯拉正探讨合并可能,旨在整合太空、人工智能与自动驾驶资源,构建“超级实体”。目前讨论聚焦于SpaceX与特斯拉的合并路径。
人工智能公司Anthropic遭音乐出版商联盟起诉,被指控大规模非法使用受版权保护的音乐作品进行AI训练,其商业模型被指建立在“盗版”基础上。
中国科技新闻学会发布2025年度“十大科技热词”,评选经大数据筛选、征集和专家评审。人工智能领域表现突出,“智能体”“具身智能”和“AI治理”入选,成为年度重要科技风向标。
CiteTrue是免费引用校验工具,用AI验证引用,确保学术引用真实准确。
Nutgrafe用AI将新闻文章总结成短段落,提供事实无偏见内容。
SongMakerAI可将文本提示转化为含旋律、乐器和人声的完整歌曲。
由中国电信人工智能研究院研发的语言模型。
Openai
$14
Input tokens/M
$56
Output tokens/M
200
Context Length
Clemylia
Gheya-1是LES-IA-ETOILES生态系统中的新一代基础语言模型,拥有2.02亿参数,是旧版Small-lamina系列的升级版本。该模型专为专业微调而设计,在人工智能、专业语言模型和生物学领域具有针对性训练。
prithivMLmods
Olmo-3-Think是艾伦人工智能研究所推出的完全开源的语言模型系列,包含7B和32B两种规模。该模型经过专门训练,能够展现明确的推理链,支持透明的逐步推理和可检查的中间思维痕迹,在推理、数学和代码任务中表现出色。
fibonacciai
RealRobot_chatbot_llm是基于Gemma3n架构的专业产品人工智能模型,专门在RealRobot产品目录的专有数据集上进行了微调。该模型能够根据企业自身的产品数据,快速创建准确、经济高效且可部署的专业语言模型,提供高度专业化的产品问答服务。
BAAI
Emu3.5是北京智源人工智能研究院开发的原生多模态模型,能够跨视觉和语言联合预测下一状态,实现连贯的世界建模和生成。通过端到端预训练和大规模强化学习后训练,在多模态任务中展现出卓越性能。
Emu3.5是由北京智源人工智能研究院(BAAI)开发的原生多模态模型,能够跨视觉和语言联合预测下一状态,实现连贯的世界建模与生成,在多模态任务中表现卓越。
nineninesix
KaniTTS是一款专为实时对话式人工智能应用优化的高速、高保真阿拉伯语文本转语音模型。它采用两阶段流水线架构,结合大语言模型与高效音频编解码器,实现卓越的速度和音频质量,能够满足对话式AI、无障碍辅助、研究等多领域的语音合成需求。
KaniTTS Pretrain v0.3是一款高速、高保真的文本转语音模型,专为实时对话式人工智能应用优化,采用两阶段管道架构,结合大语言模型和高效音频编解码器,实现极低延迟和高品质语音合成。
DragonLLM
LLM Pro Finance是一款专为金融和经济专业人士设计的多语言人工智能模型,基于大量高质量的金融和经济数据训练,能够针对复杂的金融问题生成准确且贴合上下文的回应。
Tesslate
WEBGEN DEVSTRAL IMAGES 是一个专注于网页生成的人工智能模型,能够利用 HTML、CSS、JS 和 Tailwind 技术生成单页式网页。该项目基于自定义模板进行训练,采用监督微调方法,使用 GPT-OSS-120B 生成的数据集进行训练。
KaniTTS是一款高速、高保真的文本转语音模型,专为实时对话式人工智能应用而优化。该模型采用两阶段处理流程,结合大语言模型和高效音频编解码器,在Nvidia RTX 5080上生成15秒音频的延迟仅需约1秒,MOS自然度评分达4.3/5,支持英语、中文、日语等多种语言。
mlx-community
这是一个基于MLX框架的4位量化大语言模型,由瑞士人工智能研究所开发,支持多语言文本生成任务,采用Apache-2.0许可证发布。
Quatfit
Isha-1B-preview是一个拥有10亿参数的对话式人工智能模型,模拟名为Isha Verma的青少年形象,能够生成高度拟人、随意且略带羞涩的对话回复,包含内部思考过程。
allenai
MolmoAct是由艾伦人工智能研究所开发的开源机器人操作动作推理模型,基于Qwen2.5-7B和SigLip2视觉骨干网络构建,专门针对家庭和桌面环境中的单臂Franka机器人操作任务进行优化。
MolmoAct是由艾伦人工智能研究所开发的全开源机器人操作动作推理模型,基于Qwen2.5-7B和SigLip2视觉骨干网络构建,专门用于家庭和桌面环境中的机器人操作任务。
MolmoAct是由艾伦人工智能研究所开发的开源动作推理模型,专门用于机器人操作任务。该模型基于Qwen2.5-7B和SigLip2构建,在家庭和桌面环境中的93种操作任务上训练,具有领先的视觉-语言-动作处理能力。
MolmoAct是由艾伦人工智能研究所开发的开源动作推理模型,专门用于机器人操作任务。该模型基于Qwen2.5-7B和SigLip2视觉骨干网络,在家庭和桌面环境中的93种独特操作任务上训练,具有领先的视觉-语言-动作推理性能。
基于Qwen3架构构建的专业模型,专注于科学、人工智能设计和通用推理领域。该模型在高难度科学推理数据集上进行了微调,具备出色的通用和创造性推理能力,体积小巧适合本地设备和服务器部署。
Phonepadith
这是一个专门针对老挝语优化的摘要生成模型,基于Google Gemma-3-4B-Instruct模型微调,使用超过5000个高质量老挝语输入-输出对进行训练,主要聚焦人工智能与数字内容(AIDC)主题。
menzo-ai
这是一款基于LLaMA-3-8B微调的对话式人工智能模型,专门为心理健康指导提供富有同理心、无偏见的支持。模型使用精心策划的心理健康数据集进行微调,能够提供体贴、支持性的回复,模拟治疗式对话。
stanfordmimi
MedVAL-4B是一个经过微调的语言模型,能够以接近医生级别的可靠性评估人工智能生成的医学文本输出。它是一个自监督框架,利用合成数据训练评估器大语言模型,无需医生标签或参考输出即可评估大语言模型生成的医学输出与输入之间的事实一致性。
Essential MCP是一个革命性的人工智能与人类交互协议,通过上下文管理系统、工具集合和测试框架,实现更强大、更智能的协作体验。项目包含SSH服务器、Python API工具中心、统一上下文系统等核心组件,采用现代技术栈构建,并受到猫王创新精神的启发。
Apktool MCP Server是一个基于Model Context Protocol的Android APK分析服务,集成了Apktool工具和Gemini CLI人工智能,提供APK反编译、安全分析、隐私审计和逆向工程指导功能。
基于人工智能的号卡查询工具,通过自然语言理解用户需求,自动查询172号卡平台数据并智能推荐最符合需求的套餐,显著减少用户选择时间。
神经儿童发展系统是一个突破性的人工智能框架,通过模拟人类心理发展阶段(包括认知、情感和社交成长)来重构神经网络的学习方式。该系统整合了发展心理学理论(如皮亚杰认知发展阶段、依恋理论)和神经科学原理,构建了包含感知处理、情感调节、记忆系统和心理组件的复杂架构,旨在创建具有真实情感智能和自然发展能力的AI。
该项目是一个命令行接口(CLI)工具,整合了Arcee AI、TESS和MCP服务,采用Clean Architecture和DDD设计原则,提供统一访问多个人工智能服务的抽象层。
该项目基于Nasdanika能力构建人工智能系统,专注于在资源集合(互连模型)上操作,通过“叙述者”处理器多角度描述模型元素及其关系,并利用嵌入和向量存储实现语义搜索和RAG(检索增强生成),同时支持OpenAI和Ollama的聊天完成功能。