斯坦福教授Stefano Ermon创立的AI初创公司Inception完成5000万美元种子轮融资,获Menlo Ventures领投,微软、英伟达等巨头跟投,吴恩达等AI大咖天使投资。公司以颠覆性架构突破当前自回归模型竞争格局,引发行业关注。
荷兰企业家尼尔斯·霍文推出全AI插画儿童字母书,近千幅插图均由人工智能生成。作者坦言若由人工绘制,需耗资5万美元、每图两小时,成本高昂难以实现。借助生成式AI技术,该书得以低价出版,但亦引发行业成本与创作伦理的讨论。
Meta旗下AI短视频产品Vibes正式登陆欧洲市场。该产品集成于Meta AI应用,所有视频均由AI生成,用户可通过文字提示创作或“Remix”他人作品,添加音乐、调整风格后一键分享至多个社交平台。Meta旨在打造社交化、协作式的AI创作体验,推动AI驱动的内容生态发展。
谷歌地图将整合生成式AI助手Gemini,用户可通过语音指令快速搜索目的地,提升导航便捷性。该功能未来几周将逐步覆盖支持Gemini的安卓和iOS设备。
一站式AI图像平台,可在线生成、编辑、增强和转换图像。
LLM Pulse是您在生成式AI世界中的雷达。跟踪您的关键提示,了解AI来源如何引用您的品牌。
Matrix Game 2提供实时交互式世界生成。
通过文本提示生成交互式AI世界。
anthropic
$108
Input tokens/M
$540
Output tokens/M
200k
Context Length
vanta-research
Scout是VANTA Research基于Google Gemma 3 4B Instruct架构微调的专业语言模型,在约束感知推理和自适应问题解决方面表现出色,擅长侦察式情报收集、系统问题分解和自适应解决方案生成。
Tesslate
WEBGEN DEVSTRAL IMAGES 是一个专注于网页生成的人工智能模型,能够利用 HTML、CSS、JS 和 Tailwind 技术生成单页式网页。该项目基于自定义模板进行训练,采用监督微调方法,使用 GPT-OSS-120B 生成的数据集进行训练。
nineninesix
KaniTTS是一款高速、高保真的文本转语音模型,专为实时对话式人工智能应用而优化。该模型采用两阶段处理流程,结合大语言模型和高效音频编解码器,在Nvidia RTX 5080上生成15秒音频的延迟仅需约1秒,MOS自然度评分达4.3/5,支持英语、中文、日语等多种语言。
ibm-granite
Granite-4.0-Micro-Base是IBM开发的仅解码器长上下文语言模型,基于约15万亿标记从头训练,采用四阶段训练策略。该模型专为各类文本生成任务设计,支持多语言和填空式代码补全功能。
BBQGOD
DeepSeek-GRM-16B 是一个基于 Self-Principled Critique Tuning (SPCT) 的生成式奖励模型,能为查询-响应生成透明的'原则→批判→分数'评估流程,可用于大语言模型的强化学习、评估和数据收集等任务。
ducklingcodehouse
这是一个专注于芬兰语牙科医学的对话式AI助手,经过LoRA微调的大语言模型,能够针对牙科咨询问题生成结构化的临床回复,分为背景、评估和建议三个部分。
Quatfit
Isha-1B-preview是一个拥有10亿参数的对话式人工智能模型,模拟名为Isha Verma的青少年形象,能够生成高度拟人、随意且略带羞涩的对话回复,包含内部思考过程。
iCIIT
RedQueen Llama 3.2 3B是专为僧伽罗语设计的生成式问答模型,采用两阶段微调过程,先进行语言基础构建,再进行问答任务适应。该模型在僧伽罗语语言理解和问答生成任务上表现出色,具有30亿参数。
deepcogito
Cogito v2是经过指令微调的生成式混合推理模型,采用迭代蒸馏与放大训练方法,在编码、STEM、指令遵循等方面表现出色,支持超30种语言和128k上下文长度。
sudeshmu
基于LLaMA架构并采用MoR(混合递归)技术的3.6亿参数语言模型,在FineWeb-Edu去重数据集上微调,通过动态路由机制和递归式KV缓存实现高效的文本生成能力。
Cogito v2是经过指令调优的生成式大语言模型,采用混合专家架构,具有1090亿参数。该模型支持多语言处理、长上下文推理,在编码、STEM等领域表现出色,支持商业用途。
Cogito v2是基于指令调优的生成式大语言模型,具备混合推理能力,支持128k上下文长度和多语言处理。该模型采用迭代蒸馏与放大(IDA)训练策略,在编码、STEM、指令遵循等任务上表现优异。
Cogito v2是基于Llama-3.1-70B的指令调优生成式模型,具备混合推理能力,支持多语言和长上下文,在编码、STEM等领域表现出色。采用迭代蒸馏与放大训练策略,可用于商业用途。
NoemaResearch
Nous-V1 8B是由Apexion AI开发的80亿参数语言模型,基于Qwen3-8B架构构建。该模型专为处理各种自然语言处理任务而设计,在对话式AI、知识推理、代码生成和内容创作等方面表现出色,在模型能力和实际部署效率之间取得了良好平衡。
launch
ThinkPRM-7B是一款基于R1-Distill-Qwen-7B架构的生成式过程奖励模型,专门用于对推理过程进行逐步验证。它通过生成明确的验证思维链来评估数学解题、代码生成等推理任务的每一步正确性,具有数据效率高、可解释性强的特点。
Mungert
基于llama.cpp生成的0.5B参数规模的文本生成模型,支持指令式文本生成任务
thuml
日晷是一系列生成式时间序列基础模型,能够对确定性预测和概率预测进行零样本推理。
PsycheFoundation
Nous Consilience 40B是一个400亿参数的生成式文本模型,通过去中心化方式从零开始预训练,支持多种语言,代表人类多元创造性产出。
Featherless-Chat-Models
Mistral-7B-v0.1是一个拥有70亿参数的预训练生成式文本大语言模型,在多项基准测试中表现优于Llama 2 13B模型。它采用了先进的Transformer架构设计,包括分组查询注意力和滑动窗口注意力机制。
speakleash
Bielik-4.5B-v3是一款拥有46亿参数的波兰语生成式文本模型,由SpeakLeash与ACK Cyfronet AGH合作开发,基于精选波兰语料库训练。
Unreal Engine生成式AI支持插件,集成多种前沿LLM/GenAI模型API,提供游戏开发中的AI集成层支持,包括OpenAI、Claude、Deepseek等模型的聊天、结构化输出等功能,并支持Model Control Protocol(MCP)实现场景对象控制、蓝图生成等高级功能。
一个专注于探索和应用生成式AI(GenAI)的仓库,旨在通过实际案例和资源分享,帮助用户学习和实验GenAI在日常任务中的应用,包括写作、编程、图像生成等。
多集群MCP服务器为生成式AI系统提供与多个Kubernetes集群交互的网关,支持资源操作、集群管理和监控。
WildFly MCP项目旨在通过生成式AI能力增强WildFly服务器的监控和管理,提供工具和服务器集成,支持自然语言交互。
一个基于Reablocks设计系统的智能React组件生成MCP服务器,通过自然语言处理生成生产就绪的TypeScript组件,包含响应式布局和可访问性支持。
GenPilot是一个简化生成式AI单/多代理系统创建与管理的工具,支持MCP协议,提供终端和Web界面,便于快速开发和部署。
一个基于Node.js和Gemini API的AI研究助手工具,通过Firecrawl进行网页数据抓取,利用Gemini大模型进行深度语言理解和报告生成,支持迭代式深度研究,并可与MCP协议集成。
Open Deep Research MCP Server是一个AI驱动的深度研究助手,通过结合搜索引擎、网页抓取和AI技术进行迭代式深度研究,生成全面报告。支持MCP协议和CLI两种使用方式,具备可靠性评估、范围控制、自动生成后续问题等功能。
一个将Figma设计转换为Vue 3组件的MCP服务器,遵循Hostinger设计系统和HComponents规范,支持自动生成响应式组件和BEM样式。
EasyChatDM是一个用于创建简单MCP服务器工具的教育项目,旨在通过生成式AI为D&D游戏提供随机决策工具。
WildFly MCP项目旨在为WildFly用户提供利用生成式AI能力监控和管理服务器的工具,包括MCP服务器、聊天机器人、容器镜像及协议网关等组件。
AI Toybox是一个生成式AI实验平台,专注于快速原型设计和测试MCP工具及智能体工作流,提供聊天应用和模块化MCP服务模板。
这是一个面向初学者的生成式AI课程项目,提供从环境搭建到实际应用的完整学习路径。项目包含6个概念课程和6个编程课程,使用Azure OpenAI服务进行实践操作。学习者可以通过GitHub Codespaces快速开始,或选择本地安装Python环境。项目强调API密钥的安全管理,并提供了详细的设置指南。此外,还鼓励学习者参与开源贡献,并提供了AI社区交流平台。
本项目设计并实现了一个连接数据空间与生成式AI的架构,通过Model Context Protocol (MCP)服务器作为安全中间层,使语言模型能间接访问DuckDB数据库,具备模块化、可扩展和日志追踪特性,为未来升级为RAG架构奠定基础。
一个实现分支式思维导航的MCP服务器,支持多分支管理、交叉引用、洞察生成和优先级跟踪功能
PydanticAI是由Pydantic团队开发的Python代理框架,旨在简化基于生成式AI的生产级应用开发。它支持多种AI模型,集成Pydantic验证和结构化输出,提供依赖注入系统、流式响应和图形支持,并与Pydantic Logfire无缝集成,适用于类型安全、高效的AI应用构建。