Rokid正与顶尖大模型公司合作开发新一代AI智能眼镜,以生成式AI和AI智能体为核心,打造革命性操作系统和界面。该眼镜采用端侧多模态模型,支持语音、视觉和触控等多种交互方式,旨在提供全新用户体验。
中国生成式AI竞争进入用户争夺新阶段。百度“文心一言”月活突破2亿,成为首个进入“两亿俱乐部”的国产大模型。阿里巴巴“通义千问”上线两个月月活超1亿,增长迅猛。百度采取“全域融合”策略,将AI能力全面融入搜索等核心产品,加速应用落地。
中国电信人工智能研究院发布GVC生成式视频压缩技术,压缩率可达0.02%,1GB视频仅需传输约200KB数据即可还原清晰画质。其核心是“用计算换带宽”,区别于传统编码的“搬运像素”逻辑,通过AI模型学习视频内容特征,在接收端智能重建画面,大幅降低传输数据量,有望革新视频存储与流媒体传输。
苹果选定谷歌Gemini大模型作为下一代Siri核心引擎,预计2026年下半年随iOS20推出。此举标志着苹果在生成式AI落地迈出关键一步,并打破两家公司在核心AI技术上长期各自为营的局面。消息公布后,谷歌股价盘中涨幅超1%,总市值首次突破4万亿美元,苹果股价亦受提振。
LLM Pulse是您在生成式AI世界中的雷达。跟踪您的关键提示,了解AI来源如何引用您的品牌。
Inception Labs 推出新一代扩散式大语言模型,提供极速、高效和高质量的语言生成能力。
视觉语言模型增强工具,结合生成式视觉编码器和深度广度融合技术。
对话式视频代理,结合大型语言模型与视频处理API。
Openai
$2.8
Input tokens/M
$11.2
Output tokens/M
1k
Context Length
Google
$0.49
$2.1
Xai
$1.4
$3.5
2k
$7.7
$30.8
200
-
Anthropic
$105
$525
$0.7
$7
$35
$17.5
$21
Alibaba
$4
$16
$1
$10
256
Baidu
128
$6
$24
$2
$20
nineninesix
KaniTTS是一款高速、高保真的文本转语音模型,专为实时对话式人工智能应用而优化。该模型采用两阶段处理流程,结合大语言模型和高效音频编解码器,在Nvidia RTX 5080上生成15秒音频的延迟仅需约1秒,MOS自然度评分达4.3/5,支持英语、中文、日语等多种语言。
BBQGOD
DeepSeek-GRM-16B 是一个基于 Self-Principled Critique Tuning (SPCT) 的生成式奖励模型,能为查询-响应生成透明的'原则→批判→分数'评估流程,可用于大语言模型的强化学习、评估和数据收集等任务。
ducklingcodehouse
这是一个专注于芬兰语牙科医学的对话式AI助手,经过LoRA微调的大语言模型,能够针对牙科咨询问题生成结构化的临床回复,分为背景、评估和建议三个部分。
deepcogito
Cogito v2是经过指令调优的生成式大语言模型,采用混合专家架构,具有1090亿参数。该模型支持多语言处理、长上下文推理,在编码、STEM等领域表现出色,支持商业用途。
Cogito v2是基于指令调优的生成式大语言模型,具备混合推理能力,支持128k上下文长度和多语言处理。该模型采用迭代蒸馏与放大(IDA)训练策略,在编码、STEM、指令遵循等任务上表现优异。
Featherless-Chat-Models
Mistral-7B-v0.1是一个拥有70亿参数的预训练生成式文本大语言模型,在多项基准测试中表现优于Llama 2 13B模型。它采用了先进的Transformer架构设计,包括分组查询注意力和滑动窗口注意力机制。
ubergarm
Gemma-3-27B 是一个经过量化优化的对话式大语言模型,支持先进的非线性量化技术,提供高质量文本生成能力。
bharathkumar1922001
基于谷歌Gemma-3-12B模型,专门针对泰卢固语进行监督式微调的大语言模型,支持高质量的文本生成和对话任务。
TencentARC
AnimeGamer是专为无限动漫人生模拟设计的开创性模型,利用多模态大语言模型生成动态动画镜头,打造沉浸式游戏体验。
facebook
VFusion3D是一个通过少量3D数据与大量合成多视角数据训练的大型前馈式3D生成模型,是首个研究可扩展3D生成/重建模型的工作。
jadechoghari
VFusion3D是一个大型前馈式3D生成模型,通过少量3D数据和大量合成多视角数据进行训练,探索可扩展的3D生成/重建模型。
meta-llama
Meta发布的Llama 3系列大语言模型,包含8B和70B两种规模的预训练及指令调优生成式文本模型,针对对话场景优化,在行业基准测试中表现优异。
mistral-community
Mixtral-8x22B 是一个预训练的生成式稀疏专家混合大语言模型,由 Mistral AI 团队开发。该模型支持多语言处理,在多个文本生成任务上表现优异,包括推理挑战、常识推理和数学问题求解等。
amitagh
希瓦内里马拉地语大语言模型(Shivneri Marathi LLM)旨在为印度非英语(尤其是马拉地语)使用者提供生成式人工智能能力,支持马拉地语和英语的文本生成。
CohereLabs
Aya 101 是一个支持101种语言指令的大规模多语言生成式语言模型,在各类评估中优于同类模型。
indonlp
仙都(Cendol)是一个开源的、针对印尼语进行微调的生成式大语言模型集合,涵盖多种架构和参数规模。
Cendol mT5-small Chat是一个3亿参数的开源生成式大语言模型,针对印尼语、巽他语和爪哇语进行指令调优,适用于单轮对话场景。
LoneStriker
Mixtral-8x7B是一个预训练的生成式稀疏混合专家大语言模型,在多数基准测试中表现优于Llama 2 70B。
NOVA-vision-language
GlórIA 是一个专注于欧洲葡萄牙语的大规模生成式语言模型,基于GPTNeo架构,具有13亿参数。
PharMolix
BioMedGPT-LM-7B是生物医学领域首个基于Llama2的大型生成式语言模型,专注于生物医学文本生成与问答任务。
一个基于Node.js和Gemini API的AI研究助手工具,通过Firecrawl进行网页数据抓取,利用Gemini大模型进行深度语言理解和报告生成,支持迭代式深度研究,并可与MCP协议集成。