西藏发布千亿级藏语大模型“阳光清言”V1.0,由院士尼玛扎西宣布,标志西藏AI从应用迈向系统性研发。目前AI已广泛用于政务、社区、公共服务及生态科考等领域,推动技术本土化发展。
全球海拔最高大语言模型“阳光清言”V1.0在西藏发布,参数量超千亿,训练语料达288亿Token,覆盖多领域,填补藏语AI空白。响应国家AI+行动,拉萨社区和贡嘎机场已接入AI客服与翻译服务。
MiroMind开源bAgent模型MiroThinker v1.0,具备256K上下文窗口和单次600次工具调用能力。创新提出“深度交互Scaling”框架,通过高频环境交互与实时反馈替代传统参数堆叠,实现智能体自我进化。模型集成搜索、Linux沙箱、代码执行等工具链,可在数小时内自主完成复杂任务,如官方示例中通过600轮调用处理食谱和计算热量。
10月16日,百度飞桨发布视觉语言模型PaddleOCR-VL,以0.9B参数在权威评测OmniDocBench V1.5中获92.56分,超越DeepSeek-OCR等主流模型登顶全球OCR榜单。截至10月21日,Huggingface趋势榜前三均为OCR模型,百度飞桨位列第一。
SkyReels V1 是一个开源的人类中心视频基础模型,专注于高质量影视级视频生成。
Openai
$2.8
Input tokens/M
$11.2
Output tokens/M
1k
Context Length
Google
$0.49
$2.1
Xai
$1.4
$3.5
2k
$7.7
$30.8
200
-
Anthropic
$105
$525
$0.7
$7
$35
$17.5
$21
Alibaba
$4
$16
$1
$10
256
$6
$24
Baidu
128
$2
$20
gia-uh
塞西莉亚FT MS v1是基于塞西莉亚2B v0.1微调的古巴语言模型,专门针对古巴西班牙语进行优化,捕捉古巴语言、文化和社会的细微差别。该模型支持西班牙语和英语,主要用于文本生成任务。
Mungert
MiroThinker v1.0是一个开源研究智能体,通过模型级别的交互式扩展提升工具增强推理和信息搜索能力。该模型在多个基准测试中表现出色,支持长上下文和深度多步分析。
nvidia
NVIDIA Nemotron Parse v1.1 TC 是一款先进的文档语义理解模型,能够从图像中提取具有空间定位的文本和表格元素,生成结构化注释,包括格式化文本、边界框和语义类别。相比前一版本,速度提升20%,并保留无序元素的页面顺序。
NVIDIA Nemotron Parse v1.1 是一款先进的文档解析模型,专门用于理解文档语义并提取具有空间定位的文本和表格元素。它能够将非结构化文档转换为机器可读的结构化表示,克服了传统OCR在处理复杂文档布局时的局限性。
AhmedZaky1
DIMI阿拉伯语OCR v2是一款专门针对阿拉伯语文本识别优化的光学字符识别模型,基于Qwen2.5-VL-7B-Instruct微调开发,在变音符密集文本处理方面相比v1版本有显著改进
MadhavRupala
Stable Diffusion v1-5是基于潜在扩散技术的文本到图像生成模型,能够根据文本描述生成逼真的图像。该模型在LAION-2B数据集上训练,支持英语文本输入,生成512x512分辨率的图像。
John6666
Illustrious XL v1.0是基于OnomaAIResearch/Illustrious-xl-early-release-v0训练的文生图模型,专门用于生成多种艺术风格的动漫女性图像,在图像生成领域具有应用价值
cpatonn
Llama-3.3-Nemotron-Super-49B-v1.5是基于Meta Llama-3.3-70B-Instruct衍生的大语言模型,是v1版本的显著升级版。该模型在推理、人类对话偏好和代理任务(如RAG和工具调用)方面表现出色,支持128K令牌的上下文长度,在准确性和效率间实现了良好平衡。
Flexan
Blake-XTM Arc 3B (V1) 是一个3B参数的指令大语言模型,基于microsoft/phi-2微调,支持文本生成、推理和工具调用。
redis
基于Redis Langcache Embed v1微调的句子转换器模型,用于生成768维句子嵌入向量
lmstudio-community
AM Thinking v1是由A-M团队开发的基于Qwen 2.5-32B-Base的大语言模型,增强推理能力,支持132k tokens的上下文长度。
DavidAU
基于暗黑幼苗V1 7B模型进行全面重新融合与重制的32k上下文大语言模型,在量化级别优化和性能表现上有显著提升
dallinmackay
基于Stable Diffusion v1.5微调的图像生成模型,专门用于生成詹姆斯·韦伯太空望远镜风格的深空图像。
async0x42
Cogito v1 预览版是基于Qwen2.5-32B的指令调优生成式模型,支持30多种语言,上下文长度达128k,针对编程、STEM、指令遵循和通用帮助性进行了优化。
Shakker-Labs
卓越羽笔工坊-V15是一款风格多样化的文本生成图像模型,特别擅长卡通和动漫风格,同时支持多种艺术表现手法。
notbadai
Notbad v1.0 Mistral 24B 是一款专注于数学和Python编程推理的模型,基于Mistral-Small-24B-Instruct-2501并通过强化学习进一步训练。
基于Illustrious XL v1.1的动漫风格文本到图像生成模型,擅长生成高质量动漫女孩图像
hon9kon9ize
Cantonese LLM Chat v1.0是hon9kon9ize团队开发的第一代粤语大语言模型,在香港相关专业知识和粤语对话方面表现卓越。
Illustrious XL v1.0 是一个基于稳定扩散XL的文本生成图像模型,专注于生成高质量的动漫风格图像,特别是女孩角色。
Illustrious XL v1.0 是一个基于稳定扩散XL的文本生成图像模型,专注于生成高质量的动漫风格图像。
一个用于与Glide API交互的模型上下文协议服务器,支持v1和v2版本,提供安全、类型化的数据操作。