初创公司Luminal完成530万美元种子轮融资,由Felicis Ventures领投,多位知名投资人参与。公司由前英特尔芯片设计师联合创立,专注于优化计算资源,提升基础设施效率,解决软件易用性对开发者的制约问题。
英特尔首席技术官Sachin Katti任职仅六个月后辞职,转投OpenAI。他负责公司AI战略期间,英特尔面临AI市场竞争加剧的挑战。此次高管变动凸显英特尔在AI领域的发展困境。
英特尔首席技术与人工智能官萨钦・卡蒂离职,转任OpenAI基础设施负责人,引发业内关注。英特尔宣布由CEO陈立武接替其职位,并重申人工智能仍是公司战略重点。
英特尔发布代号Panther Lake的新处理器,采用18A工艺制造,是Core Ultra家族下一代产品。该芯片在亚利桑那州Fab52工厂生产,预计今年晚些时候出货,工厂2025年投产。这是陈立武上任六个月后推动公司转型的重要硬件升级。
全球首款搭载英特尔®酷睿™Ultra处理器的AI迷你电脑
首款AI PC英特尔®酷睿™至尊台式机处理器
英特尔神经处理单元加速库
Intel开发者平台,提供丰富的软件工具和开发产品
Baidu
$1
Input tokens/M
$10
Output tokens/M
32
Context Length
Intel
基于Qwen3-Next-80B-A3B-Thinking模型,通过英特尔auto-round工具生成的混合int4量化模型。采用混合精度量化技术,非专家层回退到8位,在保证精度的同时显著降低计算资源需求,支持思维内容解析功能。
礼貌卫士是由英特尔开发的开源NLP语言模型,基于BERT微调用于文本分类任务,旨在将文本分为礼貌、较为礼貌、中立和不礼貌四类。
基于Qwen2-7B的INT4自动量化模型,由英特尔auto-round工具生成,适用于高效推理任务
SanjiWatsuki
Kunoichi-DPO-7B是基于Kunoichi-7B模型,使用英特尔的Orca数据对与Alpaca模板进行直接偏好优化(DPO)微调得到的模型,主要面向通用场景,具有更强的推理和指令遵循能力。
这是BAAI/BGE-small-en-v1.5模型的量化版本,使用英特尔神经压缩器进行训练后静态量化,与Optimum-Intel兼容,专为RAG(检索增强生成)场景优化,在保持接近原始性能的同时显著减少模型大小和推理延迟。
Neural-Chat-v3-3是英特尔基于Mistral-7B架构开发的70亿参数大语言模型,专注于数学推理和文本生成任务。该模型在MetaMathQA数据集上微调,并采用直接性能优化(DPO)方法对齐。
基于Mistral-7B在英特尔Gaudi 2处理器上微调的70亿参数大语言模型,采用DPO方法对齐,适用于多种语言任务
Whisper是一种预训练模型,用于自动语音识别(ASR)和语音翻译。本仓库提供ONNX格式的Whisper大型模型INT4权重量化版本,由英特尔®神经压缩器和英特尔®Transformers扩展驱动。
QuaLA-MiniLM是英特尔开发的微型语言模型,融合知识蒸馏、长度自适应变换器和8位量化技术,在SQuAD1.1数据集上实现最高8.8倍加速且精度损失不足1%。