谷歌宣布停运实验性网页自动化项目Project Mariner,但其技术已整合至Gemini Agent和AI Mode等核心产品。该项目自2024年12月亮相,主要替代用户执行跨网页多步骤任务,如信息检索和操作,经过迭代后能同时处理十个任务,展现了强大多任务能力。
Perplexity旗下AI浏览器Comet推出iPad版本,全面适配iPadOS,支持多窗口浏览与多任务处理,并深度整合OpenAI、Anthropic等主流AI模型,提升智能上网体验,强化用户与AI聊天机器人的互动。
阿里AI助手千问接入红旗汽车智能座舱,将首发搭载于红旗HS6 PHEV。用户可通过语音指令实现多任务处理,如同时规划导航路线、推荐沿途餐厅并安排行程时间,标志着千问从AI眼镜向更复杂的车载场景拓展,加速进入物理世界。
谷歌宣布桌面版Chrome浏览器全面集成Gemini3模型,将传统浏览器升级为通用人工智能入口。这一变革使全球38亿用户能通过侧边栏直接使用AI功能,实现多模态理解和多任务处理,标志着互联网交互进入新阶段。
Carly是AI代理平台,超120种集成,通过邮件处理多任务,无需应用程序。
AI视频编辑,多任务视频处理。
MGX是一个提供24/7人工智能团队服务的平台,助力用户实现梦想、聊天和创造。
EasyWeb是一个用于构建和部署与浏览器交互的AI代理的开放平台。
Openai
$2.8
Input tokens/M
$11.2
Output tokens/M
1k
Context Length
Google
$0.49
$2.1
Xai
$1.4
$3.5
2k
-
Anthropic
$105
$525
200
$0.7
$7
$35
$17.5
$21
Alibaba
$4
$16
$6
$24
256
$2
$3.9
$15.2
64
Moonshot
$0.8
128
Baidu
32
GilbertAkham
这是一个基于DeepSeek-R1-Distill-Qwen-1.5B的多任务微调模型,通过LoRA适配器在多个数据集上进行训练,具备强大的多任务泛化和推理能力,能够处理广泛的自然语言和基于推理的任务。
DavidAU
基于Qwen3-30B-A3B混合专家模型的GGUF量化版本,上下文扩展至128k,采用NEO Imatrix量化技术优化,支持多语言和多任务处理。
ilsp
Llama-Krikri-8B-Instruct是由雅典娜研究中心开发的希腊语指令调优大语言模型,基于Llama-3.1-8B构建,增强了希腊语和英语的多任务处理能力。
bigscience
T0++是基于T5架构的自然语言处理模型,通过多任务提示训练实现零样本任务泛化能力,在多种NLP任务上超越GPT-3且体积更小。
wan-community
万2.1是一个开放且先进的大规模视频生成模型,具备顶尖性能,支持消费级GPU运行,并在多任务处理中表现卓越。
ibm-research
Granite-3.2-2B-Instruct是一个20亿参数的长上下文AI模型,专为思维推理能力微调,支持12种语言和多任务处理。
Sao10K
基于Llama-3-70B-Instruct微调的大语言模型,专注于创意文本生成和多任务处理
ai-forever
FRIDA 是一个多任务评估模型,支持多种自然语言处理任务,包括分类、聚类和重新排序等。
Yuanze
Olympus是一个通用任务路由系统,专为计算机视觉任务设计,能够处理20种不同的视觉任务,并通过任务路由机制实现高效的多任务处理。
google
PaliGemma 2是Google推出的多功能视觉语言模型(VLM),结合图像和文本处理能力,支持多语言和多任务处理。
PaliGemma是一款轻量级视觉语言模型,结合图像和文本输入生成文本输出,支持多语言和多任务处理。
GreatCaptainNemo
ProLLaMA是一个基于Llama-2-7b架构的蛋白质大语言模型,专注于多任务蛋白质语言处理。
dphn
基于Llama-3-8b微调的对话模型,具备多任务处理能力和初步智能体功能
ProLLaMA是基于Llama-2-7b构建的蛋白质大语言模型,专注于多任务蛋白质语言处理,能够执行蛋白质序列生成和超家族判定任务。
lier007
xiaobu-embedding是一个多任务嵌入模型,支持多种中文自然语言处理任务,包括文本相似度计算、分类、聚类和检索等。
Pix2Struct是一种图像编码器-文本解码器模型,通过多任务训练处理视觉语言理解任务,特别针对高分辨率信息图表的视觉问答进行了优化。
IDEA-CCNL
基于Randeng-T5-784M模型,在100+个中文数据集上进行多任务预训练,支持多种自然语言处理任务。
BLOOMZ-7B1 是一个多语言、多任务的大规模语言模型,支持超过40种语言和多种编程语言,适用于文本生成、情感分析等多种自然语言处理任务。
aiola
支持多任务的联合模型,可同时处理命名实体识别、关系抽取、实体提及检测和共指消解任务
mesolitica
这是一个预训练的T5基础标准马来语语言模型,通过多任务进行预训练,支持多种自然语言处理任务。
Chatty MCP是一款为编辑器设计的语音交互插件,能在完成AI请求后通过语音总结操作内容,提升多任务处理效率,支持自定义语音引擎。
本项目实现了一个最小化的MCP项目,用于理解MCP系统的运行机制。项目通过deepseek的API_KEY调用LLM服务,支持多任务处理,包含天气、股票等示例服务。