Best 结构感知 AI Tools & Models - Premium 结构感知 News

AI News

机器人界的“ChatGPT时刻”？Genesis AI 单模型搞定打蛋弹琴，这波Demo太炸了！

初创团队Genesis AI发布首个机器人基础模型GENE-26.5，标志着通用机器人在高难度非结构化任务上取得突破。演示中，机器人展现惊人灵活性与自主性，能完成单手打蛋、解魔方等精细任务，提升了对力度、逻辑、空间感知及节奏精准度的控制能力。

15.6k 19 hours ago

机器人界的“ChatGPT时刻”？Genesis AI 单模型搞定打蛋弹琴，这波Demo太炸了！

Google DeepMind 发布 Lyria 3 Pro：AI 音乐从"30秒试听"变成完整歌曲

Google DeepMind 新推出的 Lyria 3 Pro 模型将音乐生成时长从 30 秒大幅提升至 3 分钟，并新增“结构感知”能力，使模型能理解并生成包含前奏、主歌、副歌等完整结构的歌曲，突破了此前仅能生成背景音效的限制。

15.6k 1 hours ago

Google DeepMind 发布 Lyria 3 Pro：AI 音乐从"30秒试听"变成完整歌曲

谷歌 Gemini API 推出“地图接地”功能，AI 应用一跃成为“本地专家”

谷歌推出Gemini API新功能"地图接地"，开发者可将AI应用直接接入谷歌地图超2.5亿地点数据。该功能支持自动识别地理位置查询，提取地址、营业时间等实时结构化信息，显著提升位置感知型AI应用的开发效率。

13.4k 2 days ago

谷歌 Gemini API 推出“地图接地”功能，AI 应用一跃成为“本地专家”

阿里国际数字贸易集团AI团队发布Ovis2.5:经济型视觉推理模型新突破

阿里国际数字贸易集团AI团队发布多模态大语言模型Ovis2.5，提供9B和2B两种参数规模。该模型定位经济型视觉推理解决方案，具备原生分辨率感知能力，采用NaViT视觉编码器保留图像细节和全局结构，确保高质量视觉处理。

14.8k yesterday

Models

o3-mini

Openai

$7.7

Input tokens/M

$30.8

Output tokens/M

200

Context Length

Doubao - Seedream - 3.0 - t2i

Bytedance

Input tokens/M

Output tokens/M

Context Length

Qianfan-VL-8B

Baidu

Input tokens/M

Output tokens/M

Context Length

Qianfan-VL-70B

Baidu

Input tokens/M

Output tokens/M

Context Length

Grok Code Fast 1

Xai

$1.4

Input tokens/M

$10.5

Output tokens/M

256

Context Length

GPT-5 mini

Openai

$1.75

Input tokens/M

$14

Output tokens/M

400

Context Length

GLM-4.5-X

Chatglm

Input tokens/M

$16

Output tokens/M

128

Context Length

Qwen3-0.6B

Alibaba

$0.3

Input tokens/M

Output tokens/M

Context Length

Hunyuan-TurboS-Vision

Tencent

Input tokens/M

Output tokens/M

Context Length

Hunyuan-Translation-Lite

Tencent

Input tokens/M

Output tokens/M

Context Length

Pangu-NLP-N2-Reasoner-32K-3.0.1.1

Huawei

Input tokens/M

Output tokens/M

Context Length

GPT-4.1

Openai

$14

Input tokens/M

$56

Output tokens/M

Context Length

Hunyuan-Large

Tencent

Input tokens/M

$12

Output tokens/M

Context Length

Qwen_v2.5_14b_Instruct

Alibaba

Input tokens/M

Output tokens/M

128

Context Length

Hunyuan-Large-Longcontext

Tencent

Input tokens/M

$18

Output tokens/M

256

Context Length

o1-pro

Openai

Input tokens/M

Output tokens/M

Context Length

Qwen_v2.5_1.5b_Instruct

Alibaba

Input tokens/M

Output tokens/M

Context Length

Qwen_v2.5_3b_Instruct

Alibaba

Input tokens/M

Output tokens/M

Context Length

Hunyuan-Lite

Tencent

Input tokens/M

Output tokens/M

250

Context Length

MCP

Deepcontext Mcp

DeepContext是一个MCP服务器，为代码助手提供基于符号感知的语义搜索功能，通过智能解析代码结构和语义关系，在大型代码库中精准定位相关代码片段，提升开发效率。

typescript

9.4k

3.5points

Mcp Server

Blockscout MCP Server是一个基于Model Context Protocol（MCP）的开源服务，旨在为AI代理、IDE和自动化工具提供结构化的区块链数据访问。它封装了Blockscout API，支持多链查询，包括余额、代币、NFT和合约元数据等，并通过上下文感知的API使工具如Claude、Cursor等能够分析和利用这些数据。

python

9.5k

2.5points

TokenScope

TokenScope是一个面向大型语言模型的令牌感知目录探索工具，提供智能目录结构分析、文件内容令牌感知提取、令牌使用统计和综合报告生成功能。

python

9.6k

2.5points

Cursor10x Mcp

DevContext是一个强大的AI开发上下文系统，为开发者提供项目中心化的持续上下文感知能力，包含短期/长期/情景/语义四种记忆类型，支持代码结构分析和向量搜索，显著提升开发效率。

javascript

7.7k

2.5points

Medical Sql Mcp

基于MCP协议的医疗数据库连接服务器，提供虚拟文件系统导航、智能表结构查询、安全SQL执行和时间感知功能，帮助AI助手安全访问医院管理数据。

typescript

9.2k

2.0points

Layerzero_mcp

LayerZero OFT MCP是一个基于TypeScript/Node.js的模型上下文协议服务器，用于创建、部署和跨链桥接Omnichain Fungible Tokens（OFTs）。它通过抽象化跨链交互的复杂性，提供了一个结构化的、上下文感知的层，便于与LLM代理、机器人或需要去中心化跨链功能的应用程序集成。

typescript

8.4k

2.0points