Best Transformer架构 AI Tools & Models - Premium Transformer架构 News

AI News

马斯克宣布 X 平台推荐算法正式开源:基于 Grok 模型架构，每四周迭代更新

马斯克宣布开源X平台新一代推荐算法，采用Grok同款Transformer架构。算法虽仍需改进，但公开真实生产代码旨在推动技术透明与迭代。其核心通过预测用户互动概率进行内容排序。

13.2k 4 hours ago

英伟达发布 PersonaPlex-7B-v1:重塑实时语音交互的“全双工”黑科技

英伟达发布PersonaPlex-7B-v1语音对话模型，突破传统AI语音助手“一问一答”模式，实现更自然的真人对话体验。该模型采用单一Transformer架构，直接完成语音理解与生成，无需传统ASR、LLM、TTS串联处理。

20.3k 7 minutes ago

英伟达发布 PersonaPlex-7B-v1:重塑实时语音交互的“全双工”黑科技

腾讯混元发布 HY-Motion1.0开源3D 角色动画生成模型

腾讯混元开源文生3D动作大模型HY-Motion1.0，拥有十亿参数，采用Diffusion Transformer架构，旨在生成高质量标准化骨骼动画。该模型可帮助游戏开发者、动画师及科研人员提升效率，降低3D动画制作门槛，助力个人创作者实现创意。

13.7k 11 hours ago

英伟达推出 Nemotron 3：混合架构提升 AI 代理处理效率

英伟达发布Nemotron 3系列，融合Mamba与Transformer架构，高效处理长上下文并降低资源消耗。该系列专为自主执行复杂任务的AI代理系统设计，包含Nano、Super、Ultra三款型号。目前Nano已上市，Super和Ultra预计2026年上半年推出。

10.7k 18 hours ago

AI Products

混元Motion 1.0

基于 Diffusion Transformer 架构的十亿参数文生 3D 动作模型。

AI角色生成

8.7k

AI21-Jamba-Large-1.6

AI21 Jamba Large 1.6 是一款强大的混合 SSM-Transformer 架构基础模型，擅长长文本处理和高效推理。

模型训练与部署

9.6k

Skywork-Reward-Gemma-2-27B

基于Gemma-2-27B架构的先进奖励模型

AI模型

10k

RWKV

新一代大模型架构，超越 Transformer。

AI模型

10.6k

Models

Grok 4 Fast

Xai

$1.4

Input tokens/M

$3.5

Output tokens/M

Context Length

qwen3-coder-plus

Alibaba

Input tokens/M

$16

Output tokens/M

Context Length

qwen3-vl-235b-a22b-thinking

Alibaba

Input tokens/M

$20

Output tokens/M

Context Length

Doubao-Seed-Translation

Bytedance

$1.2

Input tokens/M

$3.6

Output tokens/M

Context Length

Qwen3-Next-80B-A3B-Instruct

Alibaba

Input tokens/M

Output tokens/M

256

Context Length

Kimi-K2

Moonshot

Input tokens/M

$16

Output tokens/M

256

Context Length

Doubao-1.5-pro-32k

Bytedance

$0.8

Input tokens/M

Output tokens/M

128

Context Length

Grok Code Fast 1

Xai

$1.4

Input tokens/M

$10.5

Output tokens/M

256

Context Length

Hunyuan-T1-latest

Tencent

Input tokens/M

Output tokens/M

Context Length

DeepSeek-V3.1

Deepseek

Input tokens/M

$12

Output tokens/M

128

Context Length

gpt-oss-20b

Openai

$0.4

Input tokens/M

Output tokens/M

128

Context Length

Qwen3-30B-A3B-Instruct-2507

Alibaba

$0.75

Input tokens/M

Output tokens/M

256

Context Length

GPT-5

Openai

$8.75

Input tokens/M

$70

Output tokens/M

400

Context Length

Qwen3-235B-A22B-Instruct-2507

Alibaba

Input tokens/M

Output tokens/M

Context Length

GPT OSS 120B

Openai

$0.63

Input tokens/M

$3.15

Output tokens/M

131

Context Length

qwen3-coder-flash

Alibaba

Input tokens/M

Output tokens/M

Context Length

Hunyuan-Large-Vision

Tencent

Input tokens/M

Output tokens/M

Context Length

GLM-4.5-Flash

Chatglm

Input tokens/M

Output tokens/M

128

Context Length

GLM-4.5-X

Chatglm

Input tokens/M

$16

Output tokens/M

128

Context Length

GLM-4.5-AirX

Chatglm

Input tokens/M

Output tokens/M

128

Context Length

MCP

Mcp Sentiment

基于Gradio的轻量级应用，使用Hugging Face Transformers进行情感分析和反讽检测，兼容MCP架构，可在CPU上运行。

python

6.2k

2.0points

Empowering the future, your artificial intelligence solution think tank

English 简体中文繁體中文にほんご

FirendLinks:

AI Newsletters AI Tools MCP Servers AI News AIBase LLM Leaderboard AI Ranking

Business Cooperation Site Map

AI News

马斯克宣布 X 平台推荐算法正式开源:基于 Grok 模型架构，每四周迭代更新

英伟达发布 PersonaPlex-7B-v1:重塑实时语音交互的“全双工”黑科技

腾讯混元发布 HY-Motion1.0开源3D 角色动画生成模型

英伟达推出 Nemotron 3：混合架构提升 AI 代理处理效率

AI Products

混元Motion 1.0

AI21-Jamba-Large-1.6

Skywork-Reward-Gemma-2-27B

RWKV

Models

Grok 4 Fast

qwen3-coder-plus

qwen3-vl-235b-a22b-thinking

Doubao-Seed-Translation

Qwen3-Next-80B-A3B-Instruct

Kimi-K2

Doubao-1.5-pro-32k

Grok Code Fast 1

Hunyuan-T1-latest

DeepSeek-V3.1

gpt-oss-20b

Qwen3-30B-A3B-Instruct-2507

GPT-5

Qwen3-235B-A22B-Instruct-2507

GPT OSS 120B

qwen3-coder-flash

Hunyuan-Large-Vision

GLM-4.5-Flash

GLM-4.5-X

GLM-4.5-AirX

Osgrep Colbert Q8

Olmo 3 7B Think

ChessLC0

Olmo 3 32B Think SFT

Moondream3 Preview Hf

Premia Nes 7B Unsloth Mixed V9 Zeta Prompt

Tabpfn_2_5

Videomae Tiny 92 Kinetics Binary Finetuned Xd Violence

Ner Stacked Bert Multilingual V1.1.0

NVIDIA Nemotron Nano 12B V2 VL NVFP4 QAD

NVIDIA Nemotron Nano 12B V2 VL FP8

LibreFlux ControlNet

KORMo IFT Step 6000

AHN Mamba2 For Qwen 2.5 Instruct 3B

Qwen3 0.6B Gensyn Swarm Moist_robust_gerbil

Granite 4.0 H Tiny 3bit MLX

My Finetuned Chatbot

PatchFM

Qwen2.5 0.5B Instruct Gensyn Swarm Lithe_whistling_cat

Meta Llama 3 8B Instruct Triplet Adv

MCP

Mcp Sentiment