最好的Transformer AI工具模型_精選Transformer資訊

AI資訊

性能提升 475 倍！富士通推出PHOTON新架構，劍指AI算力瓶頸

富士通發佈創新架構PHOTON，採用自上而下網絡並行分層計算，針對Transformer在長文本、高併發等場景下因頻繁訪存調取歷史信息導致處理緩慢的痛點，旨在突破算力成本與效率瓶頸。

Transformer 核心作者 Noam Shazeer 加盟 OpenAI，谷歌巨資未能挽留

人工智能領域傳奇研究員、Transformer架構核心作者諾姆·沙澤爾宣佈加盟OpenAI。此前谷歌、OpenAI等巨頭展開激烈競爭，最終OpenAI成功招攬。值得關注的是，不到兩年前谷歌剛以約27億美元技術許可費請回這位“巫師”，其迅速轉投競爭對手引發震動，彰顯AI人才戰白熱化。

21.1k 1 天前

Google發佈Gemma412B開源模型:主打無編碼器全模態，16GB內存筆記本可本地運行

Google發佈全新開源大模型Gemma412B，採用“Unified”無編碼器架構，突破端側全模態AI。該模型無需傳統視覺、音頻外部編碼器，直接輸入文字、圖像、音頻、視頻四種模態數據至同一Transformer主幹網絡處理，消除了外掛“翻譯”模塊帶來的顯存佔用和高延遲問題。

14.2k 9 小時前

Google發佈Gemma412B開源模型:主打無編碼器全模態，16GB內存筆記本可本地運行

全球首款全開源全模態物理AI大模型Cosmos3 發佈，英偉達聯手行業巨頭成立宇宙聯盟

英偉達發佈全球首款全開源物理AI大模型Cosmos3，基於混合Transformer架構，融合視覺推理、世界生成與動作預測，將物理AI訓練評估週期從數月縮短至數天，解決具身智能數據有限和仿真零散問題。

18.5k 20 小時前

全球首款全開源全模態物理AI大模型Cosmos3 發佈，英偉達聯手行業巨頭成立宇宙聯盟

AI產品

混元Motion 1.0

基於 Diffusion Transformer 架構的十億參數文生 3D 動作模型。

AI角色生成

10.2k

EasyControl

為 Diffusion Transformer 提供高效靈活的控制框架。

AI模型

13.2k

AI21-Jamba-Large-1.6

AI21 Jamba Large 1.6 是一款強大的混合 SSM-Transformer 架構基礎模型，擅長長文本處理和高效推理。

模型訓練與部署

9.4k

QwQ-32B

QwQ-32B 是一款強大的推理模型，專為複雜問題解決和文本生成設計，性能卓越。

AI模型

12k

模型

Doubao-Seed-Translation

Bytedance

$1.2

輸入tokens/百萬

$3.6

輸出tokens/百萬

上下文長度

Hunyuan-T1-latest

Tencent

輸入tokens/百萬

輸出tokens/百萬

上下文長度

Hunyuan-TurboS-latest

Tencent

$0.8

輸入tokens/百萬

輸出tokens/百萬

上下文長度

Hunyuan-TurboS-20250716

Tencent

$0.8

輸入tokens/百萬

輸出tokens/百萬

上下文長度

Hunyuan-TurboS-Vision

Tencent

輸入tokens/百萬

輸出tokens/百萬

上下文長度

Hunyuan-TurboS-Longtext-128k-20250325

Tencent

$1.5

輸入tokens/百萬

輸出tokens/百萬

128

上下文長度

Gemma 3 12B

Google

$0.35

輸入tokens/百萬

$0.7

輸出tokens/百萬

131

上下文長度

QwQ-32B

Alibaba

輸入tokens/百萬

輸出tokens/百萬

上下文長度

Hunyuan-Large

Tencent

輸入tokens/百萬

$12

輸出tokens/百萬

上下文長度

Qwen_v2.5_7b_base

Alibaba

輸入tokens/百萬

輸出tokens/百萬

128

上下文長度

Qwen_v2.5_0.5b_base

Alibaba

輸入tokens/百萬

輸出tokens/百萬

128

上下文長度

Qwen_v2.5_1.5b_base

Alibaba

輸入tokens/百萬

輸出tokens/百萬

上下文長度

o1-pro

Openai

輸入tokens/百萬

輸出tokens/百萬

上下文長度

Qwen_v2.5_3b_Instruct

Alibaba

輸入tokens/百萬

輸出tokens/百萬

上下文長度

Gemini 1.5 Flash

Google

$1.05

輸入tokens/百萬

$4.2

輸出tokens/百萬

上下文長度

Gemma 2 27B

Google

輸入tokens/百萬

輸出tokens/百萬

上下文長度

GLM-4

Chatglm

$100

輸入tokens/百萬

$100

輸出tokens/百萬

128

上下文長度

MCP

OpenAPI Transformer

emcee是一個為任何具有OpenAPI規範的Web應用提供Model Context Protocol (MCP)服務器的工具，可將Claude Desktop等應用連接到外部工具和數據服務。

9.9k

3.5分

Mcp Reasoning Server

一個為Cursor AI中的Claude提供高級推理能力的MCP服務器，包含多種推理方法如蒙特卡洛樹搜索、束搜索和Transformer混合推理等。

javascript

11.9k

2.5分

OpenAPI Transformer

一個基於Bun運行時的OAS轉換工具項目

typescript

2.0分

Mcp Sentiment

基於Gradio的輕量級應用，使用Hugging Face Transformers進行情感分析和反諷檢測，兼容MCP架構，可在CPU上運行。

智啟未來，您的人工智能解決方案智庫

友情链接:

AI Newsletters AI Tools MCP Servers AI News AI Marketing LLM Leaderboard AI Ranking

商務合作網站地圖

AI資訊

性能提升 475 倍！富士通推出PHOTON新架構，劍指AI算力瓶頸

Transformer 核心作者 Noam Shazeer 加盟 OpenAI，谷歌巨資未能挽留

Google發佈Gemma412B開源模型:主打無編碼器全模態，16GB內存筆記本可本地運行

全球首款全開源全模態物理AI大模型Cosmos3 發佈，英偉達聯手行業巨頭成立宇宙聯盟

AI產品

混元Motion 1.0

EasyControl

AI21-Jamba-Large-1.6

QwQ-32B

模型

Doubao-Seed-Translation

Hunyuan-T1-latest

Hunyuan-TurboS-latest

Hunyuan-TurboS-20250716

Hunyuan-TurboS-Vision

Hunyuan-TurboS-Longtext-128k-20250325

Gemma 3 12B

QwQ-32B

Hunyuan-Large

Qwen_v2.5_7b_base

Qwen_v2.5_0.5b_base

Qwen_v2.5_1.5b_base

o1-pro

Qwen_v2.5_3b_Instruct

Gemini 1.5 Flash

Gemma 2 27B

GLM-4

Tiny Random Metaclip_2

Dialogsum T5 Small

Brain To Text 25 Wav2vec2

Supertonic TTS ONNX

Olmo 3 7B Think

Sam3 Tracker ONNX

Saliency R1 Attnv3

ChessLC0

Olmo 3 32B Think SFT

Moondream3 Preview Hf

Premia Nes 7B Unsloth Mixed V9 Zeta Prompt

Tabpfn_2_5

Videomae Tiny 92 Kinetics Binary Finetuned Xd Violence

Deepseek Ocr Latest Transformers

CLIP ViT B 32 NEWNEWNEW

Ouro 2.6B

Ouro 1.4B

Apriel H1 15b Thinker SFT

Qwen2.5 0.5B Instruct Gensyn Swarm Pesty_ferocious_fish

Dots.ocr Base Fix

MCP

OpenAPI Transformer

Mcp Reasoning Server

OpenAPI Transformer

Mcp Sentiment