最好的"Transformer" AI工具模型_精選"Transformer"資訊

AI資訊

M4 算力機密被破解！Claude 立大功，你的 Mac mini 竟是隱藏的“訓練怪獸”？

工程師Manjeet Singh藉助Claude AI破解了蘋果M4芯片神經引擎（ANE）的算力限制，繞過了臃腫的CoreML框架，成功在Mac mini上直接訓練Transformer模型，突破了ANE僅限推理的傳統限制。

13.4k 41 分鐘前

超越 Transformer 架構？Inception 發佈全球首個基於擴散模型的推理大模型 Mercury 2

Inception Labs推出Mercury2模型，採用擴散模型替代Transformer架構，實現文本生成範式轉移。該模型不再逐字生成，而是像編輯一樣整體處理文本，旨在突破傳統大模型的性能瓶頸。

17.9k 20 小時前

超越 Transformer 架構？Inception 發佈全球首個基於擴散模型的推理大模型 Mercury 2

馬斯克宣佈 X 平臺推薦算法正式開源:基於 Grok 模型架構，每四周迭代更新

馬斯克宣佈開源X平臺新一代推薦算法，採用Grok同款Transformer架構。算法雖仍需改進，但公開真實生產代碼旨在推動技術透明與迭代。其核心通過預測用戶互動概率進行內容排序。

16.3k 2 天前

英偉達發佈 PersonaPlex-7B-v1:重塑實時語音交互的“全雙工”黑科技

英偉達發佈PersonaPlex-7B-v1語音對話模型，突破傳統AI語音助手“一問一答”模式，實現更自然的真人對話體驗。該模型採用單一Transformer架構，直接完成語音理解與生成，無需傳統ASR、LLM、TTS串聯處理。

26.9k 1 天前

英偉達發佈 PersonaPlex-7B-v1:重塑實時語音交互的“全雙工”黑科技

AI產品

混元Motion 1.0

基於 Diffusion Transformer 架構的十億參數文生 3D 動作模型。

AI角色生成

8.9k

EasyControl

為 Diffusion Transformer 提供高效靈活的控制框架。

AI模型

12.4k

AI21-Jamba-Large-1.6

AI21 Jamba Large 1.6 是一款強大的混合 SSM-Transformer 架構基礎模型，擅長長文本處理和高效推理。

模型訓練與部署

9.6k

ViTPose

基於Transformer實現的ViTPose模型集合

AI模型

10.7k

模型

Doubao-Seed-Translation

Bytedance

$1.2

輸入tokens/百萬

$3.6

輸出tokens/百萬

上下文長度

Hunyuan-T1-latest

Tencent

輸入tokens/百萬

輸出tokens/百萬

上下文長度

Hunyuan-TurboS-latest

Tencent

$0.8

輸入tokens/百萬

輸出tokens/百萬

上下文長度

Hunyuan-TurboS-20250716

Tencent

$0.8

輸入tokens/百萬

輸出tokens/百萬

上下文長度

Hunyuan-TurboS-Vision

Tencent

輸入tokens/百萬

輸出tokens/百萬

上下文長度

Hunyuan-TurboS-Longtext-128k-20250325

Tencent

$1.5

輸入tokens/百萬

輸出tokens/百萬

128

上下文長度

Gemma 3 12B

Google

$0.35

輸入tokens/百萬

$0.7

輸出tokens/百萬

131

上下文長度

QwQ-32B

Alibaba

輸入tokens/百萬

輸出tokens/百萬

上下文長度

Hunyuan-Large

Tencent

輸入tokens/百萬

$12

輸出tokens/百萬

上下文長度

Qwen_v2.5_7b_base

Alibaba

輸入tokens/百萬

輸出tokens/百萬

128

上下文長度

Qwen_v2.5_1.5b_base

Alibaba

輸入tokens/百萬

輸出tokens/百萬

上下文長度

Qwen_v2.5_0.5b_base

Alibaba

輸入tokens/百萬

輸出tokens/百萬

128

上下文長度

o1-pro

Openai

輸入tokens/百萬

輸出tokens/百萬

上下文長度

Qwen_v2.5_3b_Instruct

Alibaba

輸入tokens/百萬

輸出tokens/百萬

上下文長度

Gemini 1.5 Flash

Google

$1.05

輸入tokens/百萬

$4.2

輸出tokens/百萬

上下文長度

Gemma 2 27B

Google

輸入tokens/百萬

輸出tokens/百萬

上下文長度

GLM-4

Chatglm

$100

輸入tokens/百萬

$100

輸出tokens/百萬

128

上下文長度

MCP

OpenAPI Transformer

emcee是一個為任何具有OpenAPI規範的Web應用提供Model Context Protocol (MCP)服務器的工具，可將Claude Desktop等應用連接到外部工具和數據服務。

6.4k

3.5分

Mcp Reasoning Server

一個為Cursor AI中的Claude提供高級推理能力的MCP服務器，包含多種推理方法如蒙特卡洛樹搜索、束搜索和Transformer混合推理等。

javascript

11.2k

2.5分

OpenAPI Transformer

一個基於Bun運行時的OAS轉換工具項目

typescript

7.7k

2.0分

Mcp Sentiment

基於Gradio的輕量級應用，使用Hugging Face Transformers進行情感分析和反諷檢測，兼容MCP架構，可在CPU上運行。

智啟未來，您的人工智能解決方案智庫

友情链接:

AI Newsletters AI Tools MCP Servers AI News AIBase LLM Leaderboard AI Ranking

商務合作網站地圖

AI資訊

M4 算力機密被破解！Claude 立大功，你的 Mac mini 竟是隱藏的“訓練怪獸”？

​超越 Transformer 架構？Inception 發佈全球首個基於擴散模型的推理大模型 Mercury 2

馬斯克宣佈 X 平臺推薦算法正式開源:基於 Grok 模型架構，每四周迭代更新

英偉達發佈 PersonaPlex-7B-v1:重塑實時語音交互的“全雙工”黑科技

AI產品

混元Motion 1.0

EasyControl

AI21-Jamba-Large-1.6

ViTPose

模型

Doubao-Seed-Translation

Hunyuan-T1-latest

Hunyuan-TurboS-latest

Hunyuan-TurboS-20250716

Hunyuan-TurboS-Vision

Hunyuan-TurboS-Longtext-128k-20250325

Gemma 3 12B

QwQ-32B

Hunyuan-Large

Qwen_v2.5_7b_base

Qwen_v2.5_1.5b_base

Qwen_v2.5_0.5b_base

o1-pro

Qwen_v2.5_3b_Instruct

Gemini 1.5 Flash

Gemma 2 27B

GLM-4

Tiny Random Metaclip_2

Dialogsum T5 Small

Brain To Text 25 Wav2vec2

Supertonic TTS ONNX

Olmo 3 7B Think

Sam3 Tracker ONNX

Saliency R1 Attnv3

ChessLC0

Olmo 3 32B Think SFT

Moondream3 Preview Hf

Premia Nes 7B Unsloth Mixed V9 Zeta Prompt

Tabpfn_2_5

Videomae Tiny 92 Kinetics Binary Finetuned Xd Violence

Deepseek Ocr Latest Transformers

CLIP ViT B 32 NEWNEWNEW

Ouro 2.6B

Ouro 1.4B

Apriel H1 15b Thinker SFT

Qwen2.5 0.5B Instruct Gensyn Swarm Pesty_ferocious_fish

Dots.ocr Base Fix

MCP

OpenAPI Transformer

Mcp Reasoning Server

OpenAPI Transformer

Mcp Sentiment

超越 Transformer 架構？Inception 發佈全球首個基於擴散模型的推理大模型 Mercury 2