最好的長文生成 AI工具模型_精選長文生成資訊

AI資訊

微軟推出 VibeVoice-Realtime：實時文本轉語音新模型，助力互動式應用

微軟推出輕量級實時文本轉語音模型VibeVoice-Realtime-0.5B，支持流式輸入與長篇輸出，適用於代理應用和實時數據講述。該模型能在約300毫秒內開始輸出語音，配合語言模型生成回答。其框架通過連續語音標記實現下一個標記的擴散。

11.5k 43 分鐘前

微軟推出 VibeVoice-Realtime：實時文本轉語音新模型，助力互動式應用

騰訊視頻孫忠懷：未來12個月將是 AI 長片涌現的關鍵期窗口

騰訊高管在電影節論壇上指出，生成式AI正深刻改變影視創作，未來一年將是AI長片涌現的關鍵期。AI不僅加速短視頻內容生產，更將重塑行業權力結構，推動影視進入新的“文藝復興”。

11.1k 10 小時前

國產“Sora”來了！智譜清影2.0一句話生成1080P視頻，還自帶AI音效

智譜AI推出清影2.0，基於自研CogVideoX模型，可直接生成1080P高清視頻，最長10秒。模型全面控制運動、鏡頭和風格，支持多視頻同時生成及鏡頭指定。實測畫質接近Sora，中文提示理解更準、生成更快。還集成CogSound音效模塊，實現文本到視頻的高效創作。

17.3k 3 小時前

螞蟻百靈大模型團隊開源Ring-flash-linear-2.0-128K，混合注意力+MoE架構重塑長文本編程效率

螞蟻集團開源百靈大模型Ring-flash-linear-2.0-128K，專攻超長文本編程。採用混合線性注意力與稀疏MoE架構，僅激活6.1B參數即可媲美40B密集模型，在代碼生成和智能代理領域達到最優表現，高效解決長上下文處理痛點。

11.6k 1 天前

AI產品

Qwen Image

Qwen Image是阿里巴巴的免費開源AI圖像生成器，擅長在圖像中進行文本渲染。

圖片生成

7.3k

OLMo-2-1124-13B-Instruct

一款經過優化的大型語言模型，擅長文本生成和對話。

聊天機器人

8.4k

LongRAG

長文本問答增強型檢索生成模型

研究工具

6.6k

愛享寫作

日常電腦可用的免費萬字長文寫作軟件

寫作助手

21k

模型

Gemini 2.0 Flash-Lite

Google

$0.49

輸入tokens/百萬

$2.1

輸出tokens/百萬

上下文長度

GPT-4.1 mini

Openai

$2.8

輸入tokens/百萬

$11.2

輸出tokens/百萬

上下文長度

Grok 4 Fast

Xai

$1.4

輸入tokens/百萬

$3.5

輸出tokens/百萬

上下文長度

o3-mini

Openai

$7.7

輸入tokens/百萬

$30.8

輸出tokens/百萬

200

上下文長度

GPT-5 Codex

Openai

輸入tokens/百萬

輸出tokens/百萬

上下文長度

Claude 3 Opus

Anthropic

$105

輸入tokens/百萬

$525

輸出tokens/百萬

200

上下文長度

Gemini 2.0 Flash

Google

$0.7

輸入tokens/百萬

$2.8

輸出tokens/百萬

上下文長度

Claude Haiku 4.5

Anthropic

輸入tokens/百萬

$35

輸出tokens/百萬

200

上下文長度

Gemini 2.5 Flash

Google

$2.1

輸入tokens/百萬

$17.5

輸出tokens/百萬

上下文長度

Claude Sonnet 4.5

Anthropic

$21

輸入tokens/百萬

$105

輸出tokens/百萬

200

上下文長度

Claude 3 Sonnet

Anthropic

$21

輸入tokens/百萬

$105

輸出tokens/百萬

200

上下文長度

Gemini 2.5 Flash-Lite

Google

$0.7

輸入tokens/百萬

$2.8

輸出tokens/百萬

上下文長度

wan2.5-i2i-preview

Alibaba

輸入tokens/百萬

輸出tokens/百萬

上下文長度

qwen3-max

Alibaba

輸入tokens/百萬

$24

輸出tokens/百萬

256

上下文長度

qwen-image-plus

Alibaba

輸入tokens/百萬

輸出tokens/百萬

上下文長度

qwen3-vl-235b-a22b-thinking

Alibaba

輸入tokens/百萬

$20

輸出tokens/百萬

上下文長度

qwen3-coder-plus

Alibaba

輸入tokens/百萬

$16

輸出tokens/百萬

上下文長度

Qianfan-Lightning

Baidu

輸入tokens/百萬

輸出tokens/百萬

128

上下文長度

Doubao-Seed-Translation

Bytedance

$1.2

輸入tokens/百萬

$3.6

輸出tokens/百萬

上下文長度

qwen-image-edit

Alibaba

輸入tokens/百萬

輸出tokens/百萬

上下文長度

MCP

Loom Mcp

Loom是一個MCP服務器，支持用戶與基礎模型協作構建文本，通過短片段迭代生成和選擇來優化長文本創作質量。

python

5.9k

2.5分

Comfyui_storydiffusion

ComfyUI_StoryDiffusion是一個基於ComfyUI的插件，支持StoryDiffusion和MS-Diffusion模型，用於生成連貫的長序列圖像和視頻。項目支持多種功能，包括雙角色同框、ControlNet控制、Lora加速、文本到圖像和圖像到圖像轉換等。

智啟未來，您的人工智能解決方案智庫

友情链接:

AI Newsletters AI Tools MCP Servers AI News AIBase LLM Leaderboard AI Ranking

商務合作網站地圖

AI資訊

微軟推出 VibeVoice-Realtime：實時文本轉語音新模型，助力互動式應用

騰訊視頻孫忠懷：未來12個月將是 AI 長片涌現的關鍵期窗口

國產“Sora”來了！智譜清影2.0一句話生成1080P視頻，還自帶AI音效

螞蟻百靈大模型團隊開源Ring-flash-linear-2.0-128K，混合注意力+MoE架構重塑長文本編程效率

AI產品

Qwen Image

OLMo-2-1124-13B-Instruct

LongRAG

愛享寫作

模型

Gemini 2.0 Flash-Lite

GPT-4.1 mini

Grok 4 Fast

o3-mini

GPT-5 Codex

Claude 3 Opus

Gemini 2.0 Flash

Claude Haiku 4.5

Gemini 2.5 Flash

Claude Sonnet 4.5

Claude 3 Sonnet

Gemini 2.5 Flash-Lite

wan2.5-i2i-preview

qwen3-max

qwen-image-plus

qwen3-vl-235b-a22b-thinking

qwen3-coder-plus

Qianfan-Lightning

Doubao-Seed-Translation

qwen-image-edit

Qwen3 VLTO TNG 12B 256k NEO Imatrix GGUF

Tarka Embedding 350M V1

Qwen3 VL 30B A3B Instruct 1M GGUF

Qwen3 VL 32B Thinking 1M GGUF

Qwen3 VL 8B Thinking 1M GGUF

Qwen3 VL 32B Instruct 1M GGUF

Qwen3 VL 8B Instruct 1M GGUF

Qwen3 VL 4B Thinking 1M GGUF

Qwen3 VL 4B Instruct 1M GGUF

Qwen3 VL 2B Thinking 1M GGUF

Qwen3 VL 30B A3B Thinking GGUF

Qwen3 VL 30B A3B Instruct GGUF

Qwen3 VL 32B Thinking GGUF

Qwen3 VL 32B Instruct GGUF

Qwen3 VL 8B Instruct GGUF

Qwen3 VL 32B Thinking GGUF

Qwen3 VL 32B Instruct GGUF

Qwen3 VL 30B A3B Instruct GGUF

Qwen3 VL 30B A3B Thinking GGUF

Qwen3 VL 8B Instruct GGUF

MCP

Loom Mcp

Comfyui_storydiffusion