快手可靈AI發佈數字人模型Avatar2.0,用戶僅需提供一張照片和一段音樂,即可生成長達5分鐘的唱歌視頻。該模型顯著提升了數字人的表現力,使其能夠自然展現表情和肢體動作,告別僵硬“對口型”模式。這標誌着AI內容創作從靜態向動態敘事的重大進步。
《芝加哥論壇報》起訴AI公司Perplexity,指控其未經授權抓取新聞內容、繞過付費牆並直接生成原文級別結果。報社律師曾詢問內容使用情況,Perplexity迴應稱未將文章用於模型訓練,但承認可能涉及非逐字事實引用。
微軟推出實時文本轉語音模型VibeVoice-Realtime-0.5B,僅0.5B參數即可實現接近實時的語音生成,最快300毫秒內開始發聲,支持中英文實時轉錄與語音生成,中文表現略遜於英文,但整體流暢度和還原度高,音質自然。
OpenAI宣佈GPT-5.1-CodexMax全面接入API,開發者可將其整合至應用與工作流。該模型在複雜任務分解、代碼生成質量及自主執行等方面顯著提升,現已正式開放使用。
基於Flux AI模型,可實現文本生成圖像和圖像編輯轉換
GPTunneL提供多模型AI服務,可生成文本、圖像等,支持多方式支付。
Z-Image Turbo是高效AI圖像生成模型,秒速生成高質量圖像。
免費AI生成器中心,50+模型在線創作圖像、視頻和音樂
Google
$0.49
輸入tokens/百萬
$2.1
輸出tokens/百萬
1k
上下文長度
Openai
$2.8
$11.2
Xai
$1.4
$3.5
2k
$7.7
$30.8
200
-
Anthropic
$105
$525
$0.7
$7
$35
$17.5
$21
Alibaba
$1
$10
256
$6
$24
$4
$16
$2
$20
Baidu
128
Bytedance
$1.2
$3.6
4
drbaph
Z-Image(造相)是一個擁有60億參數的高效圖像生成基礎模型,專門解決圖像生成領域的效率和質量問題。其蒸餾版本Z-Image-Turbo僅需8次函數評估就能達到或超越領先競品,在企業級H800 GPU上可實現亞秒級推理延遲,並能在16G VRAM的消費級設備上運行。
city96
FLUX.2-dev是由black-forest-labs開發的圖像生成和編輯模型,已轉換為GGUF格式,專為圖像生成任務優化,採用擴散模型架構,支持在ComfyUI框架中使用。
gguf-org
flux2-dev-gguf 是一個基於 FLUX.2-dev 的圖像到圖像轉換模型,專門用於根據文本提示生成特定風格的圖像。該模型支持在 ComfyUI 環境中運行,能夠將文本描述轉換為風格化的視覺內容。
silveroxides
基於 black-forest-labs/FLUX.2-dev 的優化版本圖像生成模型,支持圖像到圖像的生成和編輯任務,採用 fp8_scaled 量化技術提升推理速度,特別適合在低顯存 GPU 上使用。
ostris
這是一個基於LoRA技術的文本到圖像轉換模型,專門用於生成具有法國印象派畫家貝爾特·莫里索藝術風格的圖像。該模型在FLUX.2-dev基礎模型上訓練,能夠將普通圖像或文本描述轉換為莫里索風格的畫作。
Tongyi-MAI
Z-Image是一款功能強大且高效的圖像生成模型,擁有60億參數。它能有效解決圖像生成領域在效率、質量和功能多樣性方面的問題,為用戶提供高質量的圖像生成和編輯服務。
optimum-internal-testing
這是一個Hugging Face Hub上的🤗 Transformers模型,具體信息待補充。模型卡片為自動生成,需要模型發佈者提供更多詳細信息。
Gjm1234
Wan2.2是基礎視頻模型的重大升級版本,專注於將有效MoE架構、高效訓練策略和多模態融合等創新技術融入視頻擴散模型,為視頻生成領域帶來更強大、更高效的解決方案。
diffusers
FLUX.2-dev是基於NF4量化的DiT和文本編碼器的圖像生成與編輯模型,提供高質量的圖像生成和編輯能力,適用於圖像領域的開發應用。
bartowski
這是squ11z1的Hypnos-i1-8B模型的量化版本,使用llama.cpp工具和特定數據集進行量化處理。該模型基於Llama-3架構,提供多種量化類型選擇,支持文本生成任務,適用於推理、對話等多種應用場景。
lightx2v
本倉庫包含為HunyuanVideo-1.5優化的4步蒸餾模型,能夠在不使用CFG(無分類器指導)的情況下實現超快速的4步推理,顯著減少生成時間,同時保持高質量的視頻輸出。
pramjana
Qwen3-VL-4B-Instruct是阿里巴巴推出的40億參數視覺語言模型,基於Qwen3架構開發,支持多模態理解和對話任務。該模型具備強大的圖像理解和文本生成能力,能夠處理複雜的視覺語言交互場景。
ExaltedSlayer
Gemma 3是谷歌推出的輕量級開源多模態模型,本版本為12B參數的指令調優量化感知訓練模型,已轉換為MLX框架的MXFP4格式,支持文本和圖像輸入並生成文本輸出,具有128K上下文窗口和140+語言支持。
00quebec
這是一個專門為 Qwen-Image 設計的開源 LoRA 模型,專注於模擬現代 iPhone 攝影的真實感外觀和感覺。模型基於5000多張真實 iPhone 風格照片訓練,能夠生成清晰、自然、適合社交媒體分享的圖像。
noctrex
這是一個基於Huihui-MiroThinker-v1.0-30B模型進行的MXFP4_MOE imatrix量化版本,專門針對文本生成任務優化,在保持模型性能的同時顯著減小了模型體積和推理成本。
gia-uh
塞西莉亞FT MS v1是基於塞西莉亞2B v0.1微調的古巴語言模型,專門針對古巴西班牙語進行優化,捕捉古巴語言、文化和社會的細微差別。該模型支持西班牙語和英語,主要用於文本生成任務。
black-forest-labs
FLUX.2 [dev] 是一個擁有320億參數的校正流變壓器模型,專門用於圖像生成、編輯和組合任務。該模型在文本到圖像生成、單參考編輯和多參考編輯方面處於領先水平,無需微調即可實現角色、對象和風格參考,支持個人、科學和商業用途。
Sachin-0001
這是一個基於🤗 Transformers庫的雙向自迴歸Transformer模型,已上傳至模型中心。模型卡片由系統自動生成,具體技術細節和應用信息需要進一步補充。
Kiy-K
Fyodor-Q3-8B-Instruct 是一款專為智能推理和穩健代碼生成設計的高保真指令調優模型。它基於Qwen3-8B架構,採用高秩LoRA配置訓練,擅長在編碼前進行規劃,非常適合複雜的軟件工程任務。
這是對ai-sage的GigaChat3-10B-A1.8B模型進行的量化處理版本,採用llama.cpp的imatrix量化技術,可在不同硬件條件下更高效地運行。模型支持俄語和英語,主要用於文本生成任務。
Klavis AI是一個開源項目,提供在Slack、Discord和Web平臺上簡單易用的MCP(模型上下文協議)服務,包括報告生成、YouTube工具、文檔轉換等多種功能,支持非技術用戶和開發者使用AI工作流。
MiniMax官方模型上下文協議(MCP)服務器,支持文本轉語音、視頻/圖像生成等API交互。
該項目為LangChain提供Model Context Protocol(MCP)工具調用支持,通過MCP工具包實現與AI模型的交互,如文件讀取和摘要生成。
mcp-hfspace是一個連接Hugging Face Spaces的MCP服務器,支持圖像生成、語音處理、視覺模型等多種AI功能,簡化了與Claude Desktop的集成。
MemoryMesh是一個為AI模型設計的知識圖譜服務器,專注於文本角色扮演遊戲和互動敘事。它通過動態模式定義和自動生成工具,幫助AI在對話中維護一致且結構化的記憶,實現更豐富、更動態的交互體驗。
Unreal Engine生成式AI支持插件,集成多種前沿LLM/GenAI模型API,提供遊戲開發中的AI集成層支持,包括OpenAI、Claude、Deepseek等模型的聊天、結構化輸出等功能,並支持Model Control Protocol(MCP)實現場景對象控制、藍圖生成等高級功能。
Notebook Intelligence (NBI) 是一個為JupyterLab設計的AI編碼助手和可擴展AI框架,支持GitHub Copilot及其他LLM提供商的模型,包括本地Ollama模型。它通過代碼生成、自動補全和聊天界面等功能顯著提升生產力,並支持Model Context Protocol (MCP) 服務集成。
Quick-start Auto MCP是一個幫助用戶快速在Claude Desktop和Cursor中註冊Anthropic模型上下文協議(MCP)的工具,提供RAG文檔搜索、Dify工作流、即時網絡搜索等功能,支持一鍵生成JSON配置文件。
FileScopeMCP是一個基於TypeScript的代碼分析工具,通過計算文件重要性評分、追蹤依賴關係、生成可視化圖表和添加文件摘要,幫助開發者快速理解代碼庫結構。支持多語言項目分析,提供Mermaid圖表生成和持久化存儲功能,可與Cursor的模型上下文協議集成。
DB MCP Server是一個支持多數據庫的服務器,實現了模型上下文協議(MCP),為AI助手提供結構化訪問數據庫的能力。它支持MySQL和PostgreSQL,可同時連接多個數據庫,自動生成專用工具,並遵循清晰架構設計。
基於Flux.1 Schnell模型的高質量圖像生成MCP服務器
本實驗指導用戶如何部署MCP服務器並將其集成到Microsoft Copilot Studio中,通過標準化協議連接AI模型與數據源,實現即時數據訪問和笑話生成功能。
一個通過fal.ai API和MCP協議從文本生成圖像的Node.js工具,支持多種模型和參數,適合開發者和創作者快速生成圖像。
Trellis MCP是一個連接AI助手與Trellis 3D生成模型的接口服務,支持通過自然語言快速生成3D資產並導入Blender。該項目基於開源模型,需自行部署API後端,具有快速、免費的特點,但存在穩定性風險。
Payload CMS 3.0 MCP服務器是一個專為Payload CMS開發設計的模型上下文協議服務器,提供代碼驗證、模板生成和項目腳手架功能,幫助開發者遵循最佳實踐構建應用。
DiffuGen是一個先進的本地圖像生成工具,集成了MCP協議,支持多種AI模型(包括Flux和Stable Diffusion系列),可直接在開發環境中生成高質量圖像。它提供了靈活的配置選項、多GPU支持,並可通過MCP協議與多種IDE集成,同時提供OpenAPI接口供外部調用。
基於TypeScript的MCP服務器,集成Flux Schnell模型實現文本轉圖像生成功能
TokenScope是一個面向大型語言模型的令牌感知目錄探索工具,提供智能目錄結構分析、文件內容令牌感知提取、令牌使用統計和綜合報告生成功能。
一個基於Amazon Bedrock的Nova Canvas模型的MCP服務器,支持多種圖像生成與編輯功能。
Supabase MCP服務器是一個用於與Supabase數據庫交互的模型上下文協議服務,提供查詢表和生成TypeScript類型的功能。