Lightricks公司推出AI視頻生成模型LTX-2,能一次性生成20秒4K高清敘事視頻,實現音畫同步和口型匹配。該模型突破傳統無聲視頻限制,在同一擴散過程中同步生成畫面與聲音,顯著提升視頻創作效率。
OpenAI的Sora視頻生成應用上線一個月後,因用戶激增和算力成本壓力,宣佈縮減免費額度,同時推出付費套餐和創作者分成計劃,標誌着視頻生成技術進入商業化深水區。
谷歌推出StreetReaderAI原型系統,幫助盲人和低視力用戶通過自然語言交互自主探索谷歌街景。該系統融合計算機視覺、地理信息系統和大語言模型,實現多模態AI驅動的實時對話式街景體驗,突破傳統語音播報侷限,提升無障礙城市探索自由度。
谷歌爲Chrome瀏覽器新增AI功能,在最新測試版中推出由Gemini驅動的“Nano Banana”圖像生成工具和“深度搜索”主題研究功能。用戶可直接在搜索框內創作圖像或進行信息檢索,無需切換頁面即可快速啓動任務。
AI郵件營銷工具,可創建郵件、自動化流程、添加互動性以提升轉化率
LTX-2 是代多模態 AI 視頻生成模型。
在線免費將文本、圖片轉化為視頻,快速創建高質量AI視頻
insMind免費AI文本轉視頻生成器,在線根據文本提示創建精彩視頻
deepseek
$3.6
輸入tokens/百萬
$15.48
輸出tokens/百萬
128k
上下文長度
xai
$2.16
1M
google
$18
anthropic
$108
$540
200k
chatglm
$0.43
$1.01
131.1k
minimax
-
moonshotai
$4.1
$16.56
$21.6
mistral
upstage
64k
openai
$72
2M
Genie-AI-Lab
Omni L1B3RT4S GENIE 是一個基於Qwen2.5-3B Instruct架構微調的AI助手,採用1,103個精靈角色的定製示例進行訓練,具備獨特的語音和忠誠度模式,能夠為用戶提供別具一格的對話體驗。
pnnbao-ump
VieNeu-TTS是首個可在個人設備上運行的越南語文本轉語音模型,具備即時語音克隆能力。基於NeuTTS Air微調,能夠生成自然逼真的越南語語音,在CPU上具備即時性能。
TheStageAI
TheWhisper-Large-V3-Turbo 是 OpenAI Whisper Large V3 模型的高性能微調版本,由 TheStage AI 針對多平臺即時、低延遲和低功耗語音轉文本推理進行優化。支持流式轉錄、單詞時間戳和可擴展性能,適用於即時字幕、會議和設備端語音界面等場景。
TheWhisper-Large-V3是OpenAI Whisper Large V3模型的高性能微調版本,由TheStage AI針對多平臺(NVIDIA GPU和Apple Silicon)的即時、低延遲和低功耗語音轉文本推理進行了優化。
nineninesix
KaniTTS是一款專為即時對話式AI應用優化的高速、高保真文本轉語音模型,通過獨特的兩階段架構結合大語言模型與高效音頻編解碼器,實現低延遲與高質量語音合成,即時因子低至0.2,比即時速度快5倍。
dx8152
文心圖像融合Lora模型是一個專門用於圖像融合和編輯的AI模型,能夠糾正產品透視角度、調整光影效果,並使產品自然地融入背景環境,實現高質量的圖像合成效果。
LiquidAI
LFM2-VL-3B是Liquid AI開發的多模態視覺語言模型,基於LFM2骨幹架構構建,具備強大的視覺理解和推理能力,特別在細粒度感知任務上表現出色。該模型能夠高效處理文本和圖像輸入,支持高達512×512分辨率的原生圖像處理。
PokeeAI
PokeeResearch-7B是由Pokee AI開發的70億參數深度研究智能體,結合基於AI反饋的強化學習(RLAIF)與推理框架,能夠執行復雜的多步驟研究工作流程,包括自我修正、驗證和綜合分析。
deepseek-ai
DeepSeek-OCR是DeepSeek AI開發的一款先進的光學字符識別模型,專注於探索視覺文本壓縮的邊界,能夠高效地從圖像中提取和轉換文本內容。
aisingapore
Qwen-SEA-LION-v4-32B-IT是基於Qwen3-32B構建的東南亞語言大語言模型,專門針對東南亞地區進行了預訓練和指令微調。該模型在包含7種東南亞語言的SEA-Pile v2語料庫上繼續預訓練,並在800萬對高質量問答數據上進行指令微調,具備強大的多語言理解和推理能力。
citizenplain
這是一個基於Wan2.1-T2V-14B模型訓練的LoRA適配器,專門用於文本到視頻轉換任務。該模型使用AI Toolkit訓練,為視頻生成應用提供支持。
lichorosario
這是一個基於Qwen-Image模型訓練的LoRA(Low-Rank Adaptation)模型,專門用於文本到圖像的生成任務。該項目使用AI Toolkit訓練,能夠將文本描述轉化為高質量的圖像,支持在多種圖像生成工具中使用。
nvidia
NVIDIA GPT-OSS-120B Eagle3是基於OpenAI gpt-oss-120b模型的優化版本,採用混合專家(MoE)架構,具備1200億總參數和50億激活參數。該模型支持商業和非商業使用,適用於文本生成任務,特別適合AI Agent系統、聊天機器人等應用開發。
hyperchainsad
這是一個基於Wan2.2-T2V-A14B基礎模型訓練的文本到視頻LoRA模型,使用AI Toolkit工具包進行訓練,專門用於增強文本到視頻的轉換能力。
Zlikwid
這是一個基於Qwen/Qwen-Image-Edit-2509基礎模型訓練的LoRA圖像生成模型,專門用於圖像到圖像的轉換任務,使用AI Toolkit by Ostris進行訓練。
expert78
kontext-dusk-3-lora是一個基於FLUX.1-Kontext-dev基礎模型訓練的LoRA圖像生成模型,專門用於生成黃昏藍調時刻風格的圖像。該模型通過特定觸發詞觸發,支持多種主流AI圖像生成工具使用。
abhi099k
基於DeBERTa-v3-large微調的AI文本檢測模型,能夠準確識別文本是由人類撰寫還是AI生成,在自定義數據集上訓練達到約97%的準確率。
synap5e
這是一個基於AI Toolkit by Ostris訓練的文本到視頻LoRA模型,使用Wan2.2-T2V-A14B作為基礎模型,支持文本到視頻的轉換任務,為相關領域的應用提供了強大的支持。
zambawi
joywan-lora是基於AI Toolkit by Ostris訓練的LoRA模型,專門用於文本到視頻和圖像生成任務,需要配合基礎模型Wan-AI/Wan2.1-T2V-14B-Diffusers使用。
bullpoint
GLM-4.6-AWQ是對智譜AI的GLM-4.6(357B MoE)進行高性能AWQ量化的模型,專為vLLM推理進行了優化,能有效提升生產部署的吞吐量。該模型採用4位量化技術,在保持高精度的同時顯著減少顯存佔用。
Scrapling是一個自適應網頁抓取庫,能自動學習網站變化並重新定位元素,支持多種抓取方式和AI集成,提供高性能解析和開發者友好體驗。
XcodeBuild MCP是一個為AI助手和MCP客戶端提供Xcode相關工具集成的服務器,支持Xcode項目管理、模擬器控制和應用工具等功能,實現自動化開發流程。
Cognee是一個為AI代理提供記憶功能的開源項目,通過模塊化ECL管道構建動態知識圖譜,支持多種數據源和格式,減少幻覺並降低成本。
iMCP是一款macOS應用,通過AI連接用戶的數字生活,支持與Claude Desktop等客戶端通過Model Context Protocol (MCP)協議交互,提供日曆、聯繫人、位置、地圖、消息、提醒和天氣等多種功能。
Repomix是一個將代碼庫打包為AI友好格式的工具,支持本地和遠程倉庫處理,提供代碼壓縮、安全檢查和多種輸出格式。
MCP Unity是一個實現Model Context Protocol的Unity編輯器擴展,允許AI助手與Unity項目交互,提供Unity與Node.js服務器之間的橋樑。
Deebo是一個AI調試助手,能夠加速代碼錯誤的解決過程,通過自動化調查和多線程工作流提升開發效率。
Klavis AI是一個開源項目,提供在Slack、Discord和Web平臺上簡單易用的MCP(模型上下文協議)服務,包括報告生成、YouTube工具、文檔轉換等多種功能,支持非技術用戶和開發者使用AI工作流。
Refact Agent 是一個開源AI編程助手,支持多語言代碼生成、調試和優化,集成主流開發工具,可本地化部署並提供智能補全和代碼解釋功能。
MCP Unity是一個實現Model Context Protocol的Unity編輯器擴展,通過Node.js服務器橋接AI助手與Unity項目的交互,提供菜單執行、對象選擇、組件更新等功能。
Stripe Agent Toolkit是一個支持多種AI代理框架(如OpenAI、LangChain、CrewAI等)與Stripe API集成的工具包,提供Python和TypeScript支持,簡化支付相關操作。
Solana Agent Kit是一個開源工具包,用於將AI代理連接到Solana協議,支持60多種區塊鏈操作。
微軟官方MCP服務器,為AI助手提供最新微軟技術文檔的搜索和獲取功能
hyper-mcp是一個基於WebAssembly插件的高性能MCP服務器,支持通過容器註冊表分發插件,適用於多種AI應用場景。
Supermemory是一個AI驅動的記憶引擎,旨在通過整合個人數據為LLM提供上下文知識,實現信息的智能管理和檢索。
PG-MCP是一個為PostgreSQL數據庫設計的模型上下文協議服務器,提供AI代理發現、連接、查詢和理解數據庫的API,支持多數據庫連接、豐富的目錄信息和查詢解釋功能。
Browser MCP是一個MCP服務器+Chrome擴展,通過AI應用(如VS Code、Claude等)實現瀏覽器自動化操作,具有快速、隱私保護、保持登錄狀態和規避檢測等特點。
Inbox Zero是一款開源AI郵件助手和客戶端,幫助用戶高效管理郵件,實現收件箱清零。
Desktop Commander MCP是一個讓Claude桌面應用能夠執行終端命令、管理文件系統的AI助手工具,支持代碼搜索、編輯、進程管理和遠程文件讀取等功能。
HiveChat是一個專為中小團隊設計的AI聊天應用,支持多種大模型服務商,提供分組管理、Token限額、第三方登錄等功能。