英特爾孵化的AI企業Articul8在2024年初成立後迅速崛起,近日宣佈其7000萬美元B輪融資已完成過半,投前估值達5億美元,較A輪後1億美元估值增長五倍。本輪融資由Adara Ventures領投,Aditya Birla Ventures等跟投,凸顯市場對垂直領域、可控可審計企業級AI解決方案的青睞。
阿里通義Qwen團隊推出Soft Adaptive Policy Optimization(SAPO),旨在解決大語言模型強化學習中策略優化不穩定的問題。相比傳統硬剪切方法,SAPO通過自適應調整更新幅度,避免過於嚴格限制,提升訓練穩定性和效率。
騰訊發佈AI程序員Ada技術預覽版,能一鍵將用戶需求轉化爲完整代碼,自動生成文檔和測試用例,並支持多語言項目協作,顯著提升開發效率,簡化工作流程。
OpenAI被曝要求獲取16歲自殺少年Adam Raine追悼會人員名單,遭家屬律師譴責爲“故意騷擾”。Raine家族近日更新對OpenAI的非正常死亡訴訟,指控其ChatGPT與死者長時間對話後導致自殺,並揭露該公司爲競爭“縮短安全測試”流程。訴訟暗示可能傳喚逝者親友。
一個即時適應未見任務的自適應大型語言模型框架。
無需訓練的迭代框架,用於長篇故事可視化
多視圖一致性圖像生成的便捷解決方案
基於FLUX.1-dev模型的IP-Adapter,實現圖像工作如文本般靈活。
mratsim
GLM-4.5-Iceblink-v2-106B-A12B-FP8是基於GLM-4.5-Iceblink-v2-106B-A12B模型,採用最先進的混合專家量化方法進行FP8量化的版本。該模型專門針對支持硬件FP8的Ada、Hopper或Blackwell系列GPU優化,在保持高質量輸出的同時顯著提升推理效率。
lichorosario
這是一個基於Qwen-Image模型訓練的LoRA(Low-Rank Adaptation)模型,專門用於文本到圖像的生成任務。該項目使用AI Toolkit訓練,能夠將文本描述轉化為高質量的圖像,支持在多種圖像生成工具中使用。
trinty2535425
這是一個基於Qwen/Qwen-Image基礎模型訓練的圖像到視頻LoRA模型,採用LoRA(Low-Rank Adaptation)技術實現高效微調,可用於AI圖像生成等相關任務
adaptive-classifier
自適應分類器是一個支持持續學習和動態添加類別的文本分類模型,基於ModernBERT-base架構構建,能夠在不重新訓練的情況下適應新的類別和示例。
自適應分類器是一個支持持續學習和動態添加類別的文本分類模型,基於ModernBERT-base構建,能夠在不重新訓練的情況下適應新的類別和數據。
自適應分類器是一個支持持續學習和動態添加類別的文本分類模型,基於ModernBERT-base架構構建,能夠不斷更新模型以適應新數據,靈活應對不同的分類需求。
adamo1139
DeepSeek-R1-0528 671B模型的4位AWQ量化版本,適合在高端GPU節點上使用
NAMAA-Space
Adasah是基於Qwen 2.5 3B模型的微調版本,專為阿拉伯語視覺理解場景優化,支持阿拉伯語視覺問答與圖片內容理解。
AdamLucek
基於Wan2.1-T2V-14B文本轉視頻模型的LoRA適配器,專門用於生成古書插畫風格的視頻內容
支持持續學習和動態類別擴展的文本分類模型
基於ModernBERT微調的法律領域句子嵌入模型,支持多層次維度輸出,適用於法律文本相似度計算和信息檢索任務。
AdamCodd
基於YOLO架構的輕量化人臉檢測模型,專為高效人臉檢測設計,在WIDERFACE數據集上訓練。
該模型是基於ModernBERT-large微調的LLM路由分類器,用於區分複雜查詢(使用大語言模型)和簡單查詢(使用小語言模型)。
基於多模態擴散變換器(MMDiT)的文本到圖像模型,採用對抗擴散蒸餾(ADD)技術,優化了圖像質量、排版和複雜提示理解,同時減少推理步驟。
基於多模態擴散變換器(MMDiT)的高級文生圖模型,在圖像質量、文字排版和提示詞理解方面有顯著提升
基於AdamLucek/koch_block數據集訓練的動作分塊變換器(ACT)模型,適用於Koch v1.1低成本機器人
atomic-canyon
fermi-bert-1024是一款專門針對核能領域優化的BERT預訓練模型。該模型在維基百科、Books3和美國核管理委員會ADAMS數據庫數據上訓練,特別優化了核能行業的技術術語和監管語言處理能力。在橡樹嶺國家實驗室的Frontier超級計算機上使用128個AMD MI250X GPU訓練10小時,為核能應用提供堅實基礎。
adamdad
KAT是一種採用分組有理科爾莫戈羅夫-阿諾德網絡(GR-KAN)替代傳統Transformer中通道混合器的新型視覺模型,在ImageNet-1k數據集上訓練。
adarksky
基於PyTorch和Diffusers庫的寶可夢圖像生成模型,使用去噪擴散概率模型(DDPM)架構
inceptionai
Jais Adapted 13B是基於Llama-2架構的雙語(阿拉伯語-英語)大語言模型,通過自適應預訓練增強阿拉伯語能力
Higress OPS MCP Server是一個基於Model Context Protocol(MCP)的服務實現,用於配置和管理Higress網關。該項目還提供了一個基於LangGraph和LangChain MCP Adapters的MCP客戶端,通過代理流架構與Higress MCP Server交互。
Adaptive Graph of Thoughts是一個基於Neo4j圖數據庫的智能科學推理框架,通過圖結構實現複雜的科學推理任務,支持與Claude Desktop等AI應用集成。
dap-mcp是一個基於MCP協議的DAP會話管理工具,旨在優化和擴展大型語言模型的上下文窗口,提升調試工作流。
Adamik MCP Server是一個多鏈區塊鏈交互服務器,通過Claude Desktop提供60+條區塊鏈的讀寫操作,支持交易管理、賬戶查詢、質押和代幣交互等功能。
MCP Agent Tool Adapter是一個通過MCP協議實現模塊化工具調用的項目,支持Google ADK和LangGraph兩種代理動態推理工具。
Adamik MCP Server是一個支持60多條區塊鏈網絡的集成服務,通過Claude Desktop提供統一的讀寫接口,實現跨鏈交易管理、賬戶查詢、質押和代幣交互等功能。
一個用於與MediaWiki和WikiBase API交互的自定義MCP適配器,支持獲取和編輯MediaWiki頁面內容。
Adaptive MCP Server是一個先進的AI推理系統,通過多策略推理、即時研究和綜合驗證,為複雜問題提供智能解決方案。
一個實現Model Context Protocol標準的模塊化服務器,提供GitHub、GitLab、Google Maps、內存存儲和Puppeteer網頁自動化等多種工具集成。
Adamik MCP Server是一個多鏈交互服務器,通過Claude Desktop提供60+區塊鏈網絡的讀寫操作,支持交易管理、賬戶查詢、質押和代幣交互等功能。
MCP代理服務器是一個聚合多個MCP資源服務器的中心樞紐,提供統一接口管理資源、工具和提示請求。