微軟研究院推出Fara1.5系列智能體模型,專爲瀏覽器場景設計,包含4B、9B和27B三種參數版本。該模型與MagneticLite沙盒瀏覽器配合,可直接讀取截圖並模擬鼠標鍵盤操作,自動完成網頁任務,提升計算機使用的智能化水平。
谷歌在I/O 2026大會上發佈全新大模型Gemini 3.5 Flash,刷新AI速度紀錄。該模型具備頂級智能體與編程能力,性能媲美旗艦模型,同時保持Flash系列的高速響應優勢。即日起面向全球用戶免費開放,進一步降低使用門檻,推動行業變革。
馬斯克宣佈xAI即將推出Grok新版本,內部代號第9版,基礎模型參數規模達1.5萬億,預計3到4周內發佈。此前Grok4.X系列雖跑分亮眼,但實際表現與OpenAI和Anthropic的差距未明顯縮小,馬斯克此舉意在加速追趕AI編程賽道。
小米MiMo在全球最大AI模型API聚合平臺OpenRouter上登頂全球調用量榜首,成爲首個獲此成就的國產大模型。近一個月,MiMo貢獻1.45萬億Token調用量,在300多個模型中脫穎而出。其端雲協同架構設計帶來高推理效率和低成本,實用性優先的定位獲全球開發者認可。生態上,Nous Research已與小米合作,MiMo系列全面接入增長最快的開源生態。
Skywork o1 Open系列模型,提升複雜問題解決能力
Google
$0.49
輸入tokens/百萬
$2.1
輸出tokens/百萬
1k
上下文長度
Openai
$2.8
$11.2
Xai
$1.4
$3.5
2k
$7.7
$30.8
200
Anthropic
$105
$525
$21
Alibaba
$1
$10
256
$6
$24
-
$2
$20
$4
$16
Baidu
128
$15.8
$12.7
64
$3.9
$15.2
Bytedance
$0.8
prithivMLmods
Olmo-3-Think是艾倫人工智能研究所推出的完全開源的語言模型系列,包含7B和32B兩種規模。該模型經過專門訓練,能夠展現明確的推理鏈,支持透明的逐步推理和可檢查的中間思維痕跡,在推理、數學和代碼任務中表現出色。
allenai
Olmo 3是由Allen Institute for AI開發的新一代語言模型系列,包含7B和32B兩種規模,有指令和思考兩種變體。該模型基於Dolma 3數據集進行預訓練,在Dolci數據集上進行後訓練,具備長鏈式思維能力,在數學和編碼等推理任務上表現優異。
Olmo 3是由Allen Institute for AI開發的開源語言模型系列,包含7B和32B兩種規格,分為指令(Instruct)和思考(Think)兩種變體。該模型具有出色的長鏈思維能力,能夠顯著提升數學和編碼等推理任務的表現。
Olmo 3 7B RL-Zero Mix是Allen AI開發的7B參數規模的語言模型,屬於Olmo 3系列。該模型在Dolma 3數據集上進行預訓練,在Dolci數據集上進行後訓練,並通過強化學習優化數學、編碼和推理能力。
Olmo 3是由Allen Institute for AI開發的全新7B參數語言模型系列,基於Transformer架構,在Dolma 3數據集上訓練,旨在推動語言模型科學發展。模型提供Base、Instruct和Think等多種變體,支持最長65,536的上下文長度。
openai
GPT-OSS系列是OpenAI推出的開放權重模型,專為強大的推理能力、智能體任務和多樣化開發者用例設計。該模型能有效解決複雜問題,提供靈活高效的使用體驗,支持Apache 2.0開源許可證。
GPT-OSS系列是OpenAI發佈的開放權重模型,專為強大推理、智能體任務和多樣化開發者用例設計。120B版本擁有1170億參數(其中51億為活躍參數),適用於生產環境和需要高推理能力的場景。
Doctor-Shotgun
基於Llama-3.3-70B-Instruct構建的Magnum最終迭代版本,合併多個rsLoRA微調版本,模擬Claude 3 Sonnet/Opus系列模型的文風和質量。
apple
OpenELM是由蘋果公司推出的高效語言模型系列,採用分層縮放策略優化參數分配,提供270M至3B不同規模的預訓練及指令調優模型。
OLMo 2 1B是艾倫人工智能研究所推出的開放語言模型系列中最小的模型,基於OLMo-mix-1124預訓練,並在中期訓練階段使用Dolmino-mix-1124數據集。
Isotr0py
Ovis2-1B是多模態大語言模型(MLLM)Ovis系列的最新成員,專注於視覺與文本嵌入的結構對齊,具有小模型高性能、強化推理能力、視頻與多圖處理以及多語言OCR增強等特性。
OLMo 2 32B是艾倫人工智能研究院(AI2)推出的開放語言模型系列中規模最大的32B參數模型,基於Apache 2.0許可開源,支持英語語言處理。
Delta-Vector
Rei-12B是一個旨在復現Claude 3系列模型(特別是Sonnet和Opus)文筆質量的大語言模型,基於Mistral-Nemo-Instruct進行微調,支持長上下文和角色扮演。
Rei-12B是一個旨在復現Claude 3系列模型(特別是Sonnet和Opus)散文質量的大語言模型,基於Mistral-Nemo-Instruct微調而成
Skywork
Skywork o1開放模型系列中的7B參數規模模型,基於Qwen2.5-Math-7B-Instruct訓練,具備漸進式過程獎勵增強的推理能力
amd
AMD-OLMo是由AMD在AMD Instinct™ MI250 GPU上從頭開始訓練的10億參數語言模型系列,包括預訓練模型、監督微調模型和基於直接偏好優化(DPO)的對齊模型。該系列模型基於OLMo架構,在Dolma數據集上進行預訓練,並在多個指令數據集上進行微調。
anthracite-org
Magnum-v4-12b 是一個旨在復現Claude 3模型(特別是Sonnet和Opus)散文質量的系列模型。
馬格南v4-22B是基於Mistral-Small-Instruct-2409微調的大型語言模型,專門致力於復刻Claude 3系列模型(尤其是Sonnet和Opus)的文本質量。該模型提供了GGUF量化版本,支持32K上下文長度,在多個高質量數據集上進行訓練。
這是一個基於Mistral-Large-Instruct-2407微調的模型,旨在復刻Claude 3系列模型(特別是Sonnet和Opus)的散文質量。
v2.5 KTO是一款專注於文本生成的模型,旨在復刻Claude 3系列模型(尤其是Sonnet和Opus)的散文質量。支持包括中文、英文、法文等多種語言。
DiffuGen是一個先進的本地圖像生成工具,集成了MCP協議,支持多種AI模型(包括Flux和Stable Diffusion系列),可直接在開發環境中生成高質量圖像。它提供了靈活的配置選項、多GPU支持,並可通過MCP協議與多種IDE集成,同時提供OpenAPI接口供外部調用。