歡迎來到【AI日報】欄目!這裏是你每天探索人工智能世界的指南,每天我們爲你呈現AI領域的熱點內容,聚焦開發者,助你洞悉技術趨勢、瞭解創新AI產品應用。新鮮AI產品點擊瞭解:https://app.aibase.com/zh1、吊打GPT-5.5!Hy-Memory在多個測試集上表現優異,顯著提升了記憶密度和處理效率,並提供了多種配置以適應不同需求。
階躍星辰發佈並開源新一代Flash模型Step 3.7 Flash,專爲智能體生產化落地設計。該模型採用196B參數的稀疏混合專家架構,針對代碼編寫、聯網搜索及多模態工作流進行系統級優化,最高生成速度達每秒400 Tokens,顯著提升高頻場景效率,標誌着國內大模型賽道取得新突破。
蘋果正與谷歌合作,採用一款1.2萬億參數的定製大型語言模型,作爲下一代Siri的核心升級。該模型參數規模遠超當前主流移動端模型(如Gemini 3.5 Flash的3000億參數),引發業界高度關注。
谷歌正對搜索引擎進行重大改革,旨在將傳統關鍵詞搜索升級爲更智能、互動的體驗。新推出的“智能搜索框”由Gemini 3.5 Flash模型驅動,支持對話式交互,使搜索平臺成爲生成式AI工具的入口,類似與聊天機器人交流。
基於谷歌Gemini 2.5 Flash模型的免費AI圖像編輯與生成工具
Gemini 2.0 Flash-Lite 是高效的語言模型,專為長文本處理和多種應用場景優化。
FlashVideo 是一個高效的高分辨率視頻生成模型,專注於細節和保真度的流動。
Gemini 2.0 是谷歌推出的最新一代生成式 AI 模型,包含 Flash、Flash-Lite 和 Pro 版本。
Google
$0.49
輸入tokens/百萬
$2.1
輸出tokens/百萬
1k
上下文長度
Openai
$2.8
$11.2
Xai
$1.4
$3.5
2k
$7.7
$30.8
200
-
Anthropic
$105
$525
$0.7
$7
$35
$17.5
$21
Alibaba
$1
$10
256
$6
$24
$2
$20
$4
$16
Baidu
128
Bytedance
$1.2
$3.6
4
TeichAI
本模型是基於Qwen3-4B架構的知識蒸餾模型,通過約5440萬個由Gemini 2.5 Flash生成的標記進行訓練,旨在整合Gemini-2.5 Flash的行為、推理過程和知識到單一數據集中。
Mungert
基於RWKV-7架構的輕量級語言模型,採用flash-linear attention格式,具備多語言支持和深度思考能力,適用於文本生成任務。
基於RWKV-7架構的多語言文本生成模型,擁有29億參數,支持英語、中文、日語、韓語、法語、阿拉伯語、西班牙語和葡萄牙語等多種語言,採用flash-linear attention格式,適用於高質量的文本生成任務。
FlashVL
FlashVL是一種優化視覺語言模型(VLMs)以用於即時應用的新方法,旨在實現超低延遲和高吞吐量,同時不犧牲準確性。
基於flash-linear attention格式的RWKV-7模型,支持多語言文本生成任務。
RWKV
採用閃存線性注意力(flash-linear attention)格式的RWKV-7模型,支持英語文本生成任務。
fla-hub
這是一個採用flash-linear注意力格式的RWKV-7模型,參數量為0.45B,支持多種語言的文本生成任務,具有65,536的大詞彙量。
nvidia
NVIDIA NeMo Canary Flash 是一個多語言多任務語音模型,支持英語、德語、法語和西班牙語的自動語音識別和翻譯任務。
基於Flash線性注意力機制的RWKV-7 g1模型,支持多語言處理並具備深度思考能力
NVIDIA NeMo Canary Flash 是一個多語言多任務模型家族,在多個語音基準測試中實現了最先進的性能。支持四種語言的自動語音識別和翻譯任務。
sdadas
基於sdadas/polish-roberta-large-v2改進的波蘭語重排序模型,採用RankNet損失函數訓練,支持Flash Attention 2加速
timpal0l
基於Mistral-7B-v0.1的預訓練延續模型,使用瑞典論壇Flashback的40GB文本數據進行微調,支持多語言生成。
一個基於Gemini Flash 2 AI模型的數據分析與研究MCP服務器,提供數據解析、智能分析、報告生成和郵件自動發送功能。
一個基於TypeScript的MCP服務器實現,通過直接調用Google Gemini API集成Gemini模型,支持最新Gemini 2.0 Flash模型並保持對話上下文。
一個基於Google Gemini模型的AI圖像生成MCP服務器,支持智能模型選擇(Flash快速生成和Pro高質量4K生成)、多種寬高比控制、文件管理和模板功能,提供生產級圖像生成能力。
一個基於Gemini Flash 2 AI模型的數據分析與研究MCP服務器,提供數據解析、統計分析、研究報告生成和郵件自動發送功能。
一個基於Gemini Flash 2 AI模型的數據分析與研究MCP服務器,提供數據解析、AI分析、可視化報告和郵件自動發送功能
LLM Gateway是一個基於MCP協議的服務器,支持高級AI代理(如Claude 3.7)將任務智能委託給成本更低的LLM模型(如Gemini Flash),實現成本優化和性能平衡。