AMD聯合IBM與Zyphra推出全球首個全AMD硬件訓練的MoE模型ZAYA1,預訓練14萬億token,性能媲美Qwen3系列,數學推理接近專業版。採用128節點×8張MI300X顯卡集羣,算力達750PFLOPs。創新CCA注意力機制融合卷積與壓縮嵌入,數據採用課程學習從通用到專業領域過渡。後續將發佈優化版本。
IBM宣佈裁員數千人,以聚焦軟件和AI服務,進行戰略重組。裁員影響全球約27萬員工的“個位數百分比”,約2700至5000人。公司稱此舉爲常規人員調整,反映科技行業新趨勢。
IBM推出Granite4.0Nano系列小型AI模型,專爲本地和邊緣推理設計,含8個模型,分350M和1B兩種規模。採用混合SSM與變換器架構,支持基礎和指令模式,基於Apache2.0開源許可,兼容vLLM等流行運行時,提升企業控制力。
IBM發佈Granite4.0Nano系列AI模型,參數規模350萬至15億,強調高效與可及性。模型可在筆記本電腦或瀏覽器本地運行,無需依賴雲計算,支持開發者在普通硬件或邊緣設備構建應用,突破行業依賴雲服務的常規趨勢。
利用LlamaIndex和IBM's Docling實現的RAG技術
IBM Granite 3.1:強大的性能,更長的上下文和更多特性
IBM通過光學技術突破,將光速帶入生成性AI時代。
IBM Granite 3.0模型,高效能AI語言模型
Etherll
Tashkeel-350M-v2 是一個專門為阿拉伯語文本標音設計的模型,擁有3.5億參數。該模型基於ibm-granite/granite-4.0-h-350m模型,在Misraj/Sadeed_Tashkeela數據集上進行微調訓練而成,能夠自動為阿拉伯語文本添加正確的音標符號。
DevQuasar
本項目是基於IBM Granite-4.0-h-350m模型的量化版本,致力於讓知識為每個人所用。該模型是一個高效的文本生成模型,經過量化優化後具有更小的模型體積和更快的推理速度。
mlx-community
Granite-4.0-H-1B-8bit 是 IBM Granite 系列的小型語言模型,專門針對 Apple Silicon 芯片優化,採用 8 位量化技術,參數量為 1B,具有高效推理和低資源消耗的特點。
unsloth
Granite-4.0-H-350M是IBM開發的輕量級指令模型,具有350M參數,在多語言處理和指令遵循方面表現出色,專為設備端部署和研究場景設計。
onnx-community
Granite-4.0-1B是IBM開發的輕量級指令模型,基於Granite-4.0-1B-Base微調而成。該模型結合了開源指令數據集和內部合成數據集,採用監督微調、強化學習和模型合併等技術開發,適合設備端部署和研究用例。
Granite-4.0-350M是IBM開發的輕量級指令模型,基於Granite-4.0-350M-Base微調而成。該模型結合了開源指令數據集和內部合成數據集,採用監督微調、強化學習和模型融合等技術開發,具備強大的指令跟隨能力,特別適合設備端部署和研究場景。
ibm-granite
Granite-4.0-350M-Base是IBM開發的輕量級僅解碼器語言模型,專為資源受限設備設計,支持多語言文本生成和代碼補全功能。
Granite-4.0-350M是IBM開發的輕量級指令模型,基於Granite-4.0-350M-Base微調而成。該模型結合了開源指令數據集和內部合成數據集,採用監督微調、強化學習和模型合併技術開發,具備強大的指令跟隨能力和工具調用功能。
Granite-4.0-1B-Base是IBM開發的輕量級僅解碼器語言模型,專為資源受限設備設計,支持多語言文本生成和代碼補全功能。
Granite-4.0-1B是IBM開發的輕量級指令模型,基於Granite-4.0-1B-Base進行微調,結合了開源指令數據集和內部合成數據集,採用監督微調、強化學習和模型合併技術開發而成。
Granite-4.0-H-350M-Base是IBM開發的輕量級僅解碼器語言模型,專門為資源受限設備設計,支持多語言文本生成和代碼補全功能,可在智能手機或物聯網設備上高效運行。
Granite-4.0-H-350M是IBM開發的輕量級指令模型,基於Granite-4.0-H-350M-Base微調而成。該模型結合了開源指令數據集和內部合成數據集,採用監督微調、強化學習和模型合併等多種技術開發,具備強大的指令跟隨能力和多語言支持。
Granite-4.0-H-1B-Base是IBM開發的輕量級僅解碼器語言模型,專為資源受限設備設計,支持多語言文本生成和代碼補全功能。
Granite-4.0-H-1B是IBM Granite團隊開發的輕量級指令模型,基於Granite-4.0-H-1B-Base模型,通過監督微調、強化學習和模型融合等技術優化得到。該模型具有強大的指令遵循能力,適合設備端部署和研究用例。
ethicalabs
ethicalabs/granite-4.0-h-small-base-MLX是基於IBM Granite-4.0-H-Small-Base模型轉換而來的MLX格式版本,專門為Apple MLX框架優化,提供高效的文本生成能力。
IBM Granite-4.0-H-Tiny模型的5-bit量化版本,專為蘋果硅芯片優化。採用Mamba-2與軟注意力混合架構,結合混合專家模型(MoE),在保持高質量的同時實現高效推理。
IBM Granite-4.0-H-Tiny是經過蘋果硅芯片優化的混合Mamba-2/Transformer模型,採用3位量化技術,專為長上下文、高效推理和企業使用而設計。該模型結合了Mamba-2架構和專家混合技術,在保持表達能力的同時顯著降低內存佔用。
這是IBM Granite-4.0-h-Tiny模型的4位量化版本,專為Apple Silicon優化,使用MLX框架進行高效推理。模型經過DWQ(動態權重量化)處理,在保持性能的同時顯著減小模型大小。
bartowski
本項目是對IBM Granite的granite-4.0-h-small模型進行量化處理後的成果,提供多種量化版本選擇,能在不同硬件條件下平衡模型質量和資源佔用,滿足不同用戶的使用需求。
這是IBM Granite-4.0-H-Tiny模型的GGUF量化版本,使用llama.cpp進行多種精度量化處理,在保證性能的同時顯著減少模型存儲空間和計算資源需求,便於部署和運行。
該項目實現了一個可定製的MCP服務器,用於執行RTE協議,支持多種終端類型和SSL連接,提供Java工具類方便擴展功能。
IBM i MCP服務器是一個基於Model Context Protocol的服務器,為IBM i系統提供SQL工具、監控和自動化功能,支持多種客戶端集成和容器化部署
本項目構建了一個基於IBM Watsonx.ai的檢索增強生成(RAG)服務器,使用ChromaDB進行向量索引,並通過模型上下文協議(MCP)暴露接口。該系統能夠處理PDF文檔並基於文檔內容回答問題,實現了將大型語言模型與特定領域知識相結合的智能問答功能。
MCP服務器提供IBM雲工具供LLM使用
本項目是一個基於IBM Watsonx.ai和MCP協議的Python聊天機器人服務器,提供醫療諮詢功能,支持通過Flask構建Web界面,實現症狀診斷和個性化問候。
該項目是CData為IBM Cloud Object Storage開發的只讀MCP服務器,通過JDBC驅動將雲存儲數據轉換為關係型SQL模型,使LLM(如Claude Desktop)能夠通過自然語言查詢即時數據。