樂天發佈首款日本大語言模型Rakuten AI 2.0
樂天集團宣佈推出其首個日本大語言模型(LLM)和小語言模型(SLM),命名爲Rakuten AI2.0和Rakuten AI2.0mini。這兩款模型的發佈旨在推動日本的人工智能(AI)發展。Rakuten AI2.0基於混合專家(MoE)架構,是一款8x7B 的模型,由八個各自擁有70億參數的模型組成,每個模型充當一個專家。每當處理輸入的 token 時,系統會將其發送給最相關的兩個專家,由路由器負責選擇。這些專家和路由器不斷通過大量的高質量日英雙語數據進行聯合訓練。Rakuten AI2.0mini 則是一款全新的、參數量爲15億的稠密模型,專爲