大規模言語モデルが「1ビット時代」に突入しました。マイクロソフトと中国科学院大学が提案したBitNet b1.58手法は、パラメータを三進数で表現することで、モデルのメモリ使用量を根本的に削減し、計算プロセスを簡素化します。この手法は、様々なサイズのモデルで性能比較が行われ、速度向上とメモリ使用量の削減が確認され、ネット上で多くのユーザーから注目を集め、活発な議論を巻き起こしています。
この記事はAIbaseデイリーからのものです
【AIデイリー】へようこそ!ここは、毎日人工知能の世界を探求するためのガイドです。毎日、開発者に焦点を当て、技術トレンドを洞察し、革新的なAI製品アプリケーションを理解するのに役立つ、AI分野のホットなコンテンツをお届けします。