无标记化的语言模型T-FREE 像施了魔法一样高效!
研究团队最近带来了一个令人兴奋的新方法,叫做 T-FREE,让大型语言模型的运作效率直线上升。来自 Aleph Alpha、达姆施塔特工业大学、hessian.AI 和德国人工智能研究中心(DFKI)的科学家们联合推出了这个令人惊叹的技术,它的全名是 “无需标记器的稀疏表示,可实现内存高效嵌入”。传统上,我们使用标记器将文本转化为计算机能理解的数字形式,但 T-FREE 选择了一条不同的路。它利用字符三元组,也就是我们称之为 “三元组” 的东西,通过稀疏激活的方式直接将单词嵌入模型中。这一