发现与 Longlm 相关的最受欢迎的开源项目和工具,了解最新的开发趋势和创新。
【ICML 2024 聚焦论文】长文本大模型或许并不需要那么长:无需微调即可扩展大模型上下文窗口
基于Pytorch和Zeta框架,实现了论文“LLM Maybe LongLM:无需微调即可扩展LLM上下文窗口”中提出的SelfExtend方法。