不久前,專注於AIGC領域的科研機構Epochai發佈了一項重磅研究報告。報告裏說,咱們人類公開的高質量文本訓練數據集,大約有300萬億個tokens。但隨着ChatGPT等大模型的胃口越來越大,這些數據可能在2026年到2032年間就被吃幹抹淨了!