前OpenAI首席科学家Andrej Karpathy利用AI技术对2015年Hacker News的930条讨论进行自动评分,实验展示了AI分析历史公共表达的能力,并引发对未来网络讨论质量的思考。
AI专家Andrej Karpathy在访谈中指出,当前智能体如Claude和Codex虽令人惊叹,但距离真正实用还需十年。它们更像缺乏经验的多模态实习生,AGI成熟度仍待提升。
特斯拉前高管Andrej Karpathy评论开源OCR论文时提出,图像可能比文本更适合作为大语言模型的输入方式。他认为当前文本token输入效率低下,建议未来研究转向图像输入,这一观点在AI社区引发热议。
OpenAI联合创始人Andrej Karpathy认为,当前AI智能体仍处早期阶段,预计需十年才能成熟。他指出现有智能体功能有限、智能水平不足,缺乏多模态能力,无法操作电脑或持续学习,且记忆用户信息能力欠缺。
深入理解语言模型中的标记化过程
Karpathy推出的用于BPE算法的简洁代码项目
onnx-community
nanochat-d32是一个轻量级聊天模型,专门针对ONNX运行时进行了优化,提供了高效的文本生成能力。该模型基于karpathy的nanochat-d32模型转换而来,支持在JavaScript环境中运行。
rhysjones
该模型源自karpathy的llm.c项目,为研究bfloat16性能而转换为HuggingFace格式,训练过程消耗了1500亿token。
karpathy
该模型是一个基于transformers库的模型,具体用途和功能需要进一步信息确认。
在FineWeb-EDU数据集上训练的GPT-2模型,展现自然语言处理能力