OpenAI元チーフサイエンティストAndrej KarpathyがAIを用いて2015年のHacker News議論930件を自動採点。AIによる過去の公開発言分析可能性を示し、将来のネット議論の質について考察を促す。....
AI専門家であるAndrej Karpathy氏はインタビューで、現在のエージェントであるClaudeやCodexは驚くべきものだが、実際に使えるようになるにはまだ10年かかると指摘した。これらは経験不足のマルチモーダルなインターンに近いものであり、AGIの成熟度はさらに向上すべきである。
テスラ元幹部Andrej Karpathyが、画像を大規模言語モデルの入力としてテキストより適切と指摘。テキストトークンの非効率性を問題視し、画像入力への転換を提案。AIコミュニティで議論呼ぶ。....
OpenAIの共同創設者であるAndrej Karpathyは、現在のAIエージェントがまだ初期段階にあり、成熟するには10年かかると予測している。彼は現在のエージェントの機能が限定的で、知能レベルが不十分であり、マルチモーダル能力がなく、コンピュータを操作したり、継続的に学習したり、ユーザー情報を記憶したりする能力が欠如していると指摘している。
言語モデルにおけるトークナイゼーションのプロセスを深く理解する
Karpathyが発表した、BPEアルゴリズムのための簡潔なコードプロジェクト
onnx-community
nanochat-d32は軽量チャットモデルで、ONNXランタイムに特化して最適化され、効率的なテキスト生成能力を提供します。このモデルはkarpathyのnanochat-d32モデルを変換したもので、JavaScript環境での実行をサポートしています。
rhysjones
このモデルはkarpathyのllm.cプロジェクトに由来し、bfloat16性能研究のためにHuggingFace形式に変換され、1500億トークンを消費してトレーニングされました。
karpathy
このモデルはtransformersライブラリに基づくモデルで、具体的な用途と機能はさらなる情報確認が必要です。
FineWeb-EDUデータセットで訓練されたGPT-2モデル。自然言語処理能力を示す。