最新研究:事実問題への回答においてAIモデルの精度は低く、GPT-4oの正確率はわずか38.2%
最近のOpenAIによる研究によると、人工知能技術の急速な発展にもかかわらず、最新の言語モデルは事実問題への回答において、期待をはるかに下回る成功率を示しています。この研究では、OpenAI独自のSimpleQAベンチマークテストが使用されました。このテストは、科学、政治、芸術など複数の分野を網羅する4,326個の質問から構成され、各質問には明確な正解が設定されています。2人の独立した審査員による検証の結果、OpenAIの最良モデルであるo1-prev...