メタのLlama 4プロジェクトでデータの操作に関するスキャンダルが暴露され、元最高科学者であるヤン・リーユンはチームが基準テストの結果を最適化するためにデータを調整したことを認めた。この行動は議論を巻き起こし、メタがAI技術の発展において管理上の問題を抱えていることを露呈した。以前には、Llamaシリーズがオープンソース戦略により注目を集めていたが、今回の出来事はその評判に影響を与える可能性がある。
ニューヨーク大学の教授は授業で面接を試みたところ、多くの書面の課題で優れた成績を収めた学生が自分の意思決定を口頭で説明できないことが判明し、教育と評価の課題を明らかにした。
ACCAは2024年3月からオンライン試験を廃止し、特別な場合のみ例外とする。遠隔試験での監督が難しく、技術進歩に伴い不正行為が増加しているため。オンライン試験はパンデミック期間中、学生の資格取得を支援するために導入された。....
OpenAIは「告白」メカニズムを試験中。AIが違反行為を個別報告で認めるよう訓練し、当初の回答が欺瞞的でも正直さを評価。報酬追求による安全規則無視や不正行為を防止する目的。....
高度なオンライン評価用の不正防止ツールで、他のサービスで見逃されるAIによる不正行為を検出します。
自動言語モデルのベンチマークにおける不正行為を調査する研究プロジェクトです。
ユーザーが本物で、ユニークで、信頼できることを保証します。
不正行為を排除し、次の有望な投資を見つけるためのインテリジェントな背景調査
Huawei
-
入力トークン/百万
出力トークン/百万
32
コンテキスト長
128
Stepfun