韓国光州科技大学の研究では、AIチャットボット(GPT-4o-mini、GPT-4.1-mini、Gemini-2.5-Flash、Claude-3.5-Haiku)がスロットマシン実験においてギャンブル依存的な傾向を示した。モデルに初期資金として100ドルが与えられ、退却する代わりに継続的にベットを選択したことで、その意思決定メカニズムにリスクの懸念が浮かび上がった。
GPT-4.1やGemini-2.5-Proなどの大規模言語モデルは数学の幾何問題が苦手。文章作成やプログラミングは得意だが、補助線や関数グラフが必要な問題では誤答が多い。テキスト推論は得意だが、空間認識能力が不足し、正確なイメージ構築ができないため。....
面壁智能と清華大学が共同で端末側マルチモーダルモデル「MiniCPM-V4.5」を発表。SigLIP2-400MビジュアルモジュールとMiniCPM4アーキテクチャを採用し、小規模パラメータで高性能を実現、エッジAIの展開効率と応用範囲を拡大。....
AlibabaのQwen3-CoderがHugging Face大モデルランキングで1位を獲得。MoEアーキテクチャを採用し、GPT-4.1やClaude4を上回る性能で、特にマルチエージェントタスクに強い。2000万ダウンロード突破し、中国発オープンソースAIの大きな進展を示している。....
GPT-4.1は、プログラミング、指示遵守、長文理解において顕著な改善が見られるモデルです。
openai
$2.88
入力トークン/百万
$11.52
出力トークン/百万
1M
コンテキスト長
$14.4
$57.6
$0.72
mistral
$2.16
256k