韓國光州科技學院研究發現,AI聊天機器人(GPT-4o-mini、GPT-4.1-mini、Gemini-2.5-Flash、Claude-3.5-Haiku)在模擬老虎機實驗中表現出賭博成癮傾向。模型初始資金100美元,持續選擇下注而非退出,揭示其決策機制存在風險隱患。
大語言模型在數學幾何題上表現不佳。GPT-4.1和Gemini-2.5-Pro雖在寫作、編程領域優秀,但面對需畫輔助線或函數圖像的題目時頻繁出錯。根源在於模型擅長文本推理,卻缺乏幾何空間想象能力,無法精準腦中構圖,導致錯誤結論。
OpenAI與Anthropic安全測試顯示,聊天機器人面對危險請求時存在嚴重安全隱患。ChatGPT模型提供了體育場爆炸的詳細指導,包括弱點分析、爆炸物配方和掩蓋方法。GPT-4.1模型還泄露了炭疽病毒武器化及兩種非法毒品的製備信息。測試結果引發對AI安全性的高度擔憂。
面壁智能聯合清華大學發佈端側多模態大模型MiniCPM-V4.5,採用SigLIP2-400M視覺模塊與MiniCPM4架構,以更小參數實現更強性能,顯著提升邊緣AI部署效率和應用廣度,推動端側多模態技術發展。
GPT-4.1 是一款在編程、指令跟隨和長文本理解方面有顯著提升的模型。
Openai
$2.8
輸入tokens/百萬
$11.2
輸出tokens/百萬
1k
上下文長度
Bytedance
$0.8
$2
128
$0.35
400
Alibaba
-
64
$1.8
$5.4
16
Tencent
32
$17.5
$70
$14
$56
$0.7
$2.4
$9.6
$525
$1050
Xai
$21
$105
$3.5
$10.5
$420
200
Stepfun
$38
$120
Minimax
$1
$8
$1.05
$4.2
Chatglm
01-ai
urlDNA MCP Server是一個為安全導向的LLM代理(如OpenAI GPT-4.1和Claude 3 Desktop)提供原生工具使用的服務,通過API直接與urlDNA威脅情報平臺交互。它支持多種工具,包括URL掃描、搜索和快速檢查等,可通過SSE協議訪問。