芝加哥大學研究發現,市面AI文本檢測工具性能差異顯著。研究基於1992篇人類文本(含評論、新聞、小說等六類)及GPT-4等主流模型生成的AI文本進行測試,結果顯示不同檢測工具準確率存在明顯差距,呼籲提升檢測技術可靠性。
德國魯爾大學與馬普所研究發現,傳統搜索引擎與生成式AI在信息呈現上差異顯著。研究對比谷歌自然搜索與四款AI系統(谷歌AI概述、Gemini2.5Flash、GPT-4o等),通過4600餘次查詢測試政治、科技等六大領域,揭示二者在信息來源和內容組織上的本質區別。
韓國光州科技學院研究發現,AI聊天機器人(GPT-4o-mini、GPT-4.1-mini、Gemini-2.5-Flash、Claude-3.5-Haiku)在模擬老虎機實驗中表現出賭博成癮傾向。模型初始資金100美元,持續選擇下注而非退出,揭示其決策機制存在風險隱患。
谷歌計劃今年12月發佈Gemini 3.0 AI模型,延續年底發佈傳統。該版本預計性能顯著提升,將增強谷歌在AI領域的競爭力,被視爲與GPT-4等模型競爭的關鍵轉折點。
聊天機器人AI產品集合,包括GPT-4o, Gemini, Qwen, Deepseek, Claude & Grok。
強大的開源Kimi K2聊天平臺,通過Kimi AI在編程和數學基準測試中超越GPT-4。企業級Kimi AI,成本降低95%。
精選展示 OpenAI GPT-4o 生成的多樣化 AI 藝術圖像與提示。
GPT-4.1 是一款在編程、指令跟隨和長文本理解方面有顯著提升的模型。
openai
$540
輸入tokens/百萬
$1080
輸出tokens/百萬
128k
上下文長度
$2.88
$11.52
1M
$14.4
$57.6
$18
$72
$0.36
400k
$0.72
-
minimax
$1
$8
4M
deepseek
$1.94
$7.92
$216
$432
8.2k
$1.08
$4.32
mistral
$2.16
256k
moonshot
32k
unsloth
GLM-4-32B-0414是擁有320億參數的大語言模型,性能媲美GPT-4o和DeepSeek-V3,支持中文和英語,具備卓越的代碼生成、函數調用和複雜任務處理能力。
GLM-4-32B-0414是GLM家族的新成員,參數規模達320億,性能與GPT-4o、DeepSeek-V3等相當,支持本地部署。
zai-org
GLM-4-32B-Base-0414是GLM家族的新成員,擁有320億參數,在15T高質量數據上進行預訓練,性能可與GPT-4o和DeepSeek-V3等先進模型相媲美。該模型支持便捷的本地部署,在代碼生成、函數調用、搜索式問答等方面表現優異。
GLM-4-32B-0414是GLM家族的新成員,擁有320億參數的高性能大語言模型。該模型在15T高質量數據上進行預訓練,包含大量推理型合成數據,在代碼生成、函數調用、搜索問答等多個任務場景中表現出色,性能可與GPT-4o和DeepSeek-V3等更大規模模型相媲美。
Psychotherapy-LLM
該模型是基於Llama-3.1-8B-Instruct通過偏好學習微調的心理諮詢專用模型,在心理諮詢會話中表現優異,勝率超過GPT-4o。
AtlaAI
Atla Selene Mini 是當前最先進的小型評委語言模型(SLMJ),性能可媲美體積大10倍的模型,在多個基準測試中超越GPT-4o。
openbmb
MiniCPM-o 2.6是一款手機端運行的GPT-4o級多模態大模型,支持視覺、語音與直播流處理
VITA-MLLM
VITA-1.5是一個多模態交互模型,旨在實現GPT-4o級別的即時視覺與語音交互能力。
CISCai
這是Qwen2.5-Coder-32B-Instruct模型的GGUF量化版本,採用先進的重要性矩陣量化方法,在保證模型效果的同時顯著減少存儲和計算資源需求。該模型是當前最先進的開源代碼大語言模型,編碼能力與GPT-4o相當。
c01zaut
MiniCPM-V 2.6是支持單圖、多圖和視頻理解的GPT-4V級別多模態大語言模型,專為RK3588 NPU優化
MiniCPM-V是一個手機端GPT-4V級多模態大語言模型,支持單圖、多圖與視頻理解,具備視覺、光學字符識別等功能。
Sami92
基於XLM-R Large微調的文本分類模型,專門用於識別德語文本中的事實性聲明和非事實性聲明。模型採用弱監督學習方式,先在GPT-4o標註的Telegram數據集上訓練,後在手動標註數據集上繼續訓練,在測試集上達到0.9的準確率。
EmergentMethods
Phi-3-mini-4k-instruct-graph是微軟Phi-3-mini-4k-instruct的微調版本,專門用於從通用文本數據中進行實體關係提取,旨在在生成實體關係圖方面達到與GPT-4相當的質量和準確性。
internlm
InternLM-XComposer2.5是一款卓越的圖文理解與創作模型,僅用7B參數即達到GPT-4V水平,支持24K交錯圖文上下文並可擴展至96K長上下文。
InternLM-XComposer2.5是一款卓越的圖文理解與創作模型,僅以70億參數即可達到GPT-4V級別的能力,支持長上下文窗口擴展。
ruslandev
基於Meta-Llama-3-8B-Instruct微調的語言模型,通過GPT-4o提升數據質量,專注於俄語能力增強,在MT-Bench評估中俄語得分超過GPT-3.5-turbo。
yyupenn
WhyXrayCLIP是一個能夠將X光圖像與文本描述對齊的模型,基於OpenCLIP (ViT-L/14)在MIMIC-CXR數據集上微調,臨床報告由GPT-4處理。
MiniCPM-V 2.6是OpenBMB推出的多模態大模型,在單圖、多圖及視頻理解任務上超越GPT-4V,支持iPad端即時視頻理解。
KomeijiForce
這是一個基於GPT-4蒸餾的多語言判別器,專為評估角色扮演對話中角色回應與預設人格陳述之間的自然語言推理(NLI)關係而設計。
leafspark
WikiChat-v0.2是一個正在訓練的對話模型,基於OpenOrca GPT-4數據、cosmopedia和dolly15k數據集訓練,支持英語文本生成任務。
一個基於FastAPI和GPT-4o的輕量級Excel自動化MCP服務器,支持通過自然語言操作Excel文件。
該項目展示瞭如何將MCP(模型上下文協議)服務器與Pydantic.AI集成,包含天氣服務示例代碼,支持通過不同LLM(如GPT-4和Sonnet)進行交互。
一個通過MCP協議直接查詢OpenAI模型的服務器,支持o3-mini和gpt-4o-mini模型,提供簡潔和詳細的回答。
一個基於GPT-4o-mini模型的圖像分析MCP服務器,可處理URL或本地路徑的圖像內容分析
MCP-ChatBot是一個基於模塊化能力協議(MCP)的聊天機器人應用,通過容器化架構集成天氣服務和GPT-4o模型,提供自然語言交互功能。
該項目是一個基於Model Context Protocol (MCP)的stdio服務器,用於將提示轉發至OpenAI的ChatGPT (GPT-4o),支持高級摘要、分析和推理功能,適用於LangGraph框架的助手集成。
一個基於OpenAI GPT-4o/gpt-image-1模型的圖像生成與編輯工具,支持通過文本提示生成圖像、編輯圖像(如修復、擴展、合成等),併兼容多種MCP客戶端。
一個基於Python 3.13的客戶端項目,集成MCP服務和GPT-4模型,提供交互式工具調用和網絡搜索功能。
一個通過MCP協議與ChatGPT交互的服務器,用於高級文本分析和推理。
一個基於Streamlit的智能聊天機器人,使用GPT-4o自動路由用戶請求到不同工具(如聊天、圖像生成、數據庫查詢、語音合成等),支持快速實驗AI工具路由功能。
MCP Server Whisper是一個基於OpenAI Whisper和GPT-4o模型的音頻處理服務器,提供高級音頻轉錄、格式轉換、批量處理和文本轉語音等功能,通過Model Context Protocol標準實現與AI助手的無縫交互。
urlDNA MCP Server是一個為安全導向的LLM代理(如OpenAI GPT-4.1和Claude 3 Desktop)提供原生工具使用的服務,通過API直接與urlDNA威脅情報平臺交互。它支持多種工具,包括URL掃描、搜索和快速檢查等,可通過SSE協議訪問。
基於Node.js的SSE代理服務器,通過Browserbase API實現GPT-4等模型的即時響應流傳輸
一個基於GPT-4o-mini模型的圖像分析MCP服務器,通過接收圖片URL進行內容識別和描述