谷歌DeepMind聯合Kaggle升級Game Arena平臺,新增“狼人殺”和“撲克”兩款遊戲,推動AI測試從邏輯運算轉向社交推理與不確定決策,以更全面評估模型性能。
谷歌與Kaggle聯合推出FACTS基準套件,旨在標準化評估AI模型的事實準確性。該基準針對法律、金融、醫療等對準確性要求高的行業,將“事實性”分爲“上下文事實性”和“世界知識事實性”兩個場景進行綜合評估,填補了當前AI評估體系的空白。
谷歌FACTS團隊與Kaggle聯合發佈FACTS基準測試套件,旨在評估生成式AI模型在企業任務中的事實性和真實性。該框架彌補了現有基準只關注問題解決能力、忽略輸出信息與真實世界數據一致性的缺陷,尤其針對圖像或圖表中的信息嵌入,對法律、金融等關鍵領域尤爲重要。
谷歌整合Colab與KaggleHub,推出數據探索器功能。用戶可直接在Colab筆記本中搜索Kaggle的數據集、模型和競賽,無需切換界面。通過左側工具欄訪問,並利用過濾器按類型或相關性篩選,旨在簡化資源獲取流程,提升使用便捷性。
世界領先的數據科學學習平臺
nvidia
基於Qwen2.5-14B微調的數學推理模型,在AIMO-2 Kaggle競賽中獲得第一名
alexandreacff
該模型是基於asapp/sew-mid-100k在alexandreacff/kaggle-fake-detection數據集上微調的音頻分類模型,用於虛假音頻檢測。
hilmansw
基於ResNet-18微調的貓狗圖像分類模型,在Kaggle貓狗數據集上訓練,準確率達99.29%
DunnBC22
基於Vision Transformer架構的天氣圖像分類模型,在Kaggle天氣數據集上微調,準確率達93.4%
sismetanin
RuBERT-Toxic是基於DeepPavlov的rubert-base-cased模型在俄語有毒評論數據集上微調的文本分類模型,專門用於檢測俄語文本中的有毒內容,在Kaggle俄語有毒評論數據集上取得了92.20%的F1分數。
Kaggle-MCP是一個連接Claude AI與Kaggle API的集成工具,通過MCP協議實現Kaggle平臺功能的AI交互。
該項目是一個基於FastMCP庫構建的Kaggle MCP服務器,提供搜索和下載Kaggle數據集的功能,並能生成EDA筆記本提示。
Kaggle MCP服務器是一個通過Claude等AI助手與Kaggle競賽交互的工具,提供競賽列表、文件下載、結果提交等功能,支持Kaggle API認證和桌面集成。
一個基於NodeJS的Kaggle MCP服務,用於探索數據集和創建筆記本