谷歌AI推全面基準測試CardBench:具有20多個真實數據庫和數千個查詢
現代關係數據庫中,基數估計(CE)技術對於優化查詢執行計劃至關重要,直接影響到查詢效率和數據庫性能。傳統的基數估計方法基於簡化假設,常在複雜查詢預測上表現不佳,而學習型CE模型能提供更準確預測,但面臨訓練時間長、需大量數據和缺乏系統評估的問題。爲解決這一挑戰,Google研究團隊推出了CardBench基準測試框架,集成了超過20個真實世界數據庫和數千個查詢,支持三種主要設置:基於實例的模型、零樣本模型和微調模型。CardBench不僅提供數據統計計算工具、SQL查詢生成和註釋查詢圖創建功能,還包含訓練數據集,用於評估不同學習型CE模型性能。通過CardBench,微調模型在性能評估中展現出色,即使在少量訓練數據下也能達到與傳統方法相當的準確性,這爲實際應用提供了可能,推動了學習型基數估計領域的進步。