Nvidiaは、pandasをGPU上で実行でき、パフォーマンスを最大150倍向上させるというRAPIDS cuDFの新バージョンを発表しました。
RAPIDS cuDFはApache Arrowを基盤としたPython GPU dataframeライブラリです。この新バージョンのpandas高速化モードにより、修正不要のpandasコードをGPUアクセラレーション環境で実行でき、最大150倍のパフォーマンス向上を実現しました。
新バージョンのRAPIDS cuDFは、cuDF使用時の制限を解消し、CPU/GPUの統一的な体験を提供します。これにより、pandasコードはGPUアクセラレーション環境で変更なしに実行可能です。
ベンチマークテストによると、RAPIDS cuDFで高速化されたpandasは、CPU上のpandasをはるかに凌駕する実行速度を示しました。
この新機能はまもなくNvidia AI Enterpriseに追加される予定です。大規模データ処理にpandasを使い続けたいデータサイエンティストにとって非常に役立つでしょう。