视频名称

缓存DataFrame

视频内容

您还未登录!(正式会员登录可观看)

会员登录

视频简介

【PySpark原理深入与实战】配套精讲视频
可以在内存中对DataFrame进行持久/缓存,就像RDD一样。PySpark缓存和持久化是用于迭代和交互PySpark应用程序的DataFrame优化技术,以改善作业的性能。当两个都由同一个数据文件支持时,在内存中存储DataFrame所需的空间比存储RDD所需的空间要少得多。