视频课程:PySpark原理深入与编程实战

视频标题: 缓存DataFrame

发布时间:2025-11-27

视频描述

【PySpark原理深入与实战】配套精讲视频
可以在内存中对DataFrame进行持久/缓存,就像RDD一样。PySpark缓存和持久化是用于迭代和交互PySpark应用程序的DataFrame优化技术,以改善作业的性能。当两个都由同一个数据文件支持时,在内存中存储DataFrame所需的空间比存储RDD所需的空间要少得多。