视频课程:PySpark原理深入与编程实战
视频标题: 缓存DataFrame
发布时间:2025-11-27
视频描述
【PySpark原理深入与实战】配套精讲视频
可以在内存中对DataFrame进行持久/缓存,就像RDD一样。PySpark缓存和持久化是用于迭代和交互PySpark应用程序的DataFrame优化技术,以改善作业的性能。当两个都由同一个数据文件支持时,在内存中存储DataFrame所需的空间比存储RDD所需的空间要少得多。
课程章节 返回课程首页
-
Ch01 Spark架构与集群搭建
-
Ch02 开发和部署PySpark程序
-
Ch03 PySpark核心编程
-
Ch04 PySpark SQL编程(初级)
-
Ch05 PySpark SQL编程(高级)
-
Ch06 PySpark结构化流处理(初级)
-
Ch07 PySpark结构化流处理(高级)
-
ch08 PySpark大数据分析综合案例