视频课程:PySpark原理深入与编程实战
视频标题: RDD编程案例_合并小文件
发布时间:2025-11-27
视频描述
【PySpark原理深入与实战】配套精讲视频
在使用Hadoop时,经常会遇到小文件问题。当系统中有大量小文件时,读写这些小文件会遇到严重的性能问题。在PySpark中,使用SparkContext的wholeTextFiles()方法和colleasc()方法,可以实现对小文件的合并。
课程章节 返回课程首页
-
Ch01 Spark架构与集群搭建
-
Ch02 开发和部署PySpark程序
-
Ch03 PySpark核心编程
-
Ch04 PySpark SQL编程(初级)
-
Ch05 PySpark SQL编程(高级)
-
Ch06 PySpark结构化流处理(初级)
-
Ch07 PySpark结构化流处理(高级)
-
ch08 PySpark大数据分析综合案例