视频课程:Spark原理深入与编程实战

视频标题: (2022)RDD编程案例_合并小文件

发布时间:2025-11-27

视频描述

在使用Hadoop时,经常会遇到小文件问题。当系统中有大量小文件时,读写这些小文件会遇到严重的性能问题。使用Spark,使用SparkContext的wholeTextFiles()方法和colleasc()方法,可以实现对小文件的合并。