视频课程:PySpark原理深入与编程实战

视频标题: 使用流数据源(2)-Kafka

发布时间:2025-11-27

视频描述

【PySpark原理深入与实战】配套精讲视频
Kafka通常用于构建实时流数据管道,以可靠地在系统之间移动数据,还用于转换和响应数据流。Kafka作为集群运行在一个或多个服务器上。
本节包含以下示例:【示例6-6】编写PySpark结构化流程序作为Kafka的消费者程序,将Kafka作为结构化流程序的数据源。