logo

小白学苑PBCP

PBCP, 让大数据竞赛更简单!

2024年福建省大数据应用开发赛项样题解析-模块C:实时数据处理-任务一:实时数据清洗

环境说明

服务端登录地址详见各模块服务端说明。

补充说明:各节点可通过Asbru 工具或SSH 客户端进行SSH 访问;

主节点MySQL 数据库用户名/密码:root/123456(已配置远程连接);

Flink 任务在Yarn 上用per job 模式(即Job 分离模式,不采用Session 模式),方便Yarn 回收资源;

建议使用gson 解析json 数据。


任务要求:编写Scala代码,使用Flink消费Kafka中Topic的数据并进行相应的数据统计计算。

本任务共有三个子任务组成。点击正文链接,可快速跳转到相应子任务实现部分:

子任务1

子任务1描述

1.使用Flink 消费Kafka 中topic 为topic1 的数据,根据数据中不同的表将数据分别分发至kafka 的DWD 层的Topic 中。使用Kafka自带的消费者消费Topic 的前1 条数据,将 ......

......

抱歉,只有登录会员才可浏览!会员登录