logo

小白学苑PBCP

PBCP, 让大数据竞赛更简单!

2024年重庆_甘肃_安徽等省职业院校技能大赛_大数据应用开发样题解析-模块D:离线数据处理-任务二:离线指标计算

环境说明

Hive 的配置文件位于主节点/opt/module/hive-3.1.2/conf/

Spark 任务在Yarn 上用Client 运行,方便观察日志;

ClickHouse 的jdbc 连接端口8123,用户名/密码:default/123456

命令行客户端(tcp)端口9001;

建议使用gson 解析json 数据。

本任务共有3个子任务组成。单击以下链接,可快速跳转到相应的子任务部分:

子任务1

子任务1描述

1、编写Scala 工程代码,根据dwd 的订单表dwd.fact_order_master,求各省份下单时间为2022 年的支付转化率,并将计算结果按照下述表结构写入clickhouse 的ds_result ......

......

抱歉,只有登录会员才可浏览!会员登录