logo

小白学苑PBCP

PBCP, 让大数据竞赛更简单!

2023江苏省赛样题解析-数据挖掘_任务一:特征工程

任务描述

根据dwd库中fact_table2表,将其转换为以下表:第一列为用户id,其余列名为零部件id ,按照cust_key进行顺序排序,保存在hive的dwd.fact_cust_part_machinelearning_data中,然后在hive cli中执行命令desc fact_cust_part_machinelearning 中查询出结果,将SQL语句与执行结果截图粘贴至对应报告中。

1、 字段 类型 中文含义 备注 cust_key double 客户key partkey1 double 用户是否购买过零部件1 若用户购买过该零部件,则值为1,否则为0 partkey2 double 用户是否购买过零部件2 若用户购买过该零部件,则值为1,否则为0 partkey3 double 用户是否购买过零部件3 若用户购买过该零部件,则值为1,否则为0 .....
字段 类型 中文含义 备注
cust_key double 客户key  
partkey1 double ......

......

抱歉,只有登录会员才可浏览!会员登录