2023江苏省赛样题解析-数据挖掘_任务一:特征工程
任务描述
根据dwd库中fact_table2表,将其转换为以下表:第一列为用户id,其余列名为零部件id ,按照cust_key进行顺序排序,保存在hive的dwd.fact_cust_part_machinelearning_data中,然后在hive cli中执行命令desc fact_cust_part_machinelearning 中查询出结果,将SQL语句与执行结果截图粘贴至对应报告中。
1、 字段 类型 中文含义 备注 cust_key double 客户key partkey1 double 用户是否购买过零部件1 若用户购买过该零部件,则值为1,否则为0 partkey2 double 用户是否购买过零部件2 若用户购买过该零部件,则值为1,否则为0 partkey3 double 用户是否购买过零部件3 若用户购买过该零部件,则值为1,否则为0 .....字段 | 类型 | 中文含义 | 备注 |
cust_key | double | 客户key | |
partkey1 |
double
......
......
|