2024年重庆_甘肃_安徽等省职业院校技能大赛_大数据应用开发样题解析-模块B:数据采集-任务二:实时数据采集
本任务共有两个子任务组成:
子任务1
子任务1描述
1、在主节点使用Flume 采集实时数据生成器25001 端口的socket 数据(实时数据生成器脚本为主节点/data_log 目录下的gen_ds_data_to_socket 脚本,该脚本为Master 节点本地部署且使用socket 传输),将数据存入到Kafka的Topic 中(Topic 名称为ods_mall_log,分区数为2,ZK 关于Kafka 的信息在其/kafka 节点),使用Kafka 自带的消费者消费ods_mall_log(Topic)中的数据,查看Topic 中的前1 条数据的结果,将查看命令与结果完整的截图粘贴至客户端桌面【Release\模块B 提交结果.docx】中对应的任务序号下;
注:需先启动已配置好的Flume再启动脚本,否则脚本将无法成功启动,启动方式为进入/data_log目录执行./gen_ds_data_to_socket (如果没有权限,请执行授权命令chmod 777 /data_log/gen_ds_data_to_socket)
分析: 这 ......
......
抱歉,只有登录会员才可浏览!会员登录