2024年重庆_甘肃_安徽等省职业院校技能大赛_大数据应用开发样题解析-模块B:数据采集-任务二:实时数据采集

本任务共有两个子任务组成:

子任务1

子任务1描述

1、在主节点使用Flume 采集实时数据生成器25001 端口的socket 数据(实时数据生成器脚本为主节点/data_log 目录下的gen_ds_data_to_socket 脚本,该脚本为Master 节点本地部署且使用socket 传输),将数据存入到Kafka的Topic 中(Topic 名称为ods_mall_log,分区数为2,ZK 关于Kafka 的信息在其/kafka 节点),使用Kafka 自带的消费者消费ods_mall_log(Topic)中的数据,查看Topic 中的前1 条数据的结果,将查看命令与结果完整的截图粘贴至客户端桌面【Release\模块B 提交结果.docx】中对应的任务序号下;

注:需先启动已配置好的Flume再启动脚本,否则脚本将无法成功启动,启动方式为进入/data_log目录执行./gen_ds_data_to_socket (如果没有权限,请执行授权命令chmod 777 /data_log/gen_ds_data_to_socket)

分析: 这里需要对出题方提出表扬,因为本次任务描述中,纠正了以往该任务描述中随意而错误的表述语句,细化了一些环境说明,这说明出题方还是听进了老师们频繁反馈的意见,并做出了改进。 不过提醒大家注意的是,出题方这 ......

......

抱歉,只有登录会员才可浏览!会员登录


《Flink原理深入与编程实战》