2024-2025学年广东省高职“大数据应用开发”赛项样题2-任务B:离线数据处理_解析

环境说明:

补充说明:选手自行启动相关服务,建议使用spark 本地模式运行任务,若虚拟机资源提示不足,可在idea 编写、测试和打包好程序后,关闭idea 编辑器,再使用spark-submit -master local[*]本地模式运行任务
mysql 用户root 密码123456

点击以下链接,快速跳转到相应内容:

环境准备

启动Hadoop集群

hive的操作,需要基于Hadoop集群。因此要先启动Hadoop集群。命令如下:

会员登录


《Flink原理深入与编程实战》