交通大数据分析项目（Hadoop + Hive数仓 + Spark SQL + Superset）

综合运行大数据分析和可视化技术，对某城市地面交通刷卡数据（公交及地铁）进行OD分析，以找出客流潮汐特征，并结合经纬度图坐标在地图上展示OD线路。

项目流程

项目流程说明如下：

注：此项目可定制化改造，增加/修改如下功能

本项目适合以下人员学习使用：

1. 数据采集

本项目以文件形式和数据库形式，提供公交刷卡数据集、地铁刷卡数据集、公交站点数据、地铁站点数据。

2. 大数据清洗

使用Spark对大数据进行清洗，包括去重、错误数据处理、空值处理、属性转换、属性提取、数据整合等数据预处理任务。

3. 大数据分析

使用Spark SQL对用户出行OD进行分析。

4. 大数据ETL

使用Spark ETL技术将分析结果导出到MySQL数据库中。

5. 大数据可视化

使用Superset，展示分析结果。

如果您是会员，并申请了终身会员权限，可下载本项目所有源码和测试数据。

您还未登录！(正式会员登录后可下载)

请点击下方链接，选择要播放的讲解视频。(注：正式用户登录方可观看全部项目视频)

小白学苑