logo

小白学苑PBCP

PBCP, 让大数据竞赛更简单!

2024年职业院校技能大赛国赛(中职组)_大数据应用与服务赛项_样题解析-模块二:数据获取与处理-任务二:数据标注

任务描述

本任务根据酒店的评论数据对酒店的类型打上标签,并将标签数据保存到指定位置。系统提前设定用户评价活跃阈值,如酒店的用户评价数量大于用户评价活跃阈值,则将该酒店的类型标注为“热门”,否则将该酒店的类型标注为“普通”,具体要求如下:

1、编写python程序读取读取comments.csv的数据,统计每个酒店的用户评价数量。

2、比较酒店的评价数量和用户评价活跃阈值,给该酒店的类型打上指定的标签(热门/普通),然后将打上标签的数据保存到comments_tag.csv中,comments_tag.csv的字段定义如下:

酒店名称 评论数量 酒店类型
    热门/普通
     

任务分析

这部分考查的是使用Python对数据进行标注的技术能力。所谓打标签,指的是根据某些数 ......

......

您尚未登录!(正式会员登录可下载)

会员登录