2024年职业院校技能大赛国赛(中职组)_大数据应用与服务赛项_样题解析-模块二:数据获取与处理-任务二:数据标注
任务描述
本任务根据酒店的评论数据对酒店的类型打上标签,并将标签数据保存到指定位置。系统提前设定用户评价活跃阈值,如酒店的用户评价数量大于用户评价活跃阈值,则将该酒店的类型标注为“热门”,否则将该酒店的类型标注为“普通”,具体要求如下:
1、编写python程序读取读取comments.csv的数据,统计每个酒店的用户评价数量。
2、比较酒店的评价数量和用户评价活跃阈值,给该酒店的类型打上指定的标签(热门/普通),然后将打上标签的数据保存到comments_tag.csv中,comments_tag.csv的字段定义如下:
酒店名称 | 评论数量 | 酒店类型 |
---|---|---|
热门/普通 | ||
任务分析
这部分考查的是使用Python对数据进行标注的技术能力。所谓打标签,指的是根据某些数 ......
......
您尚未登录!(正式会员登录可下载)