Python

Python-疫情期间,用户评论的关键词统计

数据获取

数据来源选自微博“人民日报”帐号自1月15日到2月16日,发布的博文下面的评论,思路图:

爬取过程这里不详细说,后续补充
思路是选择手机web版微博网页,通过使用cookie,先爬取所有博文的微博id(wid),再分别进入每个wid页面,爬取用户评论
举例页面:https://weibo.cn/comment/IuOFwz31O?uid=2803301701&rl=0#cmtfrm

数据样式:

 

数据分析

对所有数据进行遍历,jieba分词,词频统计,绘图等操作

完成图例:

留言