python爬取指定微博用户并基于微博内容生成词云图
😄程序用途
该程序用来对感兴趣的微博博主进行分析,根据微博内容生成词云图,效果如下:
📌一.爬取指定博主的微博内容
爬虫部分主要利用Requests包爬取相应的信息,感兴趣大家可以自行阅读代码,这里主要介绍词云的生成,就不展开说爬虫程序了~
爬虫全部代码:https://github.com/YUTING0907/pythonTools/tree/main/WeiboCrawler
📌二.根据微博内容生成词云图
1.中文词分割
1 |
|
stop_word_list函数作用是通过jieba分词库进行中文词的分割,然后加载停用词,也就是将一些语气词或者一些不想看到的词语不做统计。
2.词频统计
1 |
|
这段代码的功能是对给定的文本文件进行词频统计并保存统计结果,然后可以读取统计结果并将其转化为字典结构
3.生成图云
1 |
|
这段代码的作用是根据词频数据生成标签云(Tag Cloud),并保存成图片文件,可以将view.jpg背景图片替换为自己喜欢的照片,生成出来的词云形状将是背景图片的形状。
4.主程序
1 |
|
将以上函数合并起来就是整个词云生成程序了~
整体代码:https://github.com/YUTING0907/pythonTools/tree/main/WordCloud
觉得不错的话,支持一根棒棒糖吧 ୧(๑•̀⌄•́๑)૭
wechat pay
alipay
python爬取指定微博用户并基于微博内容生成词云图
http://yuting0907.github.io/posts/4f0d2a06.html