Skip to content

一个基于关键词爬虫生成词云的网络内容可视化工具,可爬取百度、谷歌、必应、知乎、微博、微信公众平台

Notifications You must be signed in to change notification settings

Sumsky21/Pa-Wordcloud

Repository files navigation

Pa-Wordcloud:基于网络爬虫生成词云的网络内容可视化工具

Background 背景

这是在某高校2019年秋季学期选修课《Python编程与智能车技术》上我与另一名同学合作完成的课程大作业,也算是我首次做这种由想法到实践的程序开发。这个程序可以从六种搜索引擎搜索关键词得到的内容分别制作词云,从而直观的展示这个关键词关键词在网上内容中的面貌。为了方便操作,还给程序加上了图形化的交互界面,提供了许多自定义的选项。

放到github上面,也是作为对这个大作业的一种纪念。

Code 代码

程序的源代码是用python写成的。一共有两个源代码文件,其中pa.py主要实现的是对六种搜索引擎(包括百度、必应、谷歌、搜狗微信(公众平台)搜索、搜狗知乎搜索以及微博内置的搜索)的内容爬取;pic.py则承担了图形化界面、词云生成以及词云图片处理的功能。pa.py作为pic.py的引用库来起作用。

程序使用了python计算生态中大量的第三方库,同时在开发程序的过程中也借鉴了网上的一些思路。

如果想要了解更多关于这个项目的细节,可以阅读仓库中上传的实验报告。

Thanks 致谢

感谢林佬作为这个大作业的合作者,完成了pic.py中的大部分内容;

同时也感谢徐老师对我们这个作业的指导和帮助。

Use&Copy 使用或借鉴

如果想要体验这个程序,在任何安装了python的环境下,将两个源代码文件放在一起,运行pic.py即可(前提是要安装程序运行必须的第三方库)。

CC BY-NC-SA 4.0 协议适用于这个项目。您可以借鉴代码中任何的片段或idea,但是也必须对这样的借鉴可能引起的后果负全部责任。

About

一个基于关键词爬虫生成词云的网络内容可视化工具,可爬取百度、谷歌、必应、知乎、微博、微信公众平台

Topics

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages