Python系列爬虫之简单分析Chrome浏览器浏览记录

image.png

前言

利用Python简单分析一下Chrome浏览器的网页浏览记录,我们一起愉快的学习吧。

开发工具

Python版本:3.6.4
相关模块:

pyecharts模块;

wordcloud模块;

以及一些Python自带的模块。

DB.Browser版本:3.11.0

环境搭建

关于python:

安装Python并添加到环境变量,pip安装需要的相关模块即可。

关于DB.Browser:

下载地址:

https://github.com/sqlitebrowser/sqlitebrowser/releases

建议下载免安装版本的(相关文件中也提供了免安装版本)。

原理简介

Chrome浏览器的网页浏览历史记录一般保存在:

C:\Users<USERNAME>\AppData\Local\Google\Chrome\UserData\Default\history

利用DB.Browser打开它,发现与历史浏览记录相关的表有urlsvisits

图片

打开观察一下表的结构:

图片
图片

了解了表的结构之后,我们就可以愉快地写代码提取历史浏览记录了:

图片

将获取到的数据进行简单的可视化,结果如下:

图片
图片

看完篇文章喜欢的朋友点个爱心支持一下,关注我每天分享Python数据爬虫案例,下篇文章分享是Python监控比特币价格走势

All done~完整源代码详见个人简介或者私信获取相关文件。。

推荐阅读更多精彩内容