python数据分析实例利用爬虫获取数据 - 铜仁市

TUhjnbcbe - 2021/7/23 0:22:00

我们在工作中用到网络上发布的各种信息，如果用搜索引擎查找并整理，需要花费大量时间，现在python能够帮助我们，使用爬虫技术，提高数据查找和整理的效率。

我们来找一个爬虫的案例——抓取求职招聘类网站中的数据。使用环境：win10+python3+JuypterNotebook

第一步：分析网页

要爬取一个网页，首先分析网页结构。

现在很多网站都用Ajax（异步加载）的技术，打开网页，先给你看上面一部分东西，然后剩下的东西再慢慢加载。所以你可以看到很多网页，都是慢慢的刷出来的，或者有些网站随着你的移动，很多信息才慢慢加载出来。这样的网页有个好处，就是网页加载速度特别快。

但这个技术是不利于爬虫的爬取的，我们可以借助chrome浏览器的小工具进行分析，进入网络分析界面，界面如下：

这时候是一片空白，我们刷新一下，就可以看到一系列的网络请求了。

然后我们就开始找可疑的网页资源。首先，图片，css什么之类的可以跳过，一般来说，

铜仁市论坛