Python爬虫系列（四）（简单）Dota排行榜爬取，并存入Excel表格

阿里云国内75折回扣微信号：monov8

阿里云国际，腾讯云国际，低至75折。AWS 93折免费开户实名账号代冲值优惠多多微信号：monov8 飞机：@monov6

在编写Python程序的时候，有很多库供我们选择，如urllib、requests，BeautifulSoup，lxml，正则表达式等等，使得我们在获取网页源代码或者选择元素的时候很方便，但是库多了，自己纠结症也犯了。。。额。自己今天爬的是对战平台的DOTA排行榜（ps:我在简书看到的一个评论，关于这个网站的，索性自己爬下了-_-），巩固下知识吧。

Python爬虫系列（四）（简单）Dota排行榜爬取，并存入Excel表格_字段

排行榜

1、分析网站

打开开发者工具，我们观察到排行榜的数据并没有在doc里

Python爬虫系列（四）（简单）Dota排行榜爬取，并存入Excel表格_数据_02

doc文档

在Javascript里我么可以看到下面代码：

Python爬虫系列（四）（简单）Dota排行榜爬取，并存入Excel表格_数据保存_03

ajax的post方法异步请求数据

在 XHR一栏里，我们找到所请求的数据

Python爬虫系列（四）（简单）Dota排行榜爬取，并存入Excel表格_数据_04

json存储的数据

请求字段为：

Python爬虫系列（四）（简单）Dota排行榜爬取，并存入Excel表格_数据_05

post请求字段

2、伪装浏览器，并将json数据存入excel里面

Python爬虫系列（四）（简单）Dota排行榜爬取，并存入Excel表格_数据保存_06

获取玩家信息

Python爬虫系列（四）（简单）Dota排行榜爬取，并存入Excel表格_数据保存_07

将数据保存到excel中

3、结果展示

Python爬虫系列（四）（简单）Dota排行榜爬取，并存入Excel表格_字段_08

保存的数据

4、总结

在掌握一些基本的爬虫知识之后，自己想做一些爬虫进阶的实战项目，比如使用一些框架（scrapy、pyspider等）、还有使用代理池等等。还有很多知识要学习自己加油吧。

阿里云国内75折回扣微信号：monov8

阿里云国际，腾讯云国际，低至75折。AWS 93折免费开户实名账号代冲值优惠多多微信号：monov8 飞机：@monov6

标签: python

返回列表

上一篇：卡特兰数

下一篇：c++中stack、queue、vector的用法

“Python爬虫系列（四）（简单）Dota排行榜爬取，并存入Excel表格” 的相关文章

在外打工好久不回老家，用python为家里贴上新年春联1年前 (2023-02-02)

Python基础知识进阶之正则表达式1年前 (2023-02-02)

聊天没有表情包被嘲讽，程序员直接用python爬取了十万张表情包1年前 (2023-02-02)

Python学习笔记-PyQt6工具栏1年前 (2023-02-02)

Python+Yolov5人脸口罩识别1年前 (2023-02-02)

【Python】sklearn机器学习之DBSCAN聚类_dbscan聚类算法 sklearn1年前 (2023-02-02)

Python经典编程习题100例：第71例：输出学生记录1年前 (2023-02-02)

Python的自定义函数———总结分析，详细讲解自定义函数，带实例1年前 (2023-02-02)

Python NumPy 拆分数组1年前 (2023-02-02)

Python开发Web扫描器实战1年前 (2023-02-02)