微信小程序爬虫

  • 1.安装fiddler或其他抓包软件
  • 1.1在tool options里面配置端口8889
  • 1.2安装证书并且配置options
  • 2.安装逍遥模拟器
  • 2.1进bios里打开vt
  • 2.2选择手机
  • 2.3选择合适机型
  • 2.4安装微信
  • 3.安装证书以及代理
  • 3.1先进入小程序
  • 3.2打开设置
  • 3.3打开cmd输入ipconifg
  • 3.4清空fiddler
  • 4.开始抓包


1.安装fiddler或其他抓包软件

微信小程序爬能源相关题目_小程序

1.1在tool options里面配置端口8889

微信小程序爬能源相关题目_爬虫_02

1.2安装证书并且配置options

微信小程序爬能源相关题目_微信爬虫_03


我选择的从所有进程,app爬虫最好选择从remote,我这个选择后没有包;

试过了很多模拟器,最后选择逍遥模拟器

2.安装逍遥模拟器

微信小程序爬能源相关题目_小程序爬虫_04

2.1进bios里打开vt

2.2选择手机

微信小程序爬能源相关题目_爬虫_05

2.3选择合适机型

微信小程序爬能源相关题目_python_06


网络模式选择默认即可

2.4安装微信

由于最新版微信协议的问题会抓不到包,这里采用老版本

先下载

微信小程序爬能源相关题目_微信爬虫_07

  • 选择历史版本
  • 选择7.0以前版本

3.安装证书以及代理

3.1先进入小程序

微信小程序爬能源相关题目_微信爬虫_08

3.2打开设置

微信小程序爬能源相关题目_微信爬虫_09


微信小程序爬能源相关题目_爬虫_10


长按,选择修改网络

微信小程序爬能源相关题目_微信爬虫_11

3.3打开cmd输入ipconifg

微信小程序爬能源相关题目_微信爬虫_12


微信小程序爬能源相关题目_爬虫_13


按本机ipv4地址设置好

并打开手机浏览器,地址栏访问本机ipv4地址

微信小程序爬能源相关题目_微信爬虫_14


微信小程序爬能源相关题目_爬虫_15


选择下面的download the fiddlerrootcertificate,并安装证书

3.4清空fiddler

浏览器地址栏输入www.baidu.com看fiddler能否抓到https的包

微信小程序爬能源相关题目_小程序爬虫_16


m.baidu.com是百度移动端的url,已经抓到了

4.开始抓包

微信小程序爬能源相关题目_小程序爬虫_17


微信小程序爬能源相关题目_小程序_18


已经抓到包了

可以看到请求的url和返回的json

微信小程序爬能源相关题目_小程序爬虫_19


微信小程序爬能源相关题目_微信爬虫_20


完全相符

再次抓包

微信小程序爬能源相关题目_小程序爬虫_21


这样选择

微信小程序爬能源相关题目_爬虫_22


微信小程序爬能源相关题目_小程序_23


经过简单分析,可以写脚本了,已经知道url地址和请求需要的参数

微信小程序爬能源相关题目_python_24


subjectid和name有对应关系,但是每个大的分类都要抓包

if subjectid == "838":
                sb = "锅炉"
            elif subjectid == "839":
                sb = "汽机"
            elif subjectid == "840":
                sb = "电气"
            elif subjectid == "841":
                sb = "控制"
            elif subjectid == "842":
                sb = "安全"
            elif subjectid == "843":
                sb = "环化"
            elif subjectid == "836":
if ques_type == "1":
                qstype = "单选"
            elif ques_type == "2":
                qstype = "多选"
            elif ques_type == "3":
                qstype = "判断"
if level == "1":
                level_content = "简单"
            elif level == "2":
                level_content = "中等"
            elif level == "3":
                level_content = "困难"

分别写了三个脚本,一个是url分别请求获取json并打包。一个是分析json,一个是分析json并分析数据组合到文本。代码已经放到gitee
链接: 微信小程序爬虫 的一次探索.




阿里云国内75折 回扣 微信号:monov8
阿里云国际,腾讯云国际,低至75折。AWS 93折 免费开户实名账号 代冲值 优惠多多 微信号:monov8 飞机:@monov6