RPA自动化办公05——Uibot自动抓取网页数据
阿里云国内75折 回扣 微信号:monov8 |
阿里云国际,腾讯云国际,低至75折。AWS 93折 免费开户实名账号 代冲值 优惠多多 微信号:monov8 飞机:@monov6 |
Python爬虫要对网页文件结构有一定了解而且写程序一点一点把数据弄出来也很麻烦。
但是Uibot爬取数据是很简单的。
全部流程不过几步本次爬取某东手机商品的信息
电商数据爬取
网页长这样随便什么某宝某东搜索商品都有链接手机 - 商品搜索 - 京东热卖 (jd.com)
打开UIbot选择数据抓取
然后会让你选目标
注意在Uibot6.1版本需要电脑显示比例为100%才能用没有100%他会提示你修改了后重启。
注意重启是重启整个Uibot。
然后就是选择你要爬取的元素我这里选取商品价格和名称
然后再选一次跟着流程走就行。可以选择翻页把翻页按钮放上去就行
然后就生成了一条命令
运行后数据在arrayData里面可以测试打印看看。
我后面又打开了一个EXCEL表然后写入报存关闭。整体命令为
然后路径下就会多一个excel表效果还不错
期刊等级查询
这个流程可以运用于任何网页需要密码登陆的也行。比如我爬虫我们学校的期刊分级列表也是一模一样的流程
得到结果表
效果很好而且很迅速我早就想爬这个表了方便自己找期刊但是Python爬虫首先需要能登陆这个网页然后还要一层层找元素太麻烦。
现在用Uibot就很快开发了这个爬虫程序并且实现了虽然它运行时间有点久...