使用scrapy框架完成图片的爬取
一、设置随机请求头中间件
修改middlewares.py中间件内容
1 | import random |
settings.py开启下载中间件
1 | DOWNLOADER_MIDDLEWARES = { |
二、设置随机代理中间件
修改middlewares.py中间件内容
1 | import random |
settings.py开启下载中间件
1 | DOWNLOADER_MIDDLEWARES = { |
爬取数据存入数据库
1 | import pymysql |
修改成爬取异步存储
1 | from pymysql import cursors |
使用selenium+webdriver爬取ajax请求的数据
1 | from selenium import webdriver |
开启selenium+webdriver中间件
1 | DOWNLOADER_MIDDLEWARES = { |