使用scrapy框架完成图片的爬取
一、项目基础配置
创建项目
1 | scrapy startproject BmwImages |
修改基础配置
1 | * settings中ROBOTSTXT_OBEY |
增加start.py启动爬虫文件
1 | from scrapy import cmdline |
二、爬取图片数据
获取图片类别名称和urls列表
1 | import scrapy |
设置图片管道下载
1 | import scrapy |
settings.py代码
1 | import os |
重写方法设置目录
1 | import os |
使用crawlSpider进行改进,爬取更多图片
1 | # -*- coding: utf-8 -*- |