Python使用Scrapy爬取妹子图

时间:2024年11月01日

/

来源:new371433

/

编辑:本站小编

收藏本文

下载本文

下面小编为大家带来Python使用Scrapy爬取妹子图,本文共3篇,希望能帮助大家!本文原稿由网友“new371433”提供。

篇1:Python使用Scrapy爬取妹子图

前面我们给大家介绍了使用nodejs来爬取妹纸图片的方法,下面我们来看下使用Python是如何实现的呢,有需要的小伙伴参考下吧,

Python Scrapy爬虫,听说妹子图挺火,我整站爬取了,上周一共搞了大概8000多张图片。和大家分享一下。

核心爬虫代码

# -*- coding: utf-8 -*-from scrapy.selector import Selectorimport scrapyfrom scrapy.contrib.loader import ItemLoader, Identityfrom fun.items import MeizituItem class MeizituSpider(scrapy.Spider): name = “meizitu” allowed_domains = [“meizitu.com”] start_urls = ( ‘www.meizitu.com/‘, ) def parse(self, response): sel = Selector(response) for link in sel.xpath(‘//h2/a/@href‘).extract:request = scrapy.Request(link, callback=self.parse_item)yield request pages = sel.xpath(“//div[@class=‘navigation‘]/div[@id=‘wp_page_numbers‘]/ul/li/a/@href”).extract() print(‘pages: %s‘ % pages) if len(pages) >2:page_link = pages[-2]page_link = page_link.replace(‘/a/‘, ‘‘) request = scrapy.Request(‘www.meizitu.com/a/%s‘ % page_link, callback=self.parse)yield request def parse_item(self, response): l = ItemLoader(item=MeizituItem(), response=response) l.add_xpath(‘name‘, ‘//h2/a/text()‘) l.add_xpath(‘tags‘, “//div[@id=‘maincontent‘]/div[@class=‘postmeta. clearfix‘]/div[@class=‘metaRight‘]/p”) l.add_xpath(‘image_urls‘, “//div[@id=‘picture‘]/p/img/@src”, Identity()) l.add_value(‘url‘, response.url) return l.load_item()

项目地址:github.com/ZhangBohan/fun_crawler

以上所述就是本文的全部内容了,希望大家能够喜欢,

篇2:python爬取网站数据保存使用的方法

-12-12Python抓取Discuz!用户名脚本代码

-01-01使用cx_freeze把python打包exe示例

-12-12pymssql ntext字段调用问题解决方法

2014-06-06python实现的udp协议Server和Client代码实例

2013-02-02python创建只读属性对象的方法(ReadOnlyObject)

2014-06-06python网络编程学习笔记(三):socket网络服务器

2014-04-04python多线程抓取天涯帖子内容示例

-12-12python 多线程应用介绍

2013-02-02python中的一些类型转换函数小结

2014-01-01Python群发邮件实例代码

篇3:python爬取网站数据保存使用的方法

最近更 新

python3.3实现乘法表示例

可用于监控 mysql Master Slave 状态的py

python 图片验证码代码

linux下安装easy_install的方法

python基础教程之元组操作使用详解

Python的ORM框架SQLAlchemy入门教程

Python 调用VC++的动态链接库(DLL)

python 算法 排序实现快速排序

Python Trie树实现字典排序

Python程序设计入门(3)数组的使用

热 点 排 行

Python入门教程 超详细1小时学会

python 中文乱码问题深入分析

比较详细Python正则表达式操作指

Python字符串的encode与decode研

Python open读写文件实现脚本

Python enumerate遍历数组示例应

Python 深入理解yield

Python+Django在windows下的开发

python 文件和路径操作函数小结

python 字符串split的用法分享

python使用xmlrpc实例讲解

简单介绍Python中的decode方法的使用

python使用心得之获得github代码库列表

Python中使用tarfile压缩、解压tar归档文件示例

ai怎么使用钢笔工具抠图的方法

下载Python使用Scrapy爬取妹子图(整理3篇)
Python使用Scrapy爬取妹子图.doc
将本文的Word文档下载到电脑,方便收藏和打印
推荐度:
点击下载文档
热门文章
    猜你喜欢
    点击下载本文文档