当前位置:首页 » 《关注互联网》 » 正文

室友单恋班花失败,我爬了一个网站发给他瞬间治愈,男人的快乐就这么简单【每天一遍,忘记初恋】_AI19970205的博客

14 人参与  2021年07月15日 09:03  分类 : 《关注互联网》  评论

点击全文阅读


大家好,我是辣条。

上回我爬了班花的空间发现她喜欢的人是王俊凯,室友算是彻底死了心,跟我大醉一场后郁郁不振至今,作为他的死党(爸比)我很难受(开心),决心让他重新振作。于是毅然爬了一个网站分享给他,才有了今天这篇文章,分享给大家纯粹是技术交流!请大家备好纸巾...呸呸,请大家备好笔纸,今天的学习开始啦!

效果展示

爬取目标

网址:(网站地址不提供了,我求生欲很强了,审核大大手下留情)

【兄弟萌,不是我整活恶心大家,而是不打码过不了,我怀着赤诚之心跟大家交流技术!】 

工具使用

开发环境:win10、python3.7

开发工具:pycharm、Chrome

工具包:requests,lxml,threading

项目思路解析

首页信息为动态加载的数据 数据为动态加载的网页源代码

请求为post请求 传递的参数一个是页面的分类 ,一个是你需要的页数信息

在这里插入图片描述在这里插入图片描述

发送请求获取到json数据里的网页源代码 在通过xpath的方式提取出图片的详情页面地址 以及图片对应的名字

在这里插入图片描述

    response = requests.post(url, headers=headers, data=data).json()
    print(response)
    html_data = etree.HTML(response['data'])
    href_list = html_data.xpath('//div[@class="post-module-thumb"]//a/@href')
    name_list = html_data.xpath('//div[@class="post-module-thumb"]//img/@alt')
请求详情页面的地址获取详细数据信息 

在这里插入图片描述 提取到对应图片地址 保存对应图片数据

简易源码分享

#!/usr/bin/env python
# -*- coding: utf-8 -*-
# @File    : 萌妹子.py
import os
​
import requests
from lxml import etree
import threading
​
headers = {
    'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/91.0.4472.124 Safari/537.36'
}
​
​
def get_img(href_list, name_list):
    for href, name in zip(href_list, name_list):
        res = requests.get(href, headers=headers)
        # print(res.text)
        html = etree.HTML(res.text)
        img_url_list = html.xpath('//div[@class="entry-content"]/p/img/@src')
        num = 0
        for img_url in img_url_list:
            result = requests.get(img_url).content
            path = '图片'
            if not os.path.exists(path):
                os.mkdir(path)
​
            f = open(path + '/' + name.replace(':', '').replace(':', '') + str(num) + '.jpg', 'wb')
            f.write(result)
            num += 1
            print('正在下载{}第{}张图片'.format(name, num))
​
​
def get_data(url, data):
    response = requests.post(url, headers=headers, data=data).json()
    print(response)
    html_data = etree.HTML(response['data'])
    href_list = html_data.xpath('//div[@class="post-module-thumb"]//a/@href')
    name_list = html_data.xpath('//div[@class="post-module-thumb"]//img/@alt')
​
    get_img(href_list, name_list)
​
​
if __name__ == '__main__':
    for i in range(1, 4):
        data = {
            'index': '1',
            'post_paged': str(i)
        }
        url = '网站地址不提供,想用来技术学习可以私信我拿'
        t1 = threading.Thread(target=get_data, args=(url, data))
        t1.start()

最好的爱情是双向奔赴,祝大家有情人终成眷属,单身狗们早日脱单!

PS:欢迎大家在评论中交流技术,辣条意在让编程变的更有趣学起来更轻松,不低俗不媚俗不违法违纪,学习新思想,争做新青年


点击全文阅读


本文链接:http://m.zhangshiyu.com/post/23374.html

图片  地址  数据  
<< 上一篇 下一篇 >>

  • 评论(0)
  • 赞助本站

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。

最新文章

  • 迟迟白日晚全书+后续(路星延宋栀年)_(迟迟白日晚全书+后续)迟迟白日晚全书+后续列表_笔趣阁(路星延宋栀年)
  • 兰因絮果,爱恨全如玉碎全书+后续+结局(谢长乐肖风行)列表_兰因絮果,爱恨全如玉碎(谢长乐肖风行)兰因絮果,爱恨全如玉碎全书+后续+结局在线
  • 从此星辰远,归途似海深人气节选(璃月龙影)全书免费_(璃月龙影)从此星辰远,归途似海深人气节选后续(璃月龙影)
  • 全文你来时风起云涌番外+(陆翊夏天瑜赵歆)列表_全文你来时风起云涌番外+
  • 人面兽小说精彩节选免费试读_小浩言语小蕊爆款小说高能章节试读
  • 你来时风起云涌免费(陆翊夏天瑜赵歆)
  • 四海八荒苦封喉,君心似毒酒结局+番外+后续看点十足(洛虞玄澈)_四海八荒苦封喉,君心似毒酒结局+番外+后续看点十足(洛虞玄澈)洛虞玄澈免费列表_笔趣阁(洛虞玄澈)
  • 「错宠假千金,全京城权贵暴虐侯府」章节多结局预体验‌_沈轻漾楚珩完结版免费在线阅读
  • 画地为牢(池念谢宴清)_画地为牢(池念谢宴清)
  • 完结文往梦难复温列表_完结文往梦难复温(沈淮霆宋思予)
  • 画地为牢结局+番外(池念谢宴清)_(画地为牢结局+番外)列表_笔趣阁(池念谢宴清)
  • 霜华染鬓情难守免费(苏绮萝霍霆渊)全书浏览_霜华染鬓情难守免费全书浏览

    关于我们 | 我要投稿 | 免责申明

    Copyright © 2020-2022 ZhangShiYu.com Rights Reserved.豫ICP备2022013469号-1