日日操夜夜添-日日操影院-日日草夜夜操-日日干干-精品一区二区三区波多野结衣-精品一区二区三区高清免费不卡

公告:魔扣目錄網(wǎng)為廣大站長提供免費(fèi)收錄網(wǎng)站服務(wù),提交前請做好本站友鏈:【 網(wǎng)站目錄:http://www.ylptlb.cn 】, 免友鏈快審服務(wù)(50元/站),

點(diǎn)擊這里在線咨詢客服
新站提交
  • 網(wǎng)站:51998
  • 待審:31
  • 小程序:12
  • 文章:1030137
  • 會員:747

本篇代碼提供者: 青燈教育-巳月老師


本次亮點(diǎn):

1、系統(tǒng)分析目標(biāo)網(wǎng)頁

2、html標(biāo)簽數(shù)據(jù)解析方法

3、海量數(shù)據(jù)一鍵保存

環(huán)境介紹:

  • Python/ target=_blank class=infotextkey>Python 3.8
  • pycharm 2021專業(yè)版 >>> 激活碼
  • requests >>> pip install requests
  • parsel >>> pip install parsel

代碼實(shí)現(xiàn):

  1. 發(fā)送請求 (訪問網(wǎng)站)
  2. 獲取數(shù)據(jù) 網(wǎng)頁源代碼
  3. 解析數(shù)據(jù) (網(wǎng)頁構(gòu)造, css樣式選擇器)
  4. 保存數(shù)據(jù)

代碼

導(dǎo)入模塊

import requests     # 發(fā)送請求 第三方模塊(基于urllib開發(fā)模塊) 額外安裝 pip install 模塊名
import parsel       # 解析數(shù)據(jù)模塊 第三方模塊 額外安裝 pip install 模塊名
import csv          # 內(nèi)置模塊 不需要你額外安裝

偽裝

# 偽裝 請求頭 request headers
headers = {
    # 用戶基本信息, 沒有登陸信息
    'Cookie': 'fvlid=1644577630437PyNsv7r4UeWZ; che_sessionid=6033453E-99CD-4D18-9EC6-26D8D81CB82E%7C%7C2022-02-11+19%3A07%3A13.352%7C%7C0; sessionid=1510cb04-9fdd-428f-82f7-d7b77ccae016; area=430103; sessionip=175.0.63.33; sessionvisit=98f1634e-6cbb-4f5e-97f9-6af88e5b8d33; sessionvisitInfo=1510cb04-9fdd-428f-82f7-d7b77ccae016|www.autohome.com.cn|100533; Hm_lvt_d381ec2f88158113b9b76f14c497ed48=1650521306; che_sessionvid=6223C48B-0DCD-4485-8DB7-B9A2D39AC7FF; carDownPrice=1; listuserarea=0; UsedCarBrowseHistory=0%3A43390985%2C0%3A43390239%2C0%3A43268434%2C0%3A43010424; userarea=0; ahpvno=23; Hm_lpvt_d381ec2f88158113b9b76f14c497ed48=1650523580; ahuuid=46A0D5A6-5C39-4735-A5CE-3F6DA42672C9; showNum=52; v_no=36; visit_info_ad=6033453E-99CD-4D18-9EC6-26D8D81CB82E||6223C48B-0DCD-4485-8DB7-B9A2D39AC7FF||-1||-1||36; che_ref=www.autohome.com.cn%7C0%7C100533%7C0%7C2022-04-21+14%3A46%3A20.424%7C2022-02-11+19%3A55%3A59.495; sessionuid=1510cb04-9fdd-428f-82f7-d7b77ccae016',
    # 瀏覽器基本信息
    # 源碼、解答、教程有需要可以口裙:8321刪57862
    'User-Agent': 'Mozilla/5.0 (windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/100.0.4896.127 Safari/537.36'
}
# z = 1, y = 2
url = 'https://www.che168.com/china/list/'

發(fā)送請求

# 1. 發(fā)送請求 (訪問網(wǎng)站)
# # 打印
# print(url)
# 發(fā)送請求 方式
response = requests.get(url=url, headers=headers)

獲取數(shù)據(jù)

# 2. 獲取數(shù)據(jù) 網(wǎng)頁源代碼
html_data = response.text

解析數(shù)據(jù)

# 3. 解析數(shù)據(jù) (網(wǎng)頁構(gòu)造, css樣式選擇器)
# 數(shù)據(jù)分析
# 網(wǎng)站開發(fā)   >>> 都有
# 人工智能
# html(存儲數(shù)據(jù)) + css(樣式) + js(可以實(shí)現(xiàn)動態(tài)的效果)
# <div class="viewlist_ul">
#       車輛信息
# </div>
# <div>
#     車主信息... 
# 源碼、解答、教程有需要可以口裙:8321刪57862
# </div>
# <img />
selector = parsel.Selector(html_data)
# python 數(shù)據(jù)容器 列表 [1,3,4,5,6]
# 我要用別名去取值
lis = selector.css('.viewlist_ul li')
for li in lis:
    card_name = li.css('.card-name::text').get()
    cards_unit = li.css('.cards-unit::text').get()
    price = li.css('.pirce em::text').get()
    img_url = 'https:'+li.css('.img-box img::attr(src)').get()
    if price == None or price == "":
        price = li.css('.pirce::text').get()
    print(card_name, cards_unit, price, img_url)

保存數(shù)據(jù)

    # 4. 保存數(shù)據(jù)
    with open('汽車之家.csv', mode='a', encoding='utf-8', newline='') as f:
        csv_writer = csv.writer(f)
        csv_writer.writerow([card_name, cards_unit, price, img_url])

尾語

好了,我的這篇文章寫到這里就結(jié)束啦!

有更多建議或問題可以評論區(qū)或私信我哦!一起加油努力叭(? •_•)?

喜歡就關(guān)注一下博主,或點(diǎn)贊收藏評論一下我的文章叭?。。?/p>

分享到:
標(biāo)簽:采集
用戶無頭像

網(wǎng)友整理

注冊時間:

網(wǎng)站:5 個   小程序:0 個  文章:12 篇

  • 51998

    網(wǎng)站

  • 12

    小程序

  • 1030137

    文章

  • 747

    會員

趕快注冊賬號,推廣您的網(wǎng)站吧!
最新入駐小程序

數(shù)獨(dú)大挑戰(zhàn)2018-06-03

數(shù)獨(dú)一種數(shù)學(xué)游戲,玩家需要根據(jù)9

答題星2018-06-03

您可以通過答題星輕松地創(chuàng)建試卷

全階人生考試2018-06-03

各種考試題,題庫,初中,高中,大學(xué)四六

運(yùn)動步數(shù)有氧達(dá)人2018-06-03

記錄運(yùn)動步數(shù),積累氧氣值。還可偷

每日養(yǎng)生app2018-06-03

每日養(yǎng)生,天天健康

體育訓(xùn)練成績評定2018-06-03

通用課目體育訓(xùn)練成績評定