小白爬蟲scrapy第四篇

cnio 發(fā)布于2019-07-30 15:15 / 3109人閱讀

摘要：沒有做具體數(shù)據(jù)處理了直接把他們保存為數(shù)據(jù)了很長(zhǎng)很長(zhǎng)一段眼花下一篇是如何去保存在數(shù)據(jù)庫中

在上篇中沒有說到啟動(dòng)如何去啟動(dòng),scrapy是使用cmd命令行去啟動(dòng)的
咱們用scrapy的cmdline去啟動(dòng)
命名point.py

# 導(dǎo)入cmdline 中的execute用來執(zhí)行cmd命令
from scrapy.cmdline import execute
# 執(zhí)行cmd命令參數(shù)為[ scrapy, 爬蟲, 爬蟲名稱]
execute(["scrapy", "crawl", "AiquerSpider"])

這個(gè)文件放在項(xiàng)目根目錄下
如圖:

如果各位同學(xué)按照我的前面幾篇的步驟寫完的話可以用這個(gè)去測(cè)試一下(把部分代碼注釋去了),你會(huì)發(fā)現(xiàn)有好多神秘的藍(lán)色鏈接,哇啊啊啊啊!!!!!我的右手在燃燒!!!!!!!

先在咱們?nèi)ケ４鏀?shù)據(jù)吧!我這幾天寫項(xiàng)目需求寫到崩潰就不去做具體數(shù)據(jù)處理了,直接貼代碼

# -*- coding: utf-8 -*-

# Define your item pipelines here
#
# Don"t forget to add your pipeline to the ITEM_PIPELINES setting
# See: http://doc.scrapy.org/en/latest/topics/item-pipeline.html
import json

class AiquerPipeline(object):
    def __init__(self):
        # 打開文件
        self.file = open("data.json", "w", encoding="utf-8")

    def process_item(self, item, spider):
        # 讀取item中的數(shù)據(jù)
        line = json.dumps(dict(item), ensure_ascii=False) + "
"
        # 寫入文件
        self.file.write(line)
        # 返回item
        return item

        # 該方法在spider被開啟時(shí)被調(diào)用。
        def open_spider(self, spider):

            pass

        # 該方法在spider被關(guān)閉時(shí)被調(diào)用。
        def close_spider(self, spider):

            pass

在運(yùn)行這個(gè)東西之前是要注冊(cè)的,回到settings.py里面找到Configure item pipelines,將下面的注釋去掉就行了,咱們沒有具體需求所以不用改優(yōu)先級(jí)別

# Configure item pipelines
# See http://scrapy.readthedocs.org/en/latest/topics/item-pipeline.html
ITEM_PIPELINES = {
    "AiQuer.pipelines.AiquerPipeline": 300,
}

AiQuer.pipelines.AiquerPipeline是為你要注冊(cè)的類，右側(cè)的’300’為該P(yáng)ipeline的優(yōu)先級(jí)，范圍1～1000，越小越先執(zhí)行。
沒有做具體數(shù)據(jù)處理了,直接把他們保存為json數(shù)據(jù)了,很長(zhǎng)很長(zhǎng)一段眼花
下一篇是如何去保存在數(shù)據(jù)庫中

云服務(wù)器 GPU云服務(wù)器第四篇 scrapy 爬蟲爬蟲scrapy scrapy爬蟲

文章版權(quán)歸作者所有，未經(jīng)允許請(qǐng)勿轉(zhuǎn)載,若此文章存在違規(guī)行為，您可以聯(lián)系管理員刪除。

轉(zhuǎn)載請(qǐng)注明本文地址：http://systransis.cn/yun/41140.html

發(fā)表評(píng)論

登陸后可評(píng)論

0條評(píng)論

cnio

男|高級(jí)講師

我要關(guān)注我要私信

TA的文章

C/C++游戲項(xiàng)目詳細(xì)教程：《黃金礦工》

閱讀 1899·2021-11-11 16:55
Captura – 免費(fèi)錄屏軟件安裝體驗(yàn) 可選擇安裝版或便攜版

閱讀 2112·2021-10-08 10:13
html+css 實(shí)現(xiàn)導(dǎo)航欄文字居中

閱讀 757·2019-08-30 11:01
你不知道的CSS

閱讀 2171·2019-08-29 13:19
CSS 選擇器

閱讀 3296·2019-08-28 18:18
業(yè)務(wù)，程序員都是怎么做好的

閱讀 2633·2019-08-26 13:26
Javascript事件循環(huán)機(jī)制以及渲染引擎何時(shí)渲染UI

閱讀 590·2019-08-26 11:40
ES6—字符串模板引擎（4）

閱讀 1882·2019-08-23 17:17

成人国产在线小视频_日韩寡妇人妻调教在线播放_色成人www永久在线观看_2018国产精品久久_亚洲欧美高清在线30p_亚洲少妇综合一区_黄色在线播放国产_亚洲另类技巧小说校园_国产主播xx日韩_a级毛片在线免费

資訊專欄INFORMATION COLUMN

上云采購(gòu)季！| 2核2G4M爆款云服務(wù)器低至59元/年，更有多臺(tái)、長(zhǎng)期優(yōu)惠，快來選購(gòu)！

小白爬蟲scrapy第四篇

相關(guān)文章

scrapy入門

**小白爬蟲scrapy第一篇**

**小白爬蟲scrapy第二篇**

**小白爬蟲scrapy第三篇**

發(fā)表評(píng)論

0條評(píng)論

cnio

男|高級(jí)講師

TA的文章

C/C++游戲項(xiàng)目詳細(xì)教程：《黃金礦工》

Captura – 免費(fèi)錄屏軟件安裝體驗(yàn) 可選擇安裝版或便攜版

html+css 實(shí)現(xiàn)導(dǎo)航欄文字居中

你不知道的CSS

CSS 選擇器

業(yè)務(wù)，程序員都是怎么做好的

Javascript事件循環(huán)機(jī)制以及渲染引擎何時(shí)渲染UI

ES6—字符串模板引擎（4）

最新活動(dòng)

資訊專欄INFORMATION COLUMN

上云采購(gòu)季！| 2核2G4M爆款云服務(wù)器低至59元/年，更有多臺(tái)、長(zhǎng)期優(yōu)惠，快來選購(gòu)！

小白爬蟲scrapy第四篇

相關(guān)文章

發(fā)表評(píng)論

0條評(píng)論

男|高級(jí)講師

TA的文章

最新活動(dòng)

上云采購(gòu)季！| 2核2G4M爆款云服務(wù)器低至59元/年，更有多臺(tái)、長(zhǎng)期優(yōu)惠，快來選購(gòu)！