Scrapy入門的點(diǎn)點(diǎn)滴滴（一）

DesGemini 發(fā)布于2019-07-30 14:25 / 905人閱讀

摘要：從剛開始接觸到使用進(jìn)行爬蟲，經(jīng)歷了許多，不懂的各種百度，硬是從不會進(jìn)步成入門了，抱怨的話不多說，進(jìn)入正題。

從剛開始接觸Python2.7到使用Scrapy1.3進(jìn)行爬蟲，經(jīng)歷了許多，不懂的各種百度，硬是從不會進(jìn)步成入門了，抱怨的話不多說，進(jìn)入正題。

寫這篇文章的目的在于總結(jié)這段時(shí)間學(xué)習(xí)Scrapy的到的一些經(jīng)驗(yàn)

環(huán)境搭建

1、如果在代碼中運(yùn)行命令scrapy crawl sina2出錯(cuò)（如上圖）
   subprocess.CalledProcessError: Command "scrapy crawl sina2" 
   returned non-zero exit status 1
   有可能是：
    1、先將scrapy crawl sina2命令在cmd窗口中測試，如果報(bào)錯(cuò)：
      Fatal error in launcher: Unable to create process using """
    請參考下方第二點(diǎn)
    2、scrapy沒有裝好

2、如果命令行出錯(cuò)
   Fatal error in launcher: Unable to create process using """
   有可能是：
    1、python沒有安裝在c盤的原因，經(jīng)測試我將python27放到除c盤以外都不行
    2、安裝路徑不要有 空格中文之類的字符

3、pip被墻，修改國內(nèi)源方法，可以增加速度（好久沒去測試，不懂還可以用不）
    1、linux或者是Mac的 pip源：
       1、找到vi ~/.pip/pip.conf
       2、修改
       [global]
       index-url = https://pypi.tuna.tsinghua.edu.cn/simple
    2、window的 pip源：
       1、找到C:UsersAdministrator
       2、新建pip文件夾，新建pip.ini文件 填寫以下內(nèi)容
       [global]
       index-url = https://pypi.tuna.tsinghua.edu.cn/simple

4、安裝Scrapy過程中出錯(cuò)：
    ERROR: ‘xslt-config’ 不是內(nèi)部或外部命令，也不是可運(yùn)行的程序 或批處理文件。
    1、在http://pypi.python.org/simple/lxml/下載win10 x64（看系統(tǒng)情況）
       的lxml-2.2.8.win-amd64-py2.7.exe
    2、然后重新打開cmd去pip install Scrapy 解決了此xml的問題了

5、運(yùn)行代碼報(bào)錯(cuò)：
   ImportError: No module named win32api
   解決：
   1、pip install pypiwin32

從一臺電腦快速復(fù)制環(huán)境到另以臺電腦（window）

當(dāng)你在一臺電腦上配置相當(dāng)完全的python開發(fā)環(huán)境之后，想要換一臺同類型的電腦繼續(xù)工作，一想到要從新安裝各類的三方庫，是不是很累，我這里有幾點(diǎn)小建議

1、首先明確需要的安裝的基本東西：
    1、jdk（python需要）
    2、PythonChram（開發(fā)工具）
    3、Python27（python基礎(chǔ)）

2、jdk：
    1、到已安裝電腦的安裝目錄復(fù)制jdk文件夾
    2、拷貝到新電腦你想要存放的目錄（注意目錄不要有中文、特殊字符等）
    3、配置jdk環(huán)境變量，路徑指向你存放的目錄（自行百度）
    說明：jdk安裝完的文件夾，可以直接拷貝應(yīng)用，無需從網(wǎng)絡(luò)上下載然后安裝，比較方便

3、PythonChram：
    1、到已安裝電腦的安裝目錄復(fù)制PythonChram文件夾
    2、拷貝到新電腦你想要存放的目錄（注意目錄不要有中文、特殊字符等）
    3、同時(shí)：也可以打開軟件，將設(shè)置項(xiàng)導(dǎo)出，拷貝到新電腦的軟件上使用，可以省去設(shè)置軟件
    外觀的麻煩事，但是可能有些基礎(chǔ)的配置項(xiàng)就需要重新配置如：
       1、python解釋器的位置
       2、git的路徑

4、Python27：
    1、到已安裝電腦的安裝目錄復(fù)制Python27文件夾
    2、拷貝到新電腦的C盤根目錄（特別注意：放到除C盤之外的目錄可能會出現(xiàn)問題，請自測）
    3、配置環(huán)境變量（指向存放的c盤目錄）
    說明：Python27安裝完的文件夾，可以直接拷貝應(yīng)用，無需從網(wǎng)絡(luò)上下載然后安裝，比較
         方便，而且里面已經(jīng)包含了需要的三方庫，可以省掉用pip安裝的麻煩事情

GPU云服務(wù)器云服務(wù)器 scrapy爬蟲入門滴滴云用誰家的服務(wù)器滴滴云服務(wù)器只廣州的能用嗎點(diǎn)點(diǎn)滴滴

文章版權(quán)歸作者所有，未經(jīng)允許請勿轉(zhuǎn)載,若此文章存在違規(guī)行為，您可以聯(lián)系管理員刪除。

轉(zhuǎn)載請注明本文地址：http://systransis.cn/yun/40701.html

發(fā)表評論

登陸后可評論

0條評論

DesGemini

男|高級講師

我要關(guān)注我要私信

TA的文章

2021年10月最新搬瓦工優(yōu)惠碼/搬瓦工優(yōu)惠套餐/高速線路/新手教程整理

閱讀 733·2021-11-24 10:30
好家伙！Java程序員開發(fā)了一套系統(tǒng)，賣了800萬，成都買了6套房！屬實(shí)是走上人生巔峰了！

閱讀 1269·2021-09-24 09:48
測試工具研發(fā)_腳本（5）：制作略復(fù)雜GUI窗體

閱讀 3085·2021-09-24 09:47
outline和他娘親border兩三事

閱讀 3604·2019-08-29 17:11
我去！又是勇士和騎士？--NBA資訊小程序

閱讀 2886·2019-08-29 15:38
前端開發(fā)者應(yīng)該知道的 CSS 小技巧

閱讀 2282·2019-08-29 11:03
Cookie、Session和LocalStorage

閱讀 3610·2019-08-26 12:15
Vue樹形數(shù)據(jù)處理(js)

閱讀 1023·2019-08-26 10:45

成人国产在线小视频_日韩寡妇人妻调教在线播放_色成人www永久在线观看_2018国产精品久久_亚洲欧美高清在线30p_亚洲少妇综合一区_黄色在线播放国产_亚洲另类技巧小说校园_国产主播xx日韩_a级毛片在线免费

資訊專欄INFORMATION COLUMN

上云采購季！| 2核2G4M爆款云服務(wù)器低至59元/年，更有多臺、長期優(yōu)惠，快來選購！

Scrapy入門的點(diǎn)點(diǎn)滴滴（一）

相關(guān)文章

**基于 Python 的 Scrapy 爬蟲入門：環(huán)境搭建**

Scrapy學(xué)習(xí)（二）入門

scrapy入門

scrapy入門：豆瓣電影top250爬取

**基于 Python 的 Scrapy 爬蟲入門：圖片處理**

發(fā)表評論

0條評論

DesGemini

男|高級講師

TA的文章

2021年10月最新搬瓦工優(yōu)惠碼/搬瓦工優(yōu)惠套餐/高速線路/新手教程整理

好家伙！Java程序員開發(fā)了一套系統(tǒng)，賣了800萬，成都買了6套房！屬實(shí)是走上人生巔峰了！

測試工具研發(fā)_腳本（5）：制作略復(fù)雜GUI窗體

outline和他娘親border兩三事

我去！又是勇士和騎士？--NBA資訊小程序

前端開發(fā)者應(yīng)該知道的 CSS 小技巧

Cookie、Session和LocalStorage

Vue樹形數(shù)據(jù)處理(js)

最新活動

資訊專欄INFORMATION COLUMN

上云采購季！| 2核2G4M爆款云服務(wù)器低至59元/年，更有多臺、長期優(yōu)惠，快來選購！

Scrapy入門的點(diǎn)點(diǎn)滴滴（一）

相關(guān)文章

發(fā)表評論

0條評論

男|高級講師

TA的文章

最新活動

上云采購季！| 2核2G4M爆款云服務(wù)器低至59元/年，更有多臺、長期優(yōu)惠，快來選購！