一次簡(jiǎn)陋的爬蟲(chóng)

張紅新發(fā)布于2019-07-30 15:42 / 1615人閱讀

摘要：所以有了下面這段程序有時(shí)會(huì)亂碼解析返回的是一個(gè)列表黎海威三個(gè)參數(shù)第一個(gè)為文本內(nèi)容，第二個(gè)設(shè)置文本格式，第三個(gè)設(shè)置編碼景順長(zhǎng)城滬深增強(qiáng)基金經(jīng)理有變動(dòng)，已不是黎海威請(qǐng)查收。

最近因?yàn)橹Ц秾毸土宋覀€(gè)紅包，可以買(mǎi)基金，又看了一些基金的文章，想買(mǎi)點(diǎn)基金玩玩，在知乎上看到這樣一篇文章:

其實(shí)如果是長(zhǎng)期定投，用簡(jiǎn)單的方法篩選即可：

晨星近5年、近3年評(píng)級(jí)為五星；
天天的業(yè)績(jī)排名近3年、2年、1年、6個(gè)月的業(yè)績(jī)都為優(yōu)秀；
基金經(jīng)理人在近3年無(wú)更換。

然后我就想及時(shí)知道我買(mǎi)的基金的經(jīng)理人有沒(méi)有換，并發(fā)郵件來(lái)用通知我。所以有了下面這段程序

import requests 
from bs4 import BeautifulSoup

url = "http://fund.eastmoney.com/000311.html?spm=search"
request = requests.get(url)
request.encoding = "utf-8" #有時(shí)會(huì)亂碼
result = request.text
html = BeautifulSoup(result,"lxml") #解析
titel = html.select_one("#body div.fundDetail-main > div.fundInfoItem > div.infoOfFund td:nth-of-type(3) a")  #select返回的是一個(gè)列表
name = titel.get_text().strip()
print(name)

if name != "黎海威":
    import smtplib
    from email.mime.text import MIMEText
    from email.header import Header
    # 三個(gè)參數(shù)：第一個(gè)為文本內(nèi)容，第二個(gè) plain 設(shè)置文本格式，第三個(gè) utf-8 設(shè)置編碼
    msg = MIMEText("景順長(zhǎng)城滬深300增強(qiáng)(000311)：基金經(jīng)理有變動(dòng)，已不是黎海威！請(qǐng)查收。", "plain", "utf-8")
    # 輸入Email地址和口令:
    from_addr = "[email protected]"
    password = "XXX"
    # 輸入SMTP服務(wù)器地址:
    smtp_server = "smtp.163.com"
    # 輸入收件人地址:
    to_addr = "[email protected],[email protected]"
     
    msg["From"] = from_addr
    msg["To"] = to_addr
    msg["Subject"] = "基金經(jīng)理變更"
    
    server = smtplib.SMTP(smtp_server, 25) # SMTP協(xié)議默認(rèn)端口是25
    server.set_debuglevel(1)
    server.login(from_addr, password)
    server.sendmail(from_addr, to_addr.split(","), msg.as_string())  ##發(fā)給多個(gè)人
    server.quit()

第二版：爬取多個(gè)基金

#====================================第二版=========================================  
import requests 
from bs4 import BeautifulSoup
#郵件
import smtplib
from email.mime.text import MIMEText
from email.header import Header
  
names_pc=[] #爬蟲(chóng)下來(lái)的名字
fundnames = ["景順長(zhǎng)城滬深300增強(qiáng)(000311)","興全滬深300指數(shù)(LOF)(163407)"]
names_pass = ["黎海威", "申慶"]
stock_code = ["000311","163407"]

urls =[]
for i in stock_code:
    url = "http://fund.eastmoney.com/"+str(i)+".html?spm=search"
    urls.append(url)


for url in urls:
    request = requests.get(url)
    request.encoding = "utf-8" #有時(shí)會(huì)亂碼
    result = request.text
    html = BeautifulSoup(result,"lxml") #解析
    titel = html.select_one("#body div.fundDetail-main > div.fundInfoItem > div.infoOfFund td:nth-of-type(3) a")  #select返回的是一個(gè)列表,用select的話(huà)用[0]可以
    name = titel.get_text().strip()
    print(name)
    names_pc.append(name)
    
print(names_pc)   

from_addr = "[email protected]"
password = "XXXX"
smtp_server = "smtp.163.com"  # 輸入SMTP服務(wù)器地址:
to_addr = "[email protected],[email protected]" # 輸入收件人地址:

for name_pc,name_pass,fundname in zip(names_pc,names_pass,fundnames):
    if name_pc != name_pass:
        text = "{}：基金經(jīng)理有變動(dòng)，已不是{}！請(qǐng)查收".format(fundname,name_pass)
        msg = MIMEText(text, "plain", "utf-8")
        msg["From"] = from_addr
        msg["To"] = to_addr
        msg["Subject"] = "基金經(jīng)理變更"  ##主題
        server = smtplib.SMTP(smtp_server, 25) # SMTP協(xié)議默認(rèn)端口是25
        server.set_debuglevel(1)
        server.login(from_addr, password)
        server.sendmail(from_addr, to_addr.split(","), msg.as_string())  ##發(fā)給多個(gè)人
        server.quit()

定時(shí)任務(wù)

既然已經(jīng)寫(xiě)好程序了，當(dāng)然希望它每天能跑，然后我就去阿里云租了臺(tái)服務(wù)器
輸入crontab -e來(lái)執(zhí)行定時(shí)任務(wù)，注意上面的程序在阿里云上需要將smtplib.SMTP函數(shù)改成smtplib.SMTP_SSL來(lái)執(zhí)行才能跑通

0  10  *  *  *  /usr/bin/python3 /home/admin/fund/fundchange2email_v1.py > /home/admin/fund/fund.log

再ctrl+x保存并退出

云服務(wù)器 GPU云服務(wù)器最近一次的登錄時(shí)間 js一次刪除選中的多條數(shù)據(jù) 爬蟲(chóng)的英文免費(fèi)的爬蟲(chóng)

文章版權(quán)歸作者所有，未經(jīng)允許請(qǐng)勿轉(zhuǎn)載,若此文章存在違規(guī)行為，您可以聯(lián)系管理員刪除。

轉(zhuǎn)載請(qǐng)注明本文地址：http://systransis.cn/yun/41414.html

發(fā)表評(píng)論

登陸后可評(píng)論

0條評(píng)論

張紅新

男|高級(jí)講師

我要關(guān)注我要私信

TA的文章

Python腳本——信手拈來(lái)的自動(dòng)化測(cè)試工具

閱讀 2904·2021-11-17 09:33
Forrester預(yù)測(cè)，2022 年將是邊緣、物聯(lián)網(wǎng)和網(wǎng)絡(luò)技術(shù)融合的一年

閱讀 3686·2021-11-16 11:42
#萬(wàn)圣節(jié)#DediPath：特價(jià)美國(guó)獨(dú)立服務(wù)器 $39/月起，VPS全場(chǎng)5折優(yōu)惠

閱讀 3508·2021-10-26 09:50
怎么設(shè)置云主機(jī)端口-服務(wù)器主機(jī)名跟端口怎么設(shè)置？

閱讀 1363·2021-09-22 15:49
SvenHost：德國(guó)服務(wù)器促銷(xiāo)/E3/16G/2x 2 TB HDD/1Gbps月流量10TB/$

閱讀 3057·2021-08-10 09:44
react下移動(dòng)端可吸附懸浮窗，懸浮球，懸浮按鈕，支持拖動(dòng)拖拽功能

閱讀 3697·2019-08-29 18:36
css實(shí)現(xiàn)二維碼掃碼框

閱讀 3957·2019-08-29 16:43
CSS 實(shí)現(xiàn)元素較寬不能被完全展示時(shí)將其隱藏

閱讀 2236·2019-08-29 14:10

成人国产在线小视频_日韩寡妇人妻调教在线播放_色成人www永久在线观看_2018国产精品久久_亚洲欧美高清在线30p_亚洲少妇综合一区_黄色在线播放国产_亚洲另类技巧小说校园_国产主播xx日韩_a级毛片在线免费

資訊專(zhuān)欄INFORMATION COLUMN

上云采購(gòu)季！| 2核2G4M爆款云服務(wù)器低至59元/年，更有多臺(tái)、長(zhǎng)期優(yōu)惠，快來(lái)選購(gòu)！

一次簡(jiǎn)陋的爬蟲(chóng)

相關(guān)文章

給新手的Python微博爬蟲(chóng)

【zzzmh個(gè)人博客】一枚Java程序的個(gè)人建站之路 (干貨)

NodeJs爬蟲(chóng)抓取古代典籍，共計(jì)16000個(gè)頁(yè)面心得體會(huì)總結(jié)及項(xiàng)目分享

發(fā)表評(píng)論

0條評(píng)論

張紅新

男|高級(jí)講師

TA的文章

Python腳本——信手拈來(lái)的自動(dòng)化測(cè)試工具

Forrester預(yù)測(cè)，2022 年將是邊緣、物聯(lián)網(wǎng)和網(wǎng)絡(luò)技術(shù)融合的一年

#萬(wàn)圣節(jié)#DediPath：特價(jià)美國(guó)獨(dú)立服務(wù)器 $39/月起，VPS全場(chǎng)5折優(yōu)惠

怎么設(shè)置云主機(jī)端口-服務(wù)器主機(jī)名跟端口怎么設(shè)置？

SvenHost：德國(guó)服務(wù)器促銷(xiāo)/E3/16G/2x 2 TB HDD/1Gbps月流量10TB/$

react下移動(dòng)端可吸附懸浮窗，懸浮球，懸浮按鈕，支持拖動(dòng)拖拽功能

css實(shí)現(xiàn)二維碼掃碼框

CSS 實(shí)現(xiàn)元素較寬不能被完全展示時(shí)將其隱藏

最新活動(dòng)

資訊專(zhuān)欄INFORMATION COLUMN

上云采購(gòu)季！| 2核2G4M爆款云服務(wù)器低至59元/年，更有多臺(tái)、長(zhǎng)期優(yōu)惠，快來(lái)選購(gòu)！

一次簡(jiǎn)陋的爬蟲(chóng)

相關(guān)文章

發(fā)表評(píng)論

0條評(píng)論

男|高級(jí)講師

TA的文章

最新活動(dòng)

上云采購(gòu)季！| 2核2G4M爆款云服務(wù)器低至59元/年，更有多臺(tái)、長(zhǎng)期優(yōu)惠，快來(lái)選購(gòu)！