Python “今日新聞”一個(gè)小程序，拿走就能用！

nanfeiyan 發(fā)布于2021-09-30 09:48 / 2925人閱讀

核心代碼

requests.get 下載html網(wǎng)頁(yè)
bs4.BeautifulSoup 分析html內(nèi)容

from requests import getfrom bs4 import BeautifulSoup as bsfrom datetime import datetime as dtdef Today(style=1):    date = dt.today()    if style!=1: return f"{date.month}月{date.day}日"    return f"{date.year}-{date.month:02}-{date.day:02}"def SinaNews(style=1):    url1 = "http://news.***.com.cn/"    if style==1: url1 += "world"    elif style==2: url1 += "china"    else: url1="https://mil.news.sina.com.cn/"    text = get(url1)    text.encoding="uft-8"    soup = bs(text.text,"html.parser")    aTags = soup.find_all("a")    return [(t.text,t["href"]) for t in aTags if Today() in str(t)]

爬取標(biāo)題

>>> for i,news in enumerate(SinaNews(1)):
?? ?print(f"No{i+1}:",news[0])

?? ?
No1: 外媒：*****
No2: 日媒：******
......

.......

內(nèi)容已馬賽克?。?！
>>>?

首次做爬蟲(chóng)，為了方便下手找一個(gè)不用破解網(wǎng)頁(yè)的某新聞網(wǎng)站，下載網(wǎng)頁(yè)就能直接取得內(nèi)容。其中的國(guó)際、國(guó)內(nèi)和軍事新聞三個(gè)網(wǎng)頁(yè)作內(nèi)容源，requests.get下載網(wǎng)頁(yè)后，分析所得html文本，所有標(biāo)記帶日期剛好所需要的。

爬取正文

然后再根據(jù)url下載正文網(wǎng)頁(yè)，分析可知id=‘a(chǎn)rticle’的

層就是正文所在位置，.get_text()是取得文本的關(guān)鍵函數(shù)，然后適當(dāng)做一些格式處理：

>>> def NewsDownload(url):    html = get(url)    html.encoding="uft-8"    soup = bs(html.text,"html.parser")    text = soup.find("div",id="article").get_text().strip()    text = text.replace("點(diǎn)擊進(jìn)入專題：","相關(guān)專題：")    text = text.replace("　　","/n　　")    while "/n/n/n" in text:        text = text.replace("/n/n/n","/n/n")    return text>>> url = "https://******/w/2021-09-29/doc-iktzqtyt8811588.shtml">>> NewsDownload(url)"原標(biāo)題：******************************************************">>>

界面代碼

使用內(nèi)置的圖形界面庫(kù) tkinter 控件 Text 、Listbox、Scrollbar、Button。設(shè)置基本屬性、放置位置、綁定命令，然后調(diào)試到程序完工！

源代碼 News.pyw ：其中涉及的網(wǎng)站名稱已馬賽克！

from requests import getfrom bs4 import BeautifulSoup as bsfrom datetime import datetime as dtfrom os import pathimport tkinter as tkdef Today(style=1):    date = dt.today()    if style!=1: return f"{date.month}月{date.day}日"    return f"{date.year}-{date.month:02}-{date.day:02}"def SinaNews(style=1):    url1 = "http://news.****.com.cn/"    if style==1: url1 += "world"    elif style==2: url1 += "china"    else: url1="https://mil.****.com.cn/"    text = get(url1)    text.encoding="uft-8"    soup = bs(text.text,"html.parser")    aTags = soup.find_all("a")    return [(t.text,t["href"]) for t in aTags if Today() in str(t)]def NewsList(i):    global news    news = SinaNews(i)    tList.delete(0,tk.END)    for idx,item in enumerate(news):        tList.insert(tk.END,f"{idx+1:03} {item[0]}")    tText.config(state=tk.NORMAL)    tText.delete(0.0,tk.END)    tText.config(state=tk.DISABLED)    NewsShow(0)    def NewsList1(): NewsList(1)def NewsList2(): NewsList(2)def NewsList3(): NewsList(3)def NewsShow(idx):    if idx!=0:        idx = tList.curselection()[0]    title,url = news[idx][0],news[idx][1]    html = get(url)    html.encoding="uft-8"    soup = bs(html.text,"html.parser")    text = soup.find("div",id="article").get_text().strip()    text = text.replace("點(diǎn)擊進(jìn)入專題：","相關(guān)專題：")    text = text.replace("　　","/n　　")    while "/n/n/n" in text:        text = text.replace("/n/n/n","/n/n")    tText.config(state=tk.NORMAL)    tText.delete(0.0,tk.END)    tText.insert(tk.END, title+"/n/n"+text)    tText.config(state=tk.DISABLED)    def InitWindow(self,W,H):    Y = self.winfo_screenheight()    winPosition = str(W)+"x"+str(H)+"+8+"+str(Y-H-100)    self.geometry(winPosition)    icoFile = "favicon.ico"    f = path.exists(icoFile)    if f: win.iconbitmap(icoFile)    self.resizable(False,False)    self.wm_attributes("-topmost",True)    self.title(bTitle[0])    SetControl()    self.update()    self.mainloop()def SetControl():    global tList,tText    tScroll = tk.Scrollbar(win, orient=tk.VERTICAL)    tScroll.place(x=450,y=320,height=300)    tList = tk.Listbox(win,selectmode=tk.BROWSE,yscrollcommand=tScroll.set)    tScroll.config(command=tList.yview)    for idx,item in enumerate(news):        tList.insert(tk.END,f"{idx+1:03} {item[0]}")    tList.place(x=15,y=320,width=435,height=300)    tList.select_set(0)    tList.focus()    bW,bH = 70,35    #按鈕的寬高    bX,bY = 95,270    #按鈕的坐標(biāo)    tBtn1 = tk.Button(win,text=bTitle[1],command=NewsList1)    tBtn1.place(x=bX,y=bY,width=bW,height=bH)    tBtn2=tk.Button(win,text=bTitle[2],command=NewsList2)    tBtn2.place(x=bX+100,y=bY,width=bW,height=bH)    tBtn3 = tk.Button(win,text=bTitle[3],command=NewsList3)    tBtn3.place(x=bX+200,y=bY,width=bW,height=bH)    tScroll2 = tk.Scrollbar(win, orient=tk.VERTICAL)    tScroll2.place(x=450,y=10,height=240)    tText = tk.Text(win,yscrollcommand=tScroll2.set)    tScroll2.config(command=tText.yview)    tText.place(x=15,y=10,width=435,height=240)    tText.config(state=tk.DISABLED,bg="azure",font=("宋體", "14"))    NewsShow(0)    tList.bind("",NewsShow)if __name__=="__main__":    win = tk.Tk()    bTitle = ("今日新聞","國(guó)際新聞","國(guó)內(nèi)新聞","軍事新聞")    news = SinaNews()    InitWindow(win,480,640)

奉上全部代碼，在此就不作詳細(xì)分析了，如有需要請(qǐng)留言討論。我的使用環(huán)境 Win7+Python3.8.8 下可以無(wú)錯(cuò)運(yùn)行！文中涉及網(wǎng)站名稱已打上馬賽克，猜不出名字的可以私下里問(wèn)我。

軟件編譯

使用pyinstaller.exe編譯成單個(gè)運(yùn)行文件，注意源碼文件的后綴名應(yīng)該用.pyw否則會(huì)有cmd黑窗口出現(xiàn)。還有一個(gè)小知識(shí)點(diǎn)，任意網(wǎng)站的Logo圖標(biāo)icon文件，一般都能在根目錄里下載到，即：
http(s)://websiteurl.com(.cn)/favicon.ico

編譯命令如下：

D:/>pyinstaller --onefile --nowindowed --icon="D:/favicon.ico" News.pyw

編譯完成后，在dist文件夾下生成一個(gè)News.exe可執(zhí)行文件，大小約15M還能接受。?

反正拿走就能直接用，臨走前給個(gè)一鍵三連吧，謝謝！

云服務(wù)器 GPU云服務(wù)器阿里云服務(wù)器買來(lái)就能用嗎一個(gè)小程序微信小程序能用阿里云服務(wù)器么下載一個(gè)小程序

文章版權(quán)歸作者所有，未經(jīng)允許請(qǐng)勿轉(zhuǎn)載,若此文章存在違規(guī)行為，您可以聯(lián)系管理員刪除。

轉(zhuǎn)載請(qǐng)注明本文地址：http://systransis.cn/yun/121684.html

發(fā)表評(píng)論

登陸后可評(píng)論

0條評(píng)論

nanfeiyan

男|高級(jí)講師

我要關(guān)注我要私信

TA的文章

全志R528核心板和開(kāi)發(fā)板

閱讀 1542·2021-11-17 09:33
Pygame實(shí)戰(zhàn)：記憶差怎么辦？別急，增強(qiáng)記憶力的小游戲送給你~【越玩越上癮】

閱讀 1292·2021-10-11 10:59
Python “今日新聞”一個(gè)小程序，拿走就能用！

閱讀 2926·2021-09-30 09:48
一位程序員社畜的2021閑讀書(shū)單！

閱讀 1932·2021-09-30 09:47
解決鍵盤(pán)擋住輸入框問(wèn)題(APP調(diào)整)

閱讀 3061·2019-08-30 15:55
【學(xué)習(xí)筆記】CSS深入理解之relative

閱讀 2362·2019-08-30 15:54
前端每日實(shí)戰(zhàn)：23# 視頻演示如何用純 CSS 創(chuàng)作一個(gè)菜單反色填充特效

閱讀 1515·2019-08-29 15:25
純CSS實(shí)現(xiàn)扁平化風(fēng)格開(kāi)關(guān)按鈕

閱讀 1672·2019-08-29 10:57

成人国产在线小视频_日韩寡妇人妻调教在线播放_色成人www永久在线观看_2018国产精品久久_亚洲欧美高清在线30p_亚洲少妇综合一区_黄色在线播放国产_亚洲另类技巧小说校园_国产主播xx日韩_a级毛片在线免费

資訊專欄INFORMATION COLUMN

上云采購(gòu)季！| 2核2G4M爆款云服務(wù)器低至59元/年，更有多臺(tái)、長(zhǎng)期優(yōu)惠，快來(lái)選購(gòu)！

Python “今日新聞”一個(gè)小程序，拿走就能用！

核心代碼

爬取標(biāo)題

爬取正文

界面代碼

軟件編譯

相關(guān)文章

年薪30萬(wàn)的軟件測(cè)試工程師需要具備的實(shí)力有哪些?

Python所有方向的學(xué)習(xí)路線，你們要的知識(shí)體系在這，千萬(wàn)別做了無(wú)用功！

App 端自動(dòng)化的最佳方案，完全解放雙手！

python里能不能用中文

發(fā)表評(píng)論

0條評(píng)論

nanfeiyan

男|高級(jí)講師

TA的文章

全志R528核心板和開(kāi)發(fā)板

Pygame實(shí)戰(zhàn)：記憶差怎么辦？別急，增強(qiáng)記憶力的小游戲送給你~【越玩越上癮】