收藏一個python通過uft8 編碼來提取中文的例子

baiy 發(fā)布于2019-07-24 17:53 / 2746人閱讀

摘要：提取文件中所有中文小程序問題描述從一個文件中提取所有中文思路打開文件讀取文件中的文本用正則匹配獲取中文將其內(nèi)容寫入到另一個文本中實現(xiàn)設(shè)置默認(rèn)編碼只能是下面要求的判斷是否為中文的正則表達(dá)式打開要提取的文件打開要寫入的文件循環(huán)讀取要讀

Python-提取文件中所有中文小程序
問題描述：

　　　從一個txt文件中提取所有中文

思路：

打開txt文件
讀取txt文件中的文本
用正則匹配獲取中文
將其內(nèi)容寫入到另一個文本中
python實現(xiàn)：
import imp
import sys
imp.reload(sys)
sys.setdefaultencoding("utf-8") #設(shè)置默認(rèn)編碼,只能是utf-8,下面u4e00-u9fa5要求的
import re
pchinese=re.compile("([u4e00-u9fa5]+)+?") #判斷是否為中文的正則表達(dá)式
f=open("data.txt") #打開要提取的文件
fw=open("getdata.txt","w")#打開要寫入的文件
for line in f.readlines(): #循環(huán)讀取要讀取文件的每一行
m=pchinese.findall(str(line)) #使用正則表達(dá)獲取中文
if m:
str1="|".join(m)#同行的中文用豎杠區(qū)分
str2=str(str1)
fw.write(str2)#寫入文件
fw.write(" ")#不同行的要換行
f.close()
fw.close()#打開的文件記得關(guān)閉哦!

未驗證

GPU云服務(wù)器云服務(wù)器收藏一個代碼簡單的python例子 asp 編碼中文一個完整的python程序

文章版權(quán)歸作者所有，未經(jīng)允許請勿轉(zhuǎn)載,若此文章存在違規(guī)行為，您可以聯(lián)系管理員刪除。

轉(zhuǎn)載請注明本文地址：http://systransis.cn/yun/37489.html

發(fā)表評論

登陸后可評論

0條評論

baiy

男|高級講師

我要關(guān)注我要私信

TA的文章

虛擬主機怎么上傳文件-虛擬主機怎么上傳文件？

閱讀 806·2021-09-22 16:01
Contabo，新增NVME硬盤，加1歐可以升級 100G NVMe

閱讀 2099·2021-08-20 09:37
CSS小技巧（一）：iconfont的使用

閱讀 1702·2019-08-30 15:54
小程序?qū)崿F(xiàn)橫向滑塊，超過10個則出現(xiàn)查看更多

閱讀 1700·2019-08-30 15:44
文檔合集

閱讀 847·2019-08-28 18:23
JavaScript學(xué)習(xí)第十天筆記（繼承）

閱讀 3024·2019-08-26 12:17
Node.js child_process模塊解讀

閱讀 1026·2019-08-26 11:56
vue-cli中怎么基于axios去封裝方法

閱讀 1548·2019-08-23 16:20

成人国产在线小视频_日韩寡妇人妻调教在线播放_色成人www永久在线观看_2018国产精品久久_亚洲欧美高清在线30p_亚洲少妇综合一区_黄色在线播放国产_亚洲另类技巧小说校园_国产主播xx日韩_a级毛片在线免费

資訊專欄INFORMATION COLUMN

上云采購季！| 2核2G4M爆款云服務(wù)器低至59元/年，更有多臺、長期優(yōu)惠，快來選購！

收藏一個python通過uft8 編碼來提取中文的例子

相關(guān)文章

首次公開，整理12年積累的博客收藏夾，零距離展示《收藏夾吃灰》系列博客

**unicode和utf8 —— 從一個遍歷文件名的腳本，談?wù)剬?em>Python2和Python3中字符編**

BeautifulSoup：網(wǎng)頁解析利器上手簡介

發(fā)表評論

0條評論

baiy

男|高級講師

TA的文章

虛擬主機怎么上傳文件-虛擬主機怎么上傳文件？

Contabo，新增NVME硬盤，加1歐可以升級 100G NVMe

CSS小技巧（一）：iconfont的使用

小程序?qū)崿F(xiàn)橫向滑塊，超過10個則出現(xiàn)查看更多

文檔合集

JavaScript學(xué)習(xí)第十天筆記（繼承）

Node.js child_process模塊解讀

vue-cli中怎么基于axios去封裝方法

最新活動

資訊專欄INFORMATION COLUMN

上云采購季！| 2核2G4M爆款云服務(wù)器低至59元/年，更有多臺、長期優(yōu)惠，快來選購！

收藏一個python通過uft8 編碼來提取中文的例子

相關(guān)文章

發(fā)表評論

0條評論

男|高級講師

TA的文章

最新活動

上云采購季！| 2核2G4M爆款云服務(wù)器低至59元/年，更有多臺、長期優(yōu)惠，快來選購！