成人国产在线小视频_日韩寡妇人妻调教在线播放_色成人www永久在线观看_2018国产精品久久_亚洲欧美高清在线30p_亚洲少妇综合一区_黄色在线播放国产_亚洲另类技巧小说校园_国产主播xx日韩_a级毛片在线免费

資訊專欄INFORMATION COLUMN

javascript 正則的一些使用場景——敏感詞過濾

kun_jian / 2731人閱讀

摘要:正則不是必須的,任何東西我們都可以不用正則用其他方式實現(xiàn)。正則中的轉(zhuǎn)義尋找第一個出現(xiàn)的數(shù)字正則中的轉(zhuǎn)義代表數(shù)字索引數(shù)字出現(xiàn)在索引的位置只能找到字母出現(xiàn)的索引位置。所以我們就需要寫一個過濾標(biāo)簽的方法。點代表任意字符,在正則里勁量不要用。

寫一個最簡單的正則
// var re=new RegExp("a");//js風(fēng)格
var re=/a/;//perl風(fēng)格,古老語言現(xiàn)在沒人用了
// var re2=new RegExp("o");
var re2=/o/;
var str="hello world!";
console.log(str.search(re));//-1
console.log(str.search(re2));//4
用i寫一個忽略大小寫的正則
// var re=new RegExp("h","i");//用i忽略大小寫i===ignore
var re=/h/i;
var str="Hello world!";
console.log(str.search(re));//0,上面忽略h大小寫,可以找到第0個元素

像上面這種找個o找個h,不用正則也一樣簡單。正則不是必須的,任何東西我們都可以不用正則用其他方式實現(xiàn)。
下面我們做一些利用正則可以更簡單的實現(xiàn)的功能。

正則中的轉(zhuǎn)義d尋找第一個出現(xiàn)的數(shù)字
// 正則中的轉(zhuǎn)義  d 代表數(shù)字
var str="abc 55 fgdf56 56";
var re=/d/;
console.log(str.search(re));//索引4 數(shù)字5出現(xiàn)在索引4的位置

search只能找到字母出現(xiàn)的索引位置。match把所有匹配的東西,全部提取出來

用g寫一個獲取全部符合要求的正則,利用match把所有匹配的內(nèi)容展示出來
var str="asdf 66 5649 sdf546";
// 找到第一個數(shù)字
var re=/d/;
console.log(str.match(re));//["6", index: 5, input: "asdf 66 5649 sdf546", groups: undefined]
// g找到全部的數(shù)字g===global代表找到全部
var re2=/d/g;//一個d表示要一個數(shù)字
console.log(str.match(re2));//["6", "6", "5", "6", "4", "9", "5", "4", "6"]
用+標(biāo)識獲取若干個,下面例子中是若干個數(shù)字

+量詞,代表若干(多少都可以)

// +量詞,代表若干(多少都可以)
var str="asdf 66 5649 sdf546";
var re3=/d+/g;//一個d表示要一個數(shù)字,加上+代表要若干數(shù)字
console.log(str.match(re3));//["66", "5649", "546"]
敏感詞過濾



  敏感詞過濾


  

  

.代表任意字符
var str="asdf 66 5649 sdf546 +-*/.";
var re=/./g;
console.log(str.match(re));//?["a", "s", "d", "f", " ", "6", "6", " ", "5", "6", "4", "9", " ", "s", "d", "f", "5", "4", "6", " ", "+", "-", "*", "/", "."]
元字符或者叫方括號[]

[]代表或里面內(nèi)容任選一個都行。

1、任意字符
[abc]pc
代表apc bpc cpc都符合要求,如果寫成其他形式就不符合要求。

var str="apc bpc cpc dpc epc fpc";
var re=/[abc]pc/g;//g代表全部符合要求的
console.log(str.match(re));//["apc", "bpc", "cpc"]

2、范圍

// 找出a-z的字母和0-9的數(shù)字
var str="asdf 66 5649 sdf546";
var re2=/[a-z]/g;
console.log(str.match(re2));//["a", "s", "d", "f", "s", "d", "f"]
var re=/[0-9]/g;//找出所有0-9的數(shù)字
console.log(str.match(re));//["6", "6", "5", "6", "4", "9", "5", "4", "6"]

3、排除

// 排除a-z
var str="asdf 66 5649 sdf546 +-*/.";
var re=/[^a-z]/g;
console.log(str.match(re));//[" ", "6", "6", " ", "5", "6", "4", "9", " ", "5", "4", "6", " ", "+", "-", "*", "/", "."]
// 排除a-z和0-9
var str="asdf 66 5649 sdf546 +-*/.";
var re=/[^a-z0-9]/g;
console.log(str.match(re));//[" ", " ", " ", " ", "+", "-", "*", "/", "."]

像小說網(wǎng)站,我們不可能一部一部小說錄進(jìn)去,我們把別人網(wǎng)站的小說扒過來。
一般采集的小說都會包含html標(biāo)簽,這時候我們就需要把小說變成純文本的。所以我們就需要寫一個過濾html標(biāo)簽的方法。

過濾html標(biāo)簽的、模擬采集器處理成文本


  
    
    過濾html標(biāo)簽?zāi)M采集器處理成文本
    
  
  
    

正則中的轉(zhuǎn)義

d 代表數(shù)字。就是[0-9]
w 代表英文、數(shù)字、下劃線。就是[a-z0-9_]
s 代表空白字符,包括空格、tab等不可打印的字符
D 代表除了0-9意外的東西。就是1
W 代表除了a-z,0-9和下劃線意外的東西。就是2
S 代表非空白字符。
. 點代表任意字符,在正則里勁量不要用。

量詞——代表個數(shù)

{n} 代表正好出現(xiàn)n次——寫一個正則標(biāo)識8位的固定電話號碼/[1-9]d{7}/ ——第一位1-9后面7位是數(shù)字。

{n,m} 代表最少出現(xiàn)n次,最多出現(xiàn)m次——比如寫個qq號(5-11位)——

/[1-9]d{4,10}/ 第一位1-9,后面是4位到10位的數(shù)字

{n,} 代表最少n次最多不限。

+==={1,}標(biāo)識最少出現(xiàn)一次,最多不限

?==={0,1} 代表最少0次最多1次——固定電話的區(qū)號可以出現(xiàn)也可以不出現(xiàn)——/(0d{2-3}-)?[1-9]d{7}(-d{1,5})?/代表第一位是0然后后面是2到3位數(shù)字,然后書面是-,?標(biāo)識前面可有可無,后面部分代表分機號。

*==={0,} 代表最少0個最多不限,可以沒有也可以有很多位。不常用。

  • 0-9 ?

  • a-z0-9_ ?

  • 文章版權(quán)歸作者所有,未經(jīng)允許請勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。

    轉(zhuǎn)載請注明本文地址:http://systransis.cn/yun/97114.html

    相關(guān)文章

    • 敏感檢測算法小結(jié)

      摘要:序本文簡單介紹下敏感詞或者臟詞檢測算法。經(jīng)典算法經(jīng)典的算法由三部分構(gòu)成,表,表和表,共包含四種具體的算法,分別是計算三張查找表的算法以及算法本身。表是由模式集合中的所有模式構(gòu)成的狀態(tài)轉(zhuǎn)移自動機。 序 本文簡單介紹下敏感詞或者臟詞檢測算法。 經(jīng)典AC算法 經(jīng)典的AC算法由三部分構(gòu)成,goto表,fail表和output表,共包含四種具體的算法,分別是計算三張查找表的算法以及AC算法本身。...

      劉厚水 評論0 收藏0
    • JS基礎(chǔ)入門篇(三十三)—正則表達(dá)式

      摘要:舉例一使用這個正則,打印結(jié)果為使用這個正則,打印結(jié)果為舉例二打印結(jié)果如下過濾標(biāo)簽?zāi)愫妹利惖纳虾O朕D(zhuǎn)化成你好,美麗的上海如果后面加,就會進(jìn)入非貪婪模式。如果后面不加,就會進(jìn)入貪婪模式,結(jié)果為上海。你好美麗的上海。 1.創(chuàng)建一個正則表達(dá)式 方法一:使用一個正則表達(dá)式字面量,其由包含在斜杠之間的模式組成。 var reg1 = /a/; var reg2 = /ab+c/; 方法二:調(diào)用Re...

      caspar 評論0 收藏0
    • JS基礎(chǔ)入門篇(三十三)—正則表達(dá)式

      摘要:舉例一使用這個正則,打印結(jié)果為使用這個正則,打印結(jié)果為舉例二打印結(jié)果如下過濾標(biāo)簽?zāi)愫妹利惖纳虾O朕D(zhuǎn)化成你好,美麗的上海如果后面加,就會進(jìn)入非貪婪模式。如果后面不加,就會進(jìn)入貪婪模式,結(jié)果為上海。你好美麗的上海。 1.創(chuàng)建一個正則表達(dá)式 方法一:使用一個正則表達(dá)式字面量,其由包含在斜杠之間的模式組成。 var reg1 = /a/; var reg2 = /ab+c/; 方法二:調(diào)用Re...

      hot_pot_Leo 評論0 收藏0
    • JS基礎(chǔ)入門篇(三十三)—正則表達(dá)式

      摘要:舉例一使用這個正則,打印結(jié)果為使用這個正則,打印結(jié)果為舉例二打印結(jié)果如下過濾標(biāo)簽?zāi)愫妹利惖纳虾O朕D(zhuǎn)化成你好,美麗的上海如果后面加,就會進(jìn)入非貪婪模式。如果后面不加,就會進(jìn)入貪婪模式,結(jié)果為上海。你好美麗的上海。 1.創(chuàng)建一個正則表達(dá)式 方法一:使用一個正則表達(dá)式字面量,其由包含在斜杠之間的模式組成。 var reg1 = /a/; var reg2 = /ab+c/; 方法二:調(diào)用Re...

      y1chuan 評論0 收藏0
    • Spring Boot項目實踐之問答社區(qū)

      摘要:異步事件處理本項目涉及到多種異步事件的處理。即是的粉絲,是的關(guān)注對象。模式定義優(yōu)缺點推事件觸發(fā)后廣播給所有粉絲。具體來說,推模式就是事件觸發(fā)后產(chǎn)生,觸發(fā)事件的用戶下所有粉絲的實現(xiàn)中都存入該的。 項目源代碼已托管在 Github,歡迎 Star、Fork。 Q & A 問答社區(qū) QA 是一個基于 B/S 架構(gòu)而設(shè)計開發(fā)的社區(qū)網(wǎng)站。 showImg(https://segmentfault...

      binaryTree 評論0 收藏0

    發(fā)表評論

    0條評論

    最新活動
    閱讀需要支付1元查看
    <