摘要:背景介紹相信很多人手機上都收到過一些營銷短信,短信里面有時候會附帶一些網(wǎng)址,如下圖這些網(wǎng)址往往都是非常短,但是當(dāng)我們打開之后,如果你仔細(xì)觀察,中間會有跳轉(zhuǎn),最終瀏覽器地址欄顯示的網(wǎng)址并不是你短信里面看到的網(wǎng)址,這就是短網(wǎng)址原理和應(yīng)用短網(wǎng)
1.背景介紹相信很多人手機上都收到過一些營銷短信,短信里面有時候會附帶一些網(wǎng)址,如下圖
2.原理和應(yīng)用
短網(wǎng)址一般是采用一個非常短域名下,路徑參數(shù)一般只有3-6個字符組成,非常簡潔!
使用短網(wǎng)址的前提是先生成短網(wǎng)址,主要是采用某種算法讓一段短的字符對應(yīng)一個長的字符,比如說從常用的0-9、a-z、A-Z共62個字符中選擇6個字符,那意味著有62的6次方種組合,大概有568億不重復(fù)的短網(wǎng)址可用!
服務(wù)器通過路徑參數(shù)查詢到真實的長網(wǎng)址,然后使用301/302跳轉(zhuǎn)到真實的網(wǎng)址即可!
關(guān)于跳轉(zhuǎn),301 是永久重定向,302 是臨時重定向。短地址一經(jīng)生成就不會變化,所以用 301 是符合 http 語義的,瀏覽器會記錄跳轉(zhuǎn)地址,同時對服務(wù)器壓力也會有一定減少。但是如果使用了 301,我們就無法統(tǒng)計到短地址被點擊的次數(shù)了,如果對數(shù)據(jù)統(tǒng)計有要求的話,使用302跳轉(zhuǎn)可能比較好一些!
短網(wǎng)址的主要好處是方便傳輸記憶,特別是在短信里面使用的時候,短信對內(nèi)容字?jǐn)?shù)有限制,還有比如說微博分享也使用了短網(wǎng)址!
3.市面現(xiàn)有案例目前市面上有很多免費的短鏈接服務(wù),功能基本上都一樣,也沒有什么限制!
(1)百度的短鏈接(dwz.cn/),百度不僅僅提供了網(wǎng)頁入口,也提供了接口和開發(fā)文檔,簡單易用!
(2)新浪的短鏈接(sina.lt/),目前僅提供網(wǎng)頁入口,未發(fā)現(xiàn)接口服務(wù)!
(3)淘寶的短鏈接(tb.am/),目前僅提供網(wǎng)頁入口,未發(fā)現(xiàn)接口服務(wù)!
市面還有很多其它的小的公司提供短鏈接服務(wù),有些是部分免費,有些短鏈接是有效期的,這里不一一介紹!
4.常用算法網(wǎng)上比較流行的算法有進制算法、摘要(Hash)算法、隨機數(shù)算法,下面簡單介紹一下:
一.進制算法這個算法網(wǎng)上也有叫作自增序列算法,特點就是永不重復(fù),設(shè)置 id 自增,一個 10進制 id 對應(yīng)一個62進制的數(shù)值,1對1,也就不會出現(xiàn)重復(fù)的情況,這個利用的就是低進制轉(zhuǎn)化為高進制時,字符數(shù)會減少的特性。
計算機中常見的進制有2進制,8進制,10進制,16進制,進制越大,能夠表示的數(shù)越大,占用的字?jǐn)?shù)也越少。下面舉個例:
10進制的1000,在8進制里面是1750,在16進制里面就是3E8,那在62進制里面呢?有人說,計算機里面沒有62進制。。。雖然沒有,但是我們可以造一個,進制的轉(zhuǎn)換算法是固定的,最常見的就是“除基取余法”!
我們假設(shè)62進制的字符序列為 0-9a-zA-Z,順序可以打亂,但是應(yīng)該固定下來,是一個從0角標(biāo)開始的到61的數(shù)組,我們暫且稱之為字母表!
====> 1000%62 余 8,得16
====> 16%62 余 16,得 0
最終得到的數(shù)字是16、8,然后找到字母表里面角標(biāo)為16和8的字符拼起來,就是g8,非常短,只有2位數(shù)!假如說我們想至少產(chǎn)生6位字符,那么我們可以從一個比較大的數(shù)字開始,具體可以看下圖:
1位 62 0 - 61 2位 3844 62 - 3843 3位 約 23萬 3844 - 238327 4位 約 1400萬 238328 - 14776335 5位 約 9.1億 14776336 - 916132831 6位 約 568億 916132832 - 56800235583二.Hash算法
簡單的對長鏈接進行加鹽md5,會生成一個32位的字符串,隨機從里面取6個字符,或者簡單粗暴取最后6位,但是md5只包含0-9A-Fa-f,比字母表的里面字符還少,沖突幾率更大!
1.將長網(wǎng)址 md5 生成 32 位簽名串,分為 4 段, 每段 8 個字節(jié)
2.對這四段循環(huán)處理, 取 8 個字節(jié), 將他看成 16 進制串與 0x3fffffff(30位1) 與操作, 即超過 30 位的忽略處理
3.這 30 位分成 6 段, 每 5 位的數(shù)字作為字母表的索引取得特定字符, 依次進行獲得 6 位字符串
4.總的 md5 串可以獲得 4 個 6 位串,取里面的任意一個就可作為這個長 url 的短 url 地址
生成的方式更加復(fù)雜,重復(fù)的幾率低,但是依然會出現(xiàn)沖突!
三.隨機數(shù)算法這個更簡單,直接對這個62個字符數(shù)組做隨機選擇,選擇其中6個字符當(dāng)作短鏈接碼,簡單易用,但是難免會出現(xiàn)重復(fù)沖突!
四.算法對比第一種算法只要解決自增id問題就可以避免沖突,自增id可以采用數(shù)據(jù)庫自增主鍵,每次生成短碼只需一次數(shù)據(jù)庫操作(insert操作,獲取主鍵id,然后算出短碼即可)
第二種和第三種算法其實都差不多,都是依賴于程序隨機,容易出現(xiàn)沖突,這就需要每次在插入數(shù)據(jù)庫的時候判重,效率低一些!
5.安全短鏈接雖然方便了傳輸和記憶,但是由于鏈接組成的字符個數(shù)少,更容易被爆破、猜測攻擊,攻擊者可以輕松遍歷所有字符組成的鏈接!
所以不建議使用短鏈接發(fā)送具有私密性的網(wǎng)址,比如說重置密碼鏈接,對一些權(quán)限、敏感信息的鏈接要做好二次鑒權(quán)!
文章版權(quán)歸作者所有,未經(jīng)允許請勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。
轉(zhuǎn)載請注明本文地址:http://systransis.cn/yun/6909.html
摘要:而且已開源出來,隨著容器技術(shù)發(fā)展,大文件分發(fā)一直是個重要的問題,所以是一件值得研究的技術(shù)。實用推薦檢定攻略是近期推出的一項認(rèn)證,用以認(rèn)證開發(fā)者的移動網(wǎng)頁開發(fā)技能。凈化,移除中不必要的文件技術(shù)周刊由小組出品,匯聚一周好文章,周刊原文。 業(yè)界動態(tài) 直擊阿里雙11神秘技術(shù):PB級大規(guī)模文件分發(fā)系統(tǒng)蜻蜓 文章主要介紹了阿里的PB級大規(guī)模文件分發(fā)系統(tǒng)蜻蜓, 通過使用P2P技術(shù)同時結(jié)合智能壓縮、智...
摘要:圖片壓縮網(wǎng)址介紹是一款圖片壓縮工具,壓縮率能達到以上,圖片在壓縮之前和之后幾乎看不出差別。在設(shè)計師人群中比較流行,現(xiàn)在介紹給廣大的程序員。 1.圖片壓縮網(wǎng)址:https://tinypng.com/ 介紹: Tinypng 是一款 PNG 圖片壓縮工具,壓縮率能達到 50% 以上,圖片在壓縮之前和之后幾乎看不出差別。Tinypng 在設(shè)計師人群中比較流行,現(xiàn)在介紹給廣大的程序員。 據(jù)...
閱讀 3214·2021-10-14 09:42
閱讀 3574·2019-08-26 13:56
閱讀 3489·2019-08-26 11:59
閱讀 954·2019-08-23 18:00
閱讀 2218·2019-08-23 17:51
閱讀 3537·2019-08-23 17:17
閱讀 1490·2019-08-23 15:11
閱讀 5227·2019-08-23 15:05