摘要:大多數(shù)開發(fā)者應該都遇到過在字段中存儲逗號分割字符串的經(jīng)歷,無論這些被分割的字段代表的是還是,這個字段都應該具有如下幾個共性。
大多數(shù)開發(fā)者應該都遇到過在mysql字段中存儲逗號分割字符串的經(jīng)歷,無論這些被分割的字段代表的是id還是tag,這個字段都應該具有如下幾個共性。
被分割的字段一定是有限而且數(shù)量較少的,我們不可能在一個字符串中存儲無限多個字符
這個字段所屬的表與這個字段關聯(lián)的表,一定是一對多的關系
比如下面這個表結(jié)構(gòu)所代表的content與tag這兩個對象
mysql> SELECT * FROM content; +----+------+ | id | tags | +----+------+ | 1 | 1,2 | | 2 | 2,3 | +----+------+ 2 rows in set (0.01 sec) mysql> SELECT * FROM tag; +----+-------+ | id | name | +----+-------+ | 1 | php | | 2 | mysql | | 3 | java | +----+-------+ 3 rows in set (0.00 sec)
這些原則問題,相信大家在開發(fā)過程中已經(jīng)很熟悉了。但是你在使用這種方法來處理實際問題時,內(nèi)心一定還是有些許忐忑,因為這種方法或多或少看上去有點像野路子。在那本厚厚的《數(shù)據(jù)庫》教材中,也沒有提到這種設計方法,標準的方法似乎是應該使用一個關系映射表在這兩個表之間插一杠子,盡管這樣會使用效率低下的連接查詢。
每個開發(fā)者都曾糾結(jié)于標準與效率,但我想我們的努力能使這種方法的使用看起來更加標準。注意,以下討論的使用方法僅限于mysql,但其它數(shù)據(jù)庫應該可以移植。
很多開發(fā)者還在使用古老的LIKE方法來實現(xiàn)相關性檢索,比如上面那個數(shù)據(jù)庫結(jié)構(gòu)中,content表中的兩條記錄都有2這個tag,那么怎樣在我取出記錄1時,把與它tag相關的記錄也顯示出來呢。其實這也是CMS需要面對的一個基本問題,也就是相關內(nèi)容的查詢。
如果你是一個菜鳥,你可能只會想到LIKE方法,比如先把記錄1取出來,然后再把tags字段按逗號分割,最后做一個循環(huán)用LIKE檢索content表中所有tags字段中包含2的記錄,類似這樣
SELECT * FROM content WHERE tag LIKE "%2%" AND id <> 1
但這種方法實在是太慢了,查詢次數(shù)多不說,LIKE查詢本來就是一個比較慢的方法。而且你還要處理前后逗號的問題,總之麻煩是一大堆。
所以讓我們靜下心來翻翻mysql手冊,看看有沒有什么驚喜。這個時候,一個名為FIND_IN_SET的函數(shù),會閃著金光映入你的眼簾。讓我們看看這個函數(shù)的定義
FIND_IN_SET(str,strlist)Returns a value in the range of 1 to N if the string str is in the string list strlist consisting of N substrings. A string list is a string composed of substrings separated by “,” characters. If the first argument is a constant string and the second is a column of type SET, the FIND_IN_SET() function is optimized to use bit arithmetic. Returns 0 if str is not in strlist or if strlist is the empty string. Returns NULL if either argument is NULL. This function does not work properly if the first argument contains a comma (“,”) character.
哦,PERFECT! 簡單說來就是尋找一個字符串是否在另一個以逗號分割的字符串中存在的函數(shù),這簡直是為我們量身定做的。那么我們的sql就變成
SELECT * FROM content WHERE FIND_IN_SET("2", tags) AND id <> 1
在翻這些函數(shù)的過程中,你應該已經(jīng)深深地體會到mysql的設計者對以逗號分割存儲字段方法的肯定,因為有很多方法就是設計用來處理這種問題的。
這樣看起來好多了,一切似乎完美了,是這樣嗎?其實還沒有,如果你的tag比較多,你需要創(chuàng)建多個sql語句,而且有的記錄關聯(lián)的tag比較多,有的比較少,怎么能按照相關性進行排列呢。
這個時候,你可以關注mysql的全文檢索功能。這個詞你肯定看見過無數(shù)回了,但是這么使用的肯定很少,讓我們直接看語句吧
SELECT * FROM content WHERE MATCH(tags) AGAINST("1,2") AND id <> 1
這個語句的優(yōu)勢是顯而易見的,你不需要對tags字段做再次分割。那么這種查詢的原理是什么呢,稍微了解下MATCH AGAINST的用法就知道,全文檢索的默認分隔符是標點符號和stopwords,其中前者正是我們需要的特性。全文檢索按照逗號將MATCH和AGAINST里的字符串做分割,然后將它們匹配。
需要注意的是上面sql僅僅是個例子,如果你直接這么執(zhí)行,是無法得到任何結(jié)果的。原因在以下
隨著WEB技術的發(fā)展,相關搜索走SQL的情況越來越少,很多時候只需要用搜索引擎就可以了。但本文的目的并不只是討論這種方法,而是體現(xiàn)實現(xiàn)這一結(jié)果的過程。
文章版權歸作者所有,未經(jīng)允許請勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。
轉(zhuǎn)載請注明本文地址:http://systransis.cn/yun/20610.html
閱讀 2661·2021-11-25 09:43
閱讀 680·2021-11-12 10:36
閱讀 4647·2021-11-08 13:18
閱讀 2187·2021-09-06 15:00
閱讀 3124·2019-08-30 15:56
閱讀 941·2019-08-30 13:57
閱讀 1998·2019-08-30 13:48
閱讀 1423·2019-08-30 11:13