摘要:鄰近算法實(shí)例額一改進(jìn)約會(huì)網(wǎng)站的配對(duì)效果應(yīng)用背景某約會(huì)網(wǎng)站收集了一些數(shù)據(jù)放在中,每個(gè)樣本數(shù)據(jù)占據(jù)一行,總共有行。在中創(chuàng)建名為的函數(shù),以此來(lái)處理輸人格式問(wèn)題。該函數(shù)的輸人為文件名字符串輸出為訓(xùn)練樣本矩陣和類標(biāo)簽向量。
k鄰近算法實(shí)例額(一)
改進(jìn)約會(huì)網(wǎng)站的配對(duì)效果
應(yīng)用背景:某約會(huì)網(wǎng)站收集了一些數(shù)據(jù)放在datingTestSet.txt中,每個(gè)樣本數(shù)據(jù)占據(jù)一行,總共有1000行。樣本主要包含以下3種特征:
□ 每年獲得的飛行常客里程數(shù)
□ 玩視頻游戲所耗時(shí)間百分比
□ 每周消費(fèi)的冰淇淋公升數(shù)
在將上述特征數(shù)據(jù)輸人到分類器之前,必須將待處理數(shù)據(jù)的格式改變?yōu)榉诸惼骺梢越邮艿母袷?。在kNN.py中創(chuàng)建名為file2matrix的函數(shù),以此來(lái)處理輸人格式問(wèn)題。該函數(shù)的輸人為文件名字符串輸出為訓(xùn)練樣本矩陣和類標(biāo)簽向量。
在kNN.py 中添加下面的函數(shù):
def file2matrix(filename): # 打開文件 fr = open(filename) # 逐行讀取 arrayOLines = fr.readlines() # 獲取總函數(shù) numberOfLines = len(arrayOLines) # 初始化矩陣 returnMat = zeros((numberOfLines,3)) # 初始化標(biāo)簽數(shù)組 classLabelVector = [] index = 0 for line in arrayOLines: # 頭尾部格式化 line = line.strip() # 根據(jù)tab切分 listFromLine = line.split(" ") # 矩陣單行賦予元素 returnMat[index, :] = listFromLine[0:3] # 標(biāo)簽數(shù)據(jù)賦值 classLabelVector.append(int(listFromLine[-1])) index += 1 return returnMat,classLabelVector
進(jìn)入終端:
使用Matplotlib創(chuàng)建數(shù)據(jù)集的散點(diǎn)圖, 進(jìn)入終端:
得到繪圖:
如上圖散點(diǎn)圖使用矩陣的第二、第三列數(shù)據(jù),分別表示特征值“玩視頻游戲所耗時(shí)間百分比”(x軸)和 “每周所消費(fèi)的冰淇淋公升數(shù)”(y軸)
由于沒有使用上各組數(shù)據(jù)等標(biāo)簽, 所以我們很難從上圖看出有用的信息,Matplotlib庫(kù)提供了scatter函數(shù)支持個(gè)性化標(biāo)記散點(diǎn)圖上的點(diǎn), 所以我們重新進(jìn)入終端:
獲得新的繪圖:
未完待續(xù)·····
文章版權(quán)歸作者所有,未經(jīng)允許請(qǐng)勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。
轉(zhuǎn)載請(qǐng)注明本文地址:http://systransis.cn/yun/40876.html
摘要:項(xiàng)目介紹某用戶一直使用在線約會(huì)軟件尋找適合自己的約會(huì)對(duì)象。盡管約會(huì)網(wǎng)站會(huì)推薦不同的人選但她并不是喜歡每一個(gè)人。 1 項(xiàng)目介紹 某APP用戶一直使用在線約會(huì)軟件尋找適合自己的約會(huì)對(duì)象。盡管約會(huì)網(wǎng)站會(huì)推薦不同的人選,但她并不是喜歡每一個(gè)人。經(jīng)過(guò)一番總結(jié),她發(fā)現(xiàn)曾交往過(guò)三種類型的人: 不喜歡的人(3) 魅力一般的人(2) 極具魅力的人(1) 某APP用戶希望分類軟件可以更好地幫助她將匹...
摘要:項(xiàng)目介紹某用戶一直使用在線約會(huì)軟件尋找適合自己的約會(huì)對(duì)象。盡管約會(huì)網(wǎng)站會(huì)推薦不同的人選但她并不是喜歡每一個(gè)人。 1 項(xiàng)目介紹 某APP用戶一直使用在線約會(huì)軟件尋找適合自己的約會(huì)對(duì)象。盡管約會(huì)網(wǎng)站會(huì)推薦不同的人選,但她并不是喜歡每一個(gè)人。經(jīng)過(guò)一番總結(jié),她發(fā)現(xiàn)曾交往過(guò)三種類型的人: 不喜歡的人(3) 魅力一般的人(2) 極具魅力的人(1) 某APP用戶希望分類軟件可以更好地幫助她將匹...
摘要:電影分析近鄰算法周末,小迪與女朋友小西走出電影院,回味著剛剛看過(guò)的電影。近鄰分類電影類型小迪回到家,打開電腦,想實(shí)現(xiàn)一個(gè)分類電影的案例。分類器并不會(huì)得到百分百正確的結(jié)果,我們可以使用很多種方法來(lái)驗(yàn)證分類器的準(zhǔn)確率。 電影分析——K近鄰算法 周末,小迪與女朋友小西走出電影院,回味著剛剛看過(guò)的電影。 小迪:剛剛的電影很精彩,打斗場(chǎng)景非常真實(shí),又是一部?jī)?yōu)秀的動(dòng)作片! 小西:是嗎?我怎么感覺這...
閱讀 1837·2021-09-28 09:46
閱讀 3154·2019-08-30 14:22
閱讀 1887·2019-08-26 13:36
閱讀 3353·2019-08-26 11:32
閱讀 2102·2019-08-23 16:56
閱讀 1158·2019-08-23 16:09
閱讀 1311·2019-08-23 12:55
閱讀 2158·2019-08-23 11:44