摘要:起步這次使用的訓(xùn)練集由模塊提供,關(guān)于虹膜一種鳶尾屬植物的數(shù)據(jù)。它的品種分類有山鳶尾,變色鳶尾,菖蒲錦葵三種。構(gòu)造分類器參數(shù)級是指定獲取個鄰近點。訓(xùn)練訓(xùn)練的函數(shù)一般就是測試模擬一些測試數(shù)據(jù),使用剛剛的模型進行預(yù)測
起步
這次使用的訓(xùn)練集由 sklearn 模塊提供,關(guān)于虹膜(一種鳶尾屬植物)的數(shù)據(jù)。
數(shù)據(jù)載入from sklearn import datasets iris = datasets.load_iris()
數(shù)據(jù)存儲在 .data 成員中,它是一個 (n_samples, n_features) numpy 數(shù)組:
print(iris.data) # [[ 5.1 3.5 1.4 0.2] # [ 4.9 3. 1.4 0.2] # ...
它有四個特征,萼片長度,萼片寬度,花瓣長度,花瓣寬度 (sepal length, sepal width, petal length and petal width)。
它的品種分類有山鳶尾,變色鳶尾,菖蒲錦葵(Iris setosa, Iris versicolor, Iris virginica.)三種。
print iris.data.shape # output:(150L, 4L)
這是一個含有 150 個數(shù)據(jù)的訓(xùn)練集。
構(gòu)造 KNN 分類器from sklearn import neighbors knn = neighbors.KNeighborsClassifier(n_neighbors=5)
n_neighbors 參數(shù)級是指定獲取 K 個鄰近點。
訓(xùn)練訓(xùn)練的函數(shù)一般就是 fit :
knn.fit(iris.data, iris.target)測試
模擬一些測試數(shù)據(jù),使用剛剛的模型進行預(yù)測:
predict = knn.predict([[0.1, 0.2, 0.3, 0.4]]) print(predict) # output: [0]
文章版權(quán)歸作者所有,未經(jīng)允許請勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。
轉(zhuǎn)載請注明本文地址:http://systransis.cn/yun/44539.html
摘要:起步本章介紹如何自行構(gòu)造分類器,這個分類器的實現(xiàn)上算是比較簡單的了。不過這可能需要你之前閱讀過這方面的知識。在預(yù)測函數(shù)中,需要依次計算測試樣本與數(shù)據(jù)集中每個樣本的距離。篩選出前個,采用多數(shù)表決的方式。測試還是使用中提供的虹膜數(shù)據(jù)。 起步 本章介紹如何自行構(gòu)造 KNN 分類器,這個分類器的實現(xiàn)上算是比較簡單的了。不過這可能需要你之前閱讀過這方面的知識。 前置閱讀 分類算法之鄰近算法:KN...
摘要:鄰近算法算法背景假設(shè)我們要給一堆音樂分類,我們可以分成搖滾,民謠,戲曲等等,搖滾的音樂激昂,節(jié)奏快。這種基于某一特征出現(xiàn)的次數(shù)來區(qū)分事物的算法,我們使用鄰近算法。 k-鄰近算法 算法背景 假設(shè)我們要給一堆mp3音樂分類,我們可以分成搖滾,民謠,戲曲等等,搖滾的音樂激昂,節(jié)奏快。民謠舒緩節(jié)奏慢,但是搖滾中也有可能存在舒緩節(jié)奏慢點旋律, 同理民謠中也會有激昂,快的旋律。那么如何區(qū)分他們呢,...
閱讀 1653·2023-04-25 16:29
閱讀 959·2021-11-15 11:38
閱讀 2299·2021-09-23 11:45
閱讀 1427·2021-09-22 16:03
閱讀 2542·2019-08-30 15:54
閱讀 1205·2019-08-30 10:53
閱讀 2605·2019-08-29 15:24
閱讀 1104·2019-08-26 12:25