從零開始構(gòu)造鄰近分類器KNN

GeekQiaQia 發(fā)布于2019-07-30 15:15 / 3521人閱讀

摘要：起步本章介紹如何自行構(gòu)造分類器，這個(gè)分類器的實(shí)現(xiàn)上算是比較簡(jiǎn)單的了。不過這可能需要你之前閱讀過這方面的知識(shí)。在預(yù)測(cè)函數(shù)中，需要依次計(jì)算測(cè)試樣本與數(shù)據(jù)集中每個(gè)樣本的距離。篩選出前個(gè)，采用多數(shù)表決的方式。測(cè)試還是使用中提供的虹膜數(shù)據(jù)。

起步

本章介紹如何自行構(gòu)造 KNN 分類器，這個(gè)分類器的實(shí)現(xiàn)上算是比較簡(jiǎn)單的了。不過這可能需要你之前閱讀過這方面的知識(shí)。

前置閱讀

分類算法之鄰近算法:KNN（理論篇）

分類算法之鄰近算法:KNN（應(yīng)用篇）

歐拉公式衡量距離

關(guān)于距離的測(cè)量方式有多種，這邊采用歐拉距離的測(cè)量方式:

$$ d(x,y) = sqrt{sum_{i=0}^n(x_i-y_i)^2} $$

對(duì)應(yīng)的 python 代碼:

import math
def euler_distance(point1: list, point2: list) -> float:
    """
    計(jì)算兩點(diǎn)之間的歐拉距離，支持多維
    """
    distance = 0.0
    for a, b in zip(point1, point2):
        distance += math.pow(a - b, 2)
    return math.sqrt(distance)

KNN 分類器

import collections
import numpy as np
class KNeighborsClass(object):
    def __init__(self, n_neighbors=5):
        self.n_neighbors = n_neighbors

    def fit(self, data_set, labels):
        self.data_set = data_set
        self.labels = labels

    def predict(self, test_row):
        dist = []
        for v in self.data_set:
            dist.append(euler_distance(v, test_row))
        dist = np.array(dist)
        sorted_dist_index = np.argsort(dist) # 根據(jù)元素的值從大到小對(duì)元素進(jìn)行排序，返回下標(biāo)

        # 根據(jù)K值選出分類結(jié)果, ["A", "B", "B", "A", ...]
        class_list = [ self.labels[ sorted_dist_index[i] ] for i in range(self.n_neighbors)]
        result_dict = collections.Counter(class_list)   # 計(jì)算各個(gè)分類出現(xiàn)的次數(shù)
        ret = sorted(result_dict.items(), key=lambda x: x[1], reverse=True) # 采用多數(shù)表決，即排序后的第一個(gè)分類
        return ret[0][0]

這個(gè)分類器不需要訓(xùn)練，因此在 fit 函數(shù)中僅僅保存其數(shù)據(jù)集和結(jié)果集即可。在預(yù)測(cè)函數(shù)中，需要依次計(jì)算測(cè)試樣本與數(shù)據(jù)集中每個(gè)樣本的距離。篩選出前 K 個(gè)，采用多數(shù)表決的方式。

測(cè)試

還是使用 sklearn 中提供的虹膜數(shù)據(jù)。

if __name__ == "__main__":
    from sklearn import datasets
    iris = datasets.load_iris()
    knn = KNeighborsClass(n_neighbors=5)
    knn.fit(iris.data, iris.target)
    predict = knn.predict([0.1, 0.2, 0.3, 0.4])
    print(predict)  # output: 1

GPU云服務(wù)器云服務(wù)器 knn 聚類分類從零開始 linux從零開始 python從零開始

文章版權(quán)歸作者所有，未經(jīng)允許請(qǐng)勿轉(zhuǎn)載,若此文章存在違規(guī)行為，您可以聯(lián)系管理員刪除。

轉(zhuǎn)載請(qǐng)注明本文地址：http://systransis.cn/yun/41137.html

發(fā)表評(píng)論

登陸后可評(píng)論

0條評(píng)論

GeekQiaQia

男|高級(jí)講師

我要關(guān)注我要私信

TA的文章

tensorflow

閱讀 2598·2023-04-25 20:05
tensorflow

閱讀 2931·2023-04-25 17:56
Vultr第18個(gè)機(jī)房瑞典斯德哥爾摩網(wǎng)絡(luò)速度和丟包延遲綜合測(cè)評(píng)

閱讀 2241·2021-10-14 09:49
微信小程序Markdown、HTML解析庫（支持wepy）

閱讀 2747·2019-08-29 15:10
css的結(jié)構(gòu)與布局

閱讀 2954·2019-08-29 12:25
CSS字體單位

閱讀 452·2019-08-28 18:23
使用API自動(dòng)生成工具優(yōu)化前端工作流

閱讀 793·2019-08-26 13:26
svg+css3做一個(gè)動(dòng)感的波浪效果

閱讀 1403·2019-08-23 18:21

成人国产在线小视频_日韩寡妇人妻调教在线播放_色成人www永久在线观看_2018国产精品久久_亚洲欧美高清在线30p_亚洲少妇综合一区_黄色在线播放国产_亚洲另类技巧小说校园_国产主播xx日韩_a级毛片在线免费

資訊專欄INFORMATION COLUMN

上云采購季！| 2核2G4M爆款云服務(wù)器低至59元/年，更有多臺(tái)、長期優(yōu)惠，快來選購！

從零開始構(gòu)造鄰近分類器KNN

相關(guān)文章

**分類算法之鄰近算法:KNN（應(yīng)用篇）**

**k-鄰近算法（kNN）**

發(fā)表評(píng)論

0條評(píng)論

GeekQiaQia

男|高級(jí)講師

TA的文章

tensorflow

tensorflow

Vultr第18個(gè)機(jī)房瑞典斯德哥爾摩網(wǎng)絡(luò)速度和丟包延遲綜合測(cè)評(píng)

微信小程序Markdown、HTML解析庫（支持wepy）

css的結(jié)構(gòu)與布局

CSS字體單位

使用API自動(dòng)生成工具優(yōu)化前端工作流

svg+css3做一個(gè)動(dòng)感的波浪效果

最新活動(dòng)

資訊專欄INFORMATION COLUMN

上云采購季！| 2核2G4M爆款云服務(wù)器低至59元/年，更有多臺(tái)、長期優(yōu)惠，快來選購！

從零開始構(gòu)造鄰近分類器KNN

相關(guān)文章

發(fā)表評(píng)論

0條評(píng)論

男|高級(jí)講師

TA的文章

最新活動(dòng)

上云采購季！| 2核2G4M爆款云服務(wù)器低至59元/年，更有多臺(tái)、長期優(yōu)惠，快來選購！