python sklearn：教你如何畫出決策書，并保存為PDF的實(shí)現(xiàn)過程

89542767 發(fā)布于2022-09-07 11:09 / 728人閱讀

　　這篇文章主要介紹了python sklearn畫出決策樹并保存為PDF的實(shí)現(xiàn)過程，這篇文章具有很高的參考價(jià)值，希望各位讀者可以認(rèn)真仔細(xì)的閱讀。

　　利用sklearn畫出決策樹并保存為PDF

　　下載Graphviz

　　進(jìn)入官網(wǎng)下載并安裝：

　　https://graphviz.gitlab.io/_pages/Download/Download_windows.html

　　并將下列路徑配置為環(huán)境變量：

　　D:softwareGraphvizbin

　　在cmd中測(cè)試：

dot -version

python代碼

import numpy as np
import pandas as pd
from sklearn import tree
import graphviz
# x，y是sklearn中需要擬合的數(shù)據(jù)
x = np.array(exam_train)
y = np.array(classes_train)
clf = tree.DecisionTreeClassifier(criterion='entropy', class_weight='balanced', max_depth=25)
clf = clf.fit(x, y)
dot_data = tree.export_graphviz(clf, out_file=None, feature_names=None, filled=True, rounded=True)  # 重要參數(shù)可定制
graph = graphviz.Source(dot_data)
graph.render(view=True, format="pdf", filename="decisiontree_pdf")

　可以生成一張賊帥的決策樹PDF

　python sklearn決策樹運(yùn)用

　　數(shù)據(jù)形式（tree.csv）

age look income orderly target
older ugly low yes no
young ugly high no no
young handsome low no no
young handsome high yes yes
young handsome medium yes yes
young handsome medium no no

python源代碼：

# -*- coding:utf-8*-
# 將字典 轉(zhuǎn)化為 sklearn 用的數(shù)據(jù)形式 數(shù)據(jù)型 矩陣
from sklearn.feature_extraction import DictVectorizer
import csv
from sklearn import preprocessing
from sklearn import tree

allElectronicsData = open('c:/pic/data/tree.csv','rb')
reader = csv.reader(allElectronicsData)
header = reader.next()
# print header
## 數(shù)據(jù)預(yù)處理
featureList = []
labelList = []
for row in reader:
    # print row[-1]
    labelList.append(row[-1])
    # 下面這幾步的目的是為了讓特征值轉(zhuǎn)化成一種字典的形式，就可以調(diào)用sk-learn里面的DictVectorizer，直接將特征的類別值轉(zhuǎn)化成0,1值
    rowDict = {}
    for i in range(1, len(row) - 1):
        rowDict[header[i]] = row[i]
    featureList.append(rowDict)

for each in featureList:
    print each

# Vectorize features
vec = DictVectorizer()
dummyX = vec.fit_transform(featureList).toarray()
print("dummyX:"+str(dummyX))
print(vec.get_feature_names())

# label的轉(zhuǎn)化，直接用preprocessing的LabelBinarizer方法
lb = preprocessing.LabelBinarizer()
dummyY = lb.fit_transform(labelList)
print("dummyY:"+str(dummyY))
print("labelList:"+str(labelList))

#criterion是選擇決策樹節(jié)點(diǎn)的 標(biāo)準(zhǔn) ，這里是按照“熵”為標(biāo)準(zhǔn)，即ID3算法；默認(rèn)標(biāo)準(zhǔn)是gini index，即CART算法。
clf = tree.DecisionTreeClassifier()
clf = clf.fit(dummyX,dummyY)
print("clf:"+str(clf))
# 導(dǎo)入相關(guān)函數(shù)，可視化決策樹
# 導(dǎo)出的結(jié)果是一個(gè)dot文件(在系統(tǒng)默認(rèn)路勁)，需要安裝Graphviz才能將它住哪華為PDF或png格式
# 輸出的dot文件可以使用graphvize軟件轉(zhuǎn)為PDF，graphvize安裝目錄中的bin目錄放入到環(huán)境變量的Path中
# 使用如下命令
#cmd
# dot -Tpdf  c:/tree.dot -o c:/tree.pdf
#下載地址：http://www.graphviz.org/Download_windows.php
#生成dot文件
with open("c:/tree.dot",'w') as f:
    f = tree.export_graphviz(clf, feature_names= vec.get_feature_names(),out_file= f)

以上就是小編給大家的詳細(xì)解答了，希望可以為各位讀者帶來幫助

GPU云服務(wù)器云服務(wù)器馬爾可夫決策過程并保存截圖保存并顯示數(shù)據(jù)倉(cāng)庫(kù)的實(shí)現(xiàn)過程

文章版權(quán)歸作者所有，未經(jīng)允許請(qǐng)勿轉(zhuǎn)載,若此文章存在違規(guī)行為，您可以聯(lián)系管理員刪除。

轉(zhuǎn)載請(qǐng)注明本文地址：http://systransis.cn/yun/127554.html

發(fā)表評(píng)論

登陸后可評(píng)論

0條評(píng)論

89542767

男|高級(jí)講師

我要關(guān)注我要私信

TA的文章

pythontime控制模塊時(shí)間格式與結(jié)構(gòu)型時(shí)長(zhǎng)詳細(xì)說明

閱讀 928·2023-01-14 11:38
OpenMV與JSON編碼問題分析

閱讀 902·2023-01-14 11:04
python中的特性管理模式詳細(xì)說明

閱讀 759·2023-01-14 10:48
Python運(yùn)用fastapi完成上傳圖片

閱讀 2065·2023-01-14 10:34
pythonopencv圖象高通濾波和低通濾波器的范例編碼

閱讀 968·2023-01-14 10:24
Python根據(jù)ssh遠(yuǎn)程桌面連接Mysql數(shù)據(jù)庫(kù)操作

閱讀 844·2023-01-14 10:18
本文輕輕松松掌握Python中類的繼承

閱讀 512·2023-01-14 10:09
python中wordcloud組裝方式總結(jié)

閱讀 591·2023-01-14 10:02

成人国产在线小视频_日韩寡妇人妻调教在线播放_色成人www永久在线观看_2018国产精品久久_亚洲欧美高清在线30p_亚洲少妇综合一区_黄色在线播放国产_亚洲另类技巧小说校园_国产主播xx日韩_a级毛片在线免费

資訊專欄INFORMATION COLUMN

上云采購(gòu)季！| 2核2G4M爆款云服務(wù)器低至59元/年，更有多臺(tái)、長(zhǎng)期優(yōu)惠，快來選購(gòu)！

python sklearn：教你如何畫出決策書，并保存為PDF的實(shí)現(xiàn)過程

相關(guān)文章

分類算法之決策樹（應(yīng)用篇）

第7期 Datawhale 組隊(duì)學(xué)習(xí)計(jì)劃

機(jī)器學(xué)習(xí)--決策樹--dot轉(zhuǎn)存pdf

發(fā)表評(píng)論

0條評(píng)論

89542767

男|高級(jí)講師

TA的文章

pythontime控制模塊時(shí)間格式與結(jié)構(gòu)型時(shí)長(zhǎng)詳細(xì)說明

OpenMV與JSON編碼問題分析

python中的特性管理模式詳細(xì)說明

Python運(yùn)用fastapi完成上傳圖片

pythonopencv圖象高通濾波和低通濾波器的范例編碼

Python根據(jù)ssh遠(yuǎn)程桌面連接Mysql數(shù)據(jù)庫(kù)操作

本文輕輕松松掌握Python中類的繼承

python中wordcloud組裝方式總結(jié)

最新活動(dòng)

資訊專欄INFORMATION COLUMN

上云采購(gòu)季！| 2核2G4M爆款云服務(wù)器低至59元/年，更有多臺(tái)、長(zhǎng)期優(yōu)惠，快來選購(gòu)！

python sklearn：教你如何畫出決策書，并保存為PDF的實(shí)現(xiàn)過程

相關(guān)文章

發(fā)表評(píng)論

0條評(píng)論

男|高級(jí)講師

TA的文章

最新活動(dòng)

上云采購(gòu)季！| 2核2G4M爆款云服務(wù)器低至59元/年，更有多臺(tái)、長(zhǎng)期優(yōu)惠，快來選購(gòu)！