本文關(guān)鍵闡述了python大數(shù)據(jù)可視化制作趨勢線和界限統(tǒng)計圖表,python制作趨勢線,呈現(xiàn)2個自變量的關(guān)系,當數(shù)據(jù)信息包括多個時,應(yīng)用不一樣顏色形狀區(qū)別
一、制作趨勢線
實現(xiàn)方案:
python制作趨勢線,呈現(xiàn)2個自變量的關(guān)系,當數(shù)據(jù)信息包括多個時,應(yīng)用不一樣顏色形狀區(qū)別。
實現(xiàn)代碼:
import numpy as np import pandas as pd import matplotlib as mpl import matplotlib.pyplot as plt import seaborn as sns import warnings warnings.filterwarnings(action='once') plt.style.use('seaborn-whitegrid') sns.set_style("whitegrid") print(mpl.__version__) print(sns.__version__) def draw_scatter(file): #Import dataset midwest=pd.read_csv(file) #Prepare Data #Create as many colors as there are unique midwest['category'] categories=np.unique(midwest['category']) colors=[plt.cm.Set1(i/float(len(categories)-1))for i in range(len(categories))] #Draw Plot for Each Category plt.figure(figsize=(10,6),dpi=100,facecolor='w',edgecolor='k') for i,category in enumerate(categories): plt.scatter('area','poptotal',data=midwest.loc[midwest.category==category,:],s=20,c=colors<i>,label=str(category)) #Decorations plt.gca().set(xlim=(0.0,0.1),ylim=(0,90000),) plt.xticks(fontsize=10) plt.yticks(fontsize=10) plt.xlabel('Area',fontdict={'fontsize':10}) plt.ylabel('Population',fontdict={'fontsize':10}) plt.title("Scatterplot of Midwest Area vs Population",fontsize=12) plt.legend(fontsize=10) plt.show() draw_scatter("F:數(shù)據(jù)雜壇datasetsmidwest_filter.csv")
實現(xiàn)效果:
二、繪制邊界氣泡圖
實現(xiàn)功能:
氣泡圖是散點圖中的一種類型,可以展現(xiàn)三個數(shù)值變量之間的關(guān)系,之前的文章介紹過一般的散點圖都是反映兩個數(shù)值型變量的關(guān)系,所以如果還想通過散點圖添加第三個數(shù)值型變量的信息,一般可以使用氣泡圖。氣泡圖的實質(zhì)就是通過第三個數(shù)值型變量控制每個散點的大小,點越大,代表的第三維數(shù)值越高,反之亦然。而邊界氣泡圖則是在氣泡圖添加第四個類別型變量的信息,將一些重要的點選出來并連接。
實現(xiàn)代碼:
import numpy as np import pandas as pd import matplotlib as mpl import matplotlib.pyplot as plt import seaborn as sns import warnings from scipy.spatial import ConvexHull warnings.filterwarnings(action='once') plt.style.use('seaborn-whitegrid') sns.set_style("whitegrid") print(mpl.__version__) print(sns.__version__) def draw_scatter(file): #Step 1:Prepare Data midwest=pd.read_csv(file) #As many colors as there are unique midwest['category'] categories=np.unique(midwest['category']) colors=[plt.cm.Set1(i/float(len(categories)-1))for i in range(len(categories))] #Step 2:Draw Scatterplot with unique color for each category fig=plt.figure(figsize=(10,6),dpi=80,facecolor='w',edgecolor='k') for i,category in enumerate(categories): plt.scatter('area','poptotal',data=midwest.loc[midwest.category==category,:],s='dot_size',c=colors<i>,label=str(category),edgecolors='black',linewidths=.5) #Step 3:Encircling #https://stackoverflow.com/questions/44575681/how-do-i-encircle-different-data-sets-in-scatter-plot def encircle(x,y,ax=None,**kw):#定義encircle函數(shù),圈出重點關(guān)注的點 if not ax:ax=plt.gca() p=np.c_[x,y] hull=ConvexHull(p) poly=plt.Polygon(p[hull.vertices,:],**kw) ax.add_patch(poly) #Select data to be encircled midwest_encircle_data1=midwest.loc[midwest.state=='IN',:] encircle(midwest_encircle_data1.area,midwest_encircle_data1.poptotal,ec="pink",fc="#74C476",alpha=0.3) encircle(midwest_encircle_data1.area,midwest_encircle_data1.poptotal,ec="g",fc="none",linewidth=1.5) midwest_encircle_data6=midwest.loc[midwest.state=='WI',:] encircle(midwest_encircle_data6.area,midwest_encircle_data6.poptotal,ec="pink",fc="black",alpha=0.3) encircle(midwest_encircle_data6.area,midwest_encircle_data6.poptotal,ec="black",fc="none",linewidth=1.5,linestyle='--') #Step 4:Decorations plt.gca().set(xlim=(0.0,0.1),ylim=(0,90000),) plt.xticks(fontsize=12) plt.yticks(fontsize=12) plt.xlabel('Area',fontdict={'fontsize':14}) plt.ylabel('Population',fontdict={'fontsize':14}) plt.title("Bubble Plot with Encircling",fontsize=14) plt.legend(fontsize=10) plt.show() draw_scatter("F:數(shù)據(jù)雜壇datasetsmidwest_filter.csv")
實現(xiàn)效果:
綜上所述,這篇文章就給大家介紹到這里了,希望可以給大家?guī)韼椭?/p>
文章版權(quán)歸作者所有,未經(jīng)允許請勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。
轉(zhuǎn)載請注明本文地址:http://systransis.cn/yun/130271.html
摘要:俗話說,不會使用工具來完成任務(wù)的都是進化不完全的表現(xiàn),大數(shù)據(jù)時代,可視化已經(jīng)深深鉆進我們的生活,使用可視化工具也變的相當普遍,今天我們來總結(jié)下當下可視化工具都有哪些。是一個地圖庫,主要面向數(shù)據(jù)可視化用戶。 俗話說,不會使用工具來完成任務(wù)的都是進化不完全的表現(xiàn),大數(shù)據(jù)時代,可視化已經(jīng)深深鉆進我們的生活,使用可視化工具也變的相當普遍,今天我們來總結(jié)下當下可視化工具都有哪些。 showImg...
摘要:這些功能和詞匯聽起來非常復(fù)雜,似乎對業(yè)務(wù)人員要求很高,但像網(wǎng)易有數(shù)這樣的敏捷可視化分析工具不僅具備這樣的能力,而且易學易用,業(yè)務(wù)人員只需簡單拖拽,就能輕松制作出兼具敏捷分析與精美展示的報告。 歡迎訪問網(wǎng)易云社區(qū),了解更多網(wǎng)易技術(shù)產(chǎn)品運營經(jīng)驗。 在回答小企業(yè)是否需要數(shù)據(jù)分析這個問題之前,不妨先想想下面兩個問題: 你在電腦上建過表格嗎? 你基于表格中的數(shù)據(jù)畫過柱形圖、餅狀圖、折線圖嗎? 可...
摘要:下面,作者介紹了八種在中實現(xiàn)的可視化工具包,其中有些包還能用在其它語言中。當提到這些可視化工具時,我想到三個詞探索數(shù)據(jù)分析。還可以選擇樣式,它模擬了像和等很流行的美化工具。有很多數(shù)據(jù)可視化的包,但沒法說哪個是最好的。 showImg(https://segmentfault.com/img/remote/1460000019029121); 作者:Aaron Frederick 喜歡用...
閱讀 892·2023-01-14 11:38
閱讀 837·2023-01-14 11:04
閱讀 688·2023-01-14 10:48
閱讀 1892·2023-01-14 10:34
閱讀 895·2023-01-14 10:24
閱讀 753·2023-01-14 10:18
閱讀 482·2023-01-14 10:09
閱讀 522·2023-01-14 10:02