成人国产在线小视频_日韩寡妇人妻调教在线播放_色成人www永久在线观看_2018国产精品久久_亚洲欧美高清在线30p_亚洲少妇综合一区_黄色在线播放国产_亚洲另类技巧小说校园_国产主播xx日韩_a级毛片在线免费

資訊專欄INFORMATION COLUMN

python大數(shù)據(jù)可視化制作趨勢線和界限統(tǒng)計圖表

89542767 / 623人閱讀

  本文關(guān)鍵闡述了python大數(shù)據(jù)可視化制作趨勢線和界限統(tǒng)計圖表,python制作趨勢線,呈現(xiàn)2個自變量的關(guān)系,當數(shù)據(jù)信息包括多個時,應(yīng)用不一樣顏色形狀區(qū)別


  一、制作趨勢線


  實現(xiàn)方案:


  python制作趨勢線,呈現(xiàn)2個自變量的關(guān)系,當數(shù)據(jù)信息包括多個時,應(yīng)用不一樣顏色形狀區(qū)別。


  實現(xiàn)代碼:


  import numpy as np
  import pandas as pd
  import matplotlib as mpl
  import matplotlib.pyplot as plt
  import seaborn as sns
  import warnings
  warnings.filterwarnings(action='once')
  plt.style.use('seaborn-whitegrid')
  sns.set_style("whitegrid")
  print(mpl.__version__)
  print(sns.__version__)
  def draw_scatter(file):
  #Import dataset
  midwest=pd.read_csv(file)
  #Prepare Data
  #Create as many colors as there are unique midwest['category']
  categories=np.unique(midwest['category'])
  colors=[plt.cm.Set1(i/float(len(categories)-1))for i in range(len(categories))]
  #Draw Plot for Each Category
  plt.figure(figsize=(10,6),dpi=100,facecolor='w',edgecolor='k')
  for i,category in enumerate(categories):
  plt.scatter('area','poptotal',data=midwest.loc[midwest.category==category,:],s=20,c=colors<i>,label=str(category))
  #Decorations
  plt.gca().set(xlim=(0.0,0.1),ylim=(0,90000),)
  plt.xticks(fontsize=10)
  plt.yticks(fontsize=10)
  plt.xlabel('Area',fontdict={'fontsize':10})
  plt.ylabel('Population',fontdict={'fontsize':10})
  plt.title("Scatterplot of Midwest Area vs Population",fontsize=12)
  plt.legend(fontsize=10)
  plt.show()
  draw_scatter("F:數(shù)據(jù)雜壇datasetsmidwest_filter.csv")


  實現(xiàn)效果:

01.png

  二、繪制邊界氣泡圖


  實現(xiàn)功能:


  氣泡圖是散點圖中的一種類型,可以展現(xiàn)三個數(shù)值變量之間的關(guān)系,之前的文章介紹過一般的散點圖都是反映兩個數(shù)值型變量的關(guān)系,所以如果還想通過散點圖添加第三個數(shù)值型變量的信息,一般可以使用氣泡圖。氣泡圖的實質(zhì)就是通過第三個數(shù)值型變量控制每個散點的大小,點越大,代表的第三維數(shù)值越高,反之亦然。而邊界氣泡圖則是在氣泡圖添加第四個類別型變量的信息,將一些重要的點選出來并連接。


  實現(xiàn)代碼:


  import numpy as np
  import pandas as pd
  import matplotlib as mpl
  import matplotlib.pyplot as plt
  import seaborn as sns
  import warnings
  from scipy.spatial import ConvexHull
  warnings.filterwarnings(action='once')
  plt.style.use('seaborn-whitegrid')
  sns.set_style("whitegrid")
  print(mpl.__version__)
  print(sns.__version__)
  def draw_scatter(file):
  #Step 1:Prepare Data
  midwest=pd.read_csv(file)
  #As many colors as there are unique midwest['category']
  categories=np.unique(midwest['category'])
  colors=[plt.cm.Set1(i/float(len(categories)-1))for i in range(len(categories))]
  #Step 2:Draw Scatterplot with unique color for each category
  fig=plt.figure(figsize=(10,6),dpi=80,facecolor='w',edgecolor='k')
  for i,category in enumerate(categories):
  plt.scatter('area','poptotal',data=midwest.loc[midwest.category==category,:],s='dot_size',c=colors<i>,label=str(category),edgecolors='black',linewidths=.5)
  #Step 3:Encircling
  #https://stackoverflow.com/questions/44575681/how-do-i-encircle-different-data-sets-in-scatter-plot
  def encircle(x,y,ax=None,**kw):#定義encircle函數(shù),圈出重點關(guān)注的點
  if not ax:ax=plt.gca()
  p=np.c_[x,y]
  hull=ConvexHull(p)
  poly=plt.Polygon(p[hull.vertices,:],**kw)
  ax.add_patch(poly)
  #Select data to be encircled
  midwest_encircle_data1=midwest.loc[midwest.state=='IN',:]
  encircle(midwest_encircle_data1.area,midwest_encircle_data1.poptotal,ec="pink",fc="#74C476",alpha=0.3)
  encircle(midwest_encircle_data1.area,midwest_encircle_data1.poptotal,ec="g",fc="none",linewidth=1.5)
  midwest_encircle_data6=midwest.loc[midwest.state=='WI',:]
  encircle(midwest_encircle_data6.area,midwest_encircle_data6.poptotal,ec="pink",fc="black",alpha=0.3)
  encircle(midwest_encircle_data6.area,midwest_encircle_data6.poptotal,ec="black",fc="none",linewidth=1.5,linestyle='--')
  #Step 4:Decorations
  plt.gca().set(xlim=(0.0,0.1),ylim=(0,90000),)
  plt.xticks(fontsize=12)
  plt.yticks(fontsize=12)
  plt.xlabel('Area',fontdict={'fontsize':14})
  plt.ylabel('Population',fontdict={'fontsize':14})
  plt.title("Bubble Plot with Encircling",fontsize=14)
  plt.legend(fontsize=10)
  plt.show()
  draw_scatter("F:數(shù)據(jù)雜壇datasetsmidwest_filter.csv")


  實現(xiàn)效果:

02.png

  綜上所述,這篇文章就給大家介紹到這里了,希望可以給大家?guī)韼椭?/p>

文章版權(quán)歸作者所有,未經(jīng)允許請勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。

轉(zhuǎn)載請注明本文地址:http://systransis.cn/yun/130271.html

相關(guān)文章

  • 常用的數(shù)據(jù)視化工具

    摘要:俗話說,不會使用工具來完成任務(wù)的都是進化不完全的表現(xiàn),大數(shù)據(jù)時代,可視化已經(jīng)深深鉆進我們的生活,使用可視化工具也變的相當普遍,今天我們來總結(jié)下當下可視化工具都有哪些。是一個地圖庫,主要面向數(shù)據(jù)可視化用戶。 俗話說,不會使用工具來完成任務(wù)的都是進化不完全的表現(xiàn),大數(shù)據(jù)時代,可視化已經(jīng)深深鉆進我們的生活,使用可視化工具也變的相當普遍,今天我們來總結(jié)下當下可視化工具都有哪些。 showImg...

    philadelphia 評論0 收藏0
  • 小企業(yè)需要數(shù)據(jù)分析嗎?

    摘要:這些功能和詞匯聽起來非常復(fù)雜,似乎對業(yè)務(wù)人員要求很高,但像網(wǎng)易有數(shù)這樣的敏捷可視化分析工具不僅具備這樣的能力,而且易學易用,業(yè)務(wù)人員只需簡單拖拽,就能輕松制作出兼具敏捷分析與精美展示的報告。 歡迎訪問網(wǎng)易云社區(qū),了解更多網(wǎng)易技術(shù)產(chǎn)品運營經(jīng)驗。 在回答小企業(yè)是否需要數(shù)據(jù)分析這個問題之前,不妨先想想下面兩個問題: 你在電腦上建過表格嗎? 你基于表格中的數(shù)據(jù)畫過柱形圖、餅狀圖、折線圖嗎? 可...

    baishancloud 評論0 收藏0
  • 這里有8個流行的Python視化工具包,你喜歡哪個?

    摘要:下面,作者介紹了八種在中實現(xiàn)的可視化工具包,其中有些包還能用在其它語言中。當提到這些可視化工具時,我想到三個詞探索數(shù)據(jù)分析。還可以選擇樣式,它模擬了像和等很流行的美化工具。有很多數(shù)據(jù)可視化的包,但沒法說哪個是最好的。 showImg(https://segmentfault.com/img/remote/1460000019029121); 作者:Aaron Frederick 喜歡用...

    testbird 評論0 收藏0

發(fā)表評論

0條評論

最新活動
閱讀需要支付1元查看
<