摘要:項(xiàng)目目標(biāo)數(shù)據(jù)是來自于地區(qū)的公共學(xué)校的數(shù)據(jù),具體描述了學(xué)校的坐標(biāo),名字,類型等。基于此數(shù)據(jù),我們可以學(xué)習(xí)一些基本的數(shù)據(jù)分析的方法。例如,研究學(xué)校的分布情況,類型統(tǒng)計(jì)等。
項(xiàng)目目標(biāo):
Boston Public Schools Geo數(shù)據(jù)是來自于Boston地區(qū)的公共學(xué)校的數(shù)據(jù),具體描述了學(xué)校的坐標(biāo),名字,類型等?;诖藬?shù)據(jù),我們可以學(xué)習(xí)一些基本的Python數(shù)據(jù)分析的方法。例如,研究學(xué)校的分布情況,類型統(tǒng)計(jì)等。
數(shù)據(jù)集介紹:
數(shù)據(jù)集的介紹如下,其中比較重要的字段有X,Y坐標(biāo),ADDRESS地址,ZIPCODE,School類型
Data columns (total 21 columns):
X 131 non-null float64
Y 131 non-null float64
OBJECTID_1 131 non-null int64
OBJECTID 131 non-null int64
BLDG_ID 131 non-null int64
BLDG_NAME 131 non-null object
ADDRESS 131 non-null object
CITY 131 non-null object
ZIPCODE 131 non-null int64
CSP_SCH_ID 131 non-null int64
SCH_ID 131 non-null int64
SCH_NAME 131 non-null object
SCH_LABEL 131 non-null object
SCH_TYPE 131 non-null object
SHARED 131 non-null object
COMPLEX 131 non-null object
Label 131 non-null int64
TLT 131 non-null int64
PL 131 non-null object
POINT_X 131 non-null float64
POINT_Y 131 non-null float64
關(guān)鍵代碼實(shí)現(xiàn):
加載數(shù)據(jù)
schools = pd.read_csv("../input/Public_Schools.csv")
schools.info()
可以看到數(shù)據(jù)字段如下,一共有21個(gè)字段,其中有9個(gè)Object類型,4個(gè)float64, 8個(gè)int64
RangeIndex: 131 entries, 0 to 130
Data columns (total 21 columns):
X 131 non-null float64
Y 131 non-null float64
OBJECTID_1 131 non-null int64
OBJECTID 131 non-null int64
BLDG_ID 131 non-null int64
BLDG_NAME 131 non-null object
ADDRESS 131 non-null object
CITY 131 non-null object
ZIPCODE 131 non-null int64
CSP_SCH_ID 131 non-null int64
SCH_ID 131 non-null int64
SCH_NAME 131 non-null object
SCH_LABEL 131 non-null object
SCH_TYPE 131 non-null object
SHARED 131 non-null object
COMPLEX 131 non-null object
Label 131 non-null int64
TLT 131 non-null int64
PL 131 non-null object
POINT_X 131 non-null float64
POINT_Y 131 non-null float64
dtypes: float64(4), int64(8), object(9)
memory usage: 21.6+ KB
2.接下來,探索數(shù)據(jù)的缺失值
schools.isnull().any()
可以看到,數(shù)據(jù)沒有缺失值
1 X False
2 Y False
3 OBJECTID_1 False
4 OBJECTID False
5 BLDG_ID False
6 BLDG_NAME False
7 ADDRESS False
8 CITY False
9 ZIPCODE False
10 CSP_SCH_ID False
11 SCH_ID False
12 SCH_NAME False
13 SCH_LABEL False
14 SCH_TYPE False
15 SHARED False
16 COMPLEX False
17 Label False
18 TLT False
19 PL False
20 POINT_X False
21 POINT_Y False
22 dtype: bool
接下來,Count frequency of schools in each city
1 schools_per_city = schools["CITY"].value_counts()
2 sns.set()
3 plt.rcParams["figure.figsize"] = [20, 7]
4 sns.barplot(x=schools_per_city.index, y=schools_per_city.get_values())
可以看到不同地區(qū)的公立學(xué)校不同數(shù)量
按照ZIPCode統(tǒng)計(jì)學(xué)校情況
1 school_zipcode = schools["ZIPCODE"].value_counts() sns.set()
2 sns.barplot(x=school_zipcode.index, y=school_zipcode.get_values())
文章版權(quán)歸作者所有,未經(jīng)允許請(qǐng)勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。
轉(zhuǎn)載請(qǐng)注明本文地址:http://systransis.cn/yun/45006.html
摘要:項(xiàng)目目標(biāo)數(shù)據(jù)是來自于地區(qū)的公共學(xué)校的數(shù)據(jù),具體描述了學(xué)校的坐標(biāo),名字,類型等。基于此數(shù)據(jù),我們可以學(xué)習(xí)一些基本的數(shù)據(jù)分析的方法。例如,研究學(xué)校的分布情況,類型統(tǒng)計(jì)等。 項(xiàng)目目標(biāo): Boston Public Schools Geo數(shù)據(jù)是來自于Boston地區(qū)的公共學(xué)校的數(shù)據(jù),具體描述了學(xué)校的坐標(biāo),名字,類型等?;诖藬?shù)據(jù),我們可以學(xué)習(xí)一些基本的Python數(shù)據(jù)分析的方法。例如,研究學(xué)校...
摘要:作者譯者校對(duì)出品翻譯組編程派這是如何打造數(shù)據(jù)科學(xué)作品集系列教程的第一篇。我們將介紹怎樣打造作品集中的第一個(gè)項(xiàng)目,怎樣使用數(shù)據(jù)講述一個(gè)有效的故事。班級(jí)大小紐約市每所學(xué)校班級(jí)規(guī)模數(shù)據(jù)。 作者:Vik Paruchuri譯者:Nick Tang校對(duì):EarlGrey出品:PythonTG 翻譯組/編程派 這是「如何打造數(shù)據(jù)科學(xué)作品集」系列教程的第一篇。如果覺得不錯(cuò),可以訂閱我們第一時(shí)間獲取最...
摘要:汽車本身就是復(fù)雜產(chǎn)品對(duì)象,其制造過程可以形象的表示建造者模式。另一輛法拉利,。法拉利具體建造者代碼如下構(gòu)造法拉利的第一部分。咻咻法拉利已造好三建造者模式的優(yōu)缺點(diǎn)優(yōu)點(diǎn)降低代碼耦合度。 在未上大學(xué)之前,一直有個(gè)夢(mèng)想I have a dream!,就是能成為一位汽車工程師,一直幻想著開著自己設(shè)計(jì)的汽車飛奔在公路上,迷倒了萬千少女。咳咳~~雖然現(xiàn)在沒實(shí)現(xiàn)我的dream,但夢(mèng)想還是得有的。 說到...
閱讀 3182·2021-11-22 15:25
閱讀 3861·2021-11-17 09:33
閱讀 3375·2021-11-08 13:15
閱讀 3055·2021-09-22 10:56
閱讀 546·2021-08-31 09:45
閱讀 2758·2019-08-30 13:49
閱讀 3085·2019-08-30 12:52
閱讀 1149·2019-08-29 17:05