成人国产在线小视频_日韩寡妇人妻调教在线播放_色成人www永久在线观看_2018国产精品久久_亚洲欧美高清在线30p_亚洲少妇综合一区_黄色在线播放国产_亚洲另类技巧小说校园_国产主播xx日韩_a级毛片在线免费

資訊專欄INFORMATION COLUMN

利用Pandas和matplotlib分析我愛我家房租區(qū)間頻率

huayeluoliuhen / 2381人閱讀

摘要:前幾天利用爬取了我愛我家的租房的一些數(shù)據(jù),就想著能不能對房租進行一波分析,于是通過書籍和博客等查閱了相關(guān)資料,進行了房租的區(qū)間分析。

前幾天利用python爬取了我愛我家的租房的一些數(shù)據(jù),就想著能不能對房租進行一波分析,于是通過書籍和博客等查閱了相關(guān)資料,進行了房租的區(qū)間分析。不得不說,用python做區(qū)間分析比我之前用sql關(guān)鍵字統(tǒng)計區(qū)間簡單多了,話不多說,上代碼

# coding=utf-8
import pandas as pd
import pymysql
import matplotlib.pyplot as plt

db = pymysql.connect(host="127.0.0.1", port=3306, user="root", passwd="root", db="woaiwojia", charset="utf8")
cursor = db.cursor()
df = pd.read_sql("select  * from zufang ", db)
#以下注釋為對pandas讀取數(shù)據(jù)之后的數(shù)據(jù)處理讀取的嘗試
#前三行
#rows = df[0:3] 
#price和lxrphone兩列
#cols = df[["price", "lxrphone"]]
#aa = pd.DataFrame(df)
#前三行和lxrphone和price列
# print(df.ix[0:3,["price","lxrphone"]])
#讀取數(shù)據(jù)的信息
# print(df.info())
#查看表的描述性信息
# print(df.describe())


#以下為獲取price列的最大最小值并分組
xse = df["price"]
# print(xse.max())
# print(xse.min())
fanwei = list(range(1500, xse.max(), 1500))
fenzu = pd.cut(xse.values, fanwei, right=False)  # 分組區(qū)間,長度91
# print(fenzu.codes)#標簽
# print(fenzu.categories)#分組區(qū)間,長度8
pinshu = fenzu.value_counts()  # series,區(qū)間-個數(shù)
#print(pinshu)
# print(pinshu.index)

#設(shè)置plot的展示格式
pinshu.plot(kind="bar")
qujian = pd.cut(xse, fanwei, right=False)
df["區(qū)間"] = qujian.values
df.groupby("區(qū)間").median()
df.groupby("區(qū)間").mean()

pinshu_df = pd.DataFrame(pinshu, columns=["頻數(shù)"])
pinshu_df["頻率f"] = pinshu_df / pinshu_df["頻數(shù)"].sum()
pinshu_df["頻率%"] = pinshu_df["頻率f"].map(lambda x: "%.2f%%" % (x * 100))

pinshu_df["累計頻率f"] = pinshu_df["頻率f"].cumsum()
pinshu_df["累計頻率%"] = pinshu_df["累計頻率f"].map(lambda x: "%.4f%%" % (x * 100))

print(pinshu_df)

plt.show()

打印的結(jié)果

使用matplotlib.pyplot的show方法展示的數(shù)據(jù)

參考博客 pandas分區(qū)間,算頻率
參考書籍《Python3爬蟲、數(shù)據(jù)清洗與可視化實戰(zhàn)》

文章版權(quán)歸作者所有,未經(jīng)允許請勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。

轉(zhuǎn)載請注明本文地址:http://systransis.cn/yun/42046.html

相關(guān)文章

  • 5種方法教你用Python玩轉(zhuǎn)histogram直方圖

    摘要:使用實現(xiàn)以上是使用純來完成的簡單直方圖,但是從數(shù)學意義上來看,直方圖是分箱到頻數(shù)的一種映射,它可以用來估計變量的概率密度函數(shù)的。第一種情況你是在估計一個未知的概率密度函數(shù),而第二種情況是你是知道分布的,并想知道哪些參數(shù)可以更好的描述數(shù)據(jù)。 作者:xiaoyu 微信公眾號:Python數(shù)據(jù)科學 知乎:python數(shù)據(jù)分析師 直方圖是一個可以快速展示數(shù)據(jù)概率分布的工具,直觀易于理解,并深...

    simpleapples 評論0 收藏0
  • 【數(shù)據(jù)科學系統(tǒng)學習】Python # 數(shù)據(jù)分析基本操作[三] matplotlib

    摘要:有一些表示常見圖形的對象稱為塊,完整的集合位于。中的繪圖函數(shù)在中,有行標簽列標簽分組信息。密度圖通過計算可能會產(chǎn)生觀測數(shù)據(jù)的連續(xù)概率分布的估計而產(chǎn)生的。在探索式數(shù)據(jù)分析工作中,同時觀察一組變量的散布圖是很有意義的。 我們在上一篇介紹了 pandas,本篇介紹 matplotlib。 繪圖和可視化 一個用于創(chuàng)建出版質(zhì)量圖表的桌面繪圖包。 Matplotlib API入門 Figure ...

    BDEEFE 評論0 收藏0
  • ??數(shù)據(jù)科學-Pandas、Numpy、Matplotlib秘籍之精煉總結(jié)

    前言: 先感受一下數(shù)據(jù)科學的魅力,上圖是在Smart Dubai 2017 GITEX科技周展臺上推出Smart Decision-Making Platform(智能決策平臺),于10月8日至12日在迪拜世界貿(mào)易中心舉行。游客可以通過一個沉浸式的空間將數(shù)據(jù)可視化,讓他們了解迪拜的未來。讓參觀者可以在現(xiàn)場查閱觀看全市數(shù)據(jù),這意味著迪拜將成為了世界上第一個與公眾分享實時實時數(shù)據(jù)的城市,同時還可以預...

    Zhuxy 評論0 收藏0
  • Python學習筆記:數(shù)據(jù)可視化(一)

    摘要:當數(shù)據(jù)發(fā)生變化時,這種演變過程隨之發(fā)生。是一種統(tǒng)計報告圖,由一系列高度不等的縱向條紋或線段表示數(shù)據(jù)分布的情況。 showImg(https://segmentfault.com/img/bVbnkP1?w=751&h=558); python相關(guān) 基礎(chǔ)概念 數(shù)據(jù):離散的,客觀事實的數(shù)字表示 信息:處理后的數(shù)據(jù),為實際問題提供答案   - 為數(shù)據(jù)提供一種關(guān)系或一個關(guān)聯(lián)后,數(shù)據(jù)就成了信...

    Crazy_Coder 評論0 收藏0
  • 【精華分享】:轉(zhuǎn)行數(shù)據(jù)分析的一份學習清單

    摘要:數(shù)據(jù)分析的發(fā)展方向一般有商業(yè)方向,行業(yè)分析業(yè)務方向,和機器學習數(shù)據(jù)挖掘方向。機器學習的書籍推薦統(tǒng)計學習方法,機器學習,機器學習實戰(zhàn)三本書。 作者:xiaoyu 微信公眾號:Python數(shù)據(jù)科學 知乎:python數(shù)據(jù)分析師 上一篇主要分享了博主親身轉(zhuǎn)行數(shù)據(jù)分析的經(jīng)歷: 【從零學起到成功轉(zhuǎn)行數(shù)據(jù)分析,我是怎么做的?】 本篇繼上一篇將分享轉(zhuǎn)行數(shù)據(jù)分析的一些經(jīng)驗和學習方法,看完這篇你將會解...

    suemi 評論0 收藏0

發(fā)表評論

0條評論

最新活動
閱讀需要支付1元查看
<