成人国产在线小视频_日韩寡妇人妻调教在线播放_色成人www永久在线观看_2018国产精品久久_亚洲欧美高清在线30p_亚洲少妇综合一区_黄色在线播放国产_亚洲另类技巧小说校园_国产主播xx日韩_a级毛片在线免费

資訊專欄INFORMATION COLUMN

數(shù)據(jù)科學(xué) 第 3 章 4:連接mysql、改類型、索引應(yīng)用

yuxue / 3592人閱讀

今天開始學(xué)習(xí)《數(shù)據(jù)科學(xué)手冊(cè)》,主要學(xué)習(xí)3-5章,其他的選修。

-- 先連接數(shù)據(jù)庫(kù)加載數(shù)據(jù):

用sqlalchemy 的create_engine連接:
注意:代碼里mysql+pymysql: 這部分不能加空格,否則會(huì)報(bào)錯(cuò)

import pymysql
import pandas as pd
from sqlalchemy import  create_engine

sql = "select * from sougou"
engine = create_engine("mysql+pymysql://root:[email protected]/xiaom")
df = pd.read_sql(sql,engine,)

查看每列的格式:

RangeIndex: 2324 entries, 0 to 2323
Data columns (total 6 columns):
date 2324 non-null object
id 2324 non-null object
word 2324 non-null object
rank1 2324 non-null object
number1 2324 non-null object
url 2324 non-null object
dtypes: object(6)
memory usage: 109.0+ KB

-- 改rank1、number1的格式

str轉(zhuǎn)int轉(zhuǎn)換為數(shù)字:https://vimsky.com/article/36...

data =df
data[["rank1","number1"]] = data[["rank1","number1"]].apply(pd.to_numeric,errors="coerce")
data

第3章4-6節(jié):索引 -- loc、iloc、ix的運(yùn)用 1、多重索引 兩個(gè)條件

data[(data["rank1"] > 10) & (data["number1"] > 10)]

2、loc與iloc的區(qū)別:loc[1:3]包含2-4條,iloc為2-3條 ,不含第4條數(shù)據(jù)

3、行列轉(zhuǎn)換:data.T

4、用iloc取指定行列數(shù)據(jù):
data.iloc[1:3,3:4]
data.iloc[:,2:4]
data.iloc[:,:"rank1"]  #從前面取到rank1列

5、沒怎么懂的pd.MultiIndex.from_tuples(),直接跳過 6、設(shè)置索引、索引排序:

set_index(inplace = True) 會(huì)在原數(shù)據(jù)集上修改
sort_index()
reset_index(drop= True) # 重設(shè)索引為默認(rèn)索引

indexdata = data
indexdata.set_index(data["rank1"], inplace = True) 

indexdata.sort_index()

indexdata.reset_index(drop= True)  #重設(shè)索引為默認(rèn)索引

文章版權(quán)歸作者所有,未經(jīng)允許請(qǐng)勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。

轉(zhuǎn)載請(qǐng)注明本文地址:http://systransis.cn/yun/44963.html

相關(guān)文章

  • 數(shù)據(jù)科學(xué) 3 : 7-8 合并、連接數(shù)據(jù)

    摘要:第章合并連接數(shù)據(jù)集包含三個(gè)函數(shù)省略,在頁(yè)。沒有對(duì)默認(rèn)合并兩個(gè)表的所有列,如果有列,有列,則結(jié)果為列多對(duì)保留多條記錄多對(duì)多會(huì)交叉每一條記錄通過參數(shù)設(shè)定連接方式兩個(gè)表都有兩個(gè)字段,則通過連接兩個(gè)表。 第3章 7-8:合并、連接數(shù)據(jù)集 包含三個(gè)函數(shù):numpy:concatenate 省略,在126頁(yè)。pandas:concat/ append(略過) /merge 主要是講merge函數(shù)...

    IntMain 評(píng)論0 收藏0
  • 數(shù)據(jù)科學(xué) 3 : 9 累計(jì)與分組 groupby

    摘要:聚合后沒有用函數(shù),會(huì)返回一個(gè)用函數(shù)后會(huì)顯示計(jì)算結(jié)果組合之后,切片,查看的和??梢栽O(shè)定計(jì)算方法對(duì)列進(jìn)行了切片,如果的均值小于,則不顯示二部的均值低于,所以結(jié)果中沒有二部數(shù)據(jù)。 本節(jié)學(xué)習(xí)groupby 引用激勵(lì)數(shù)據(jù),連接數(shù)據(jù)庫(kù)jili表(代碼省略)數(shù)字簡(jiǎn)單計(jì)算本節(jié)內(nèi)容前面是運(yùn)用sum/mean等函數(shù)對(duì)數(shù)字簡(jiǎn)單計(jì)算 jili.mean() #求均值 jili.mean(axis = col...

    wemallshop 評(píng)論0 收藏0
  • 數(shù)據(jù)科學(xué) 3 10 數(shù)據(jù)透視表

    摘要:官方文檔連接像其他函數(shù)一樣,官方文檔中的參數(shù)有很多,具體如下寫在前面,如果要對(duì)透視表中的字段進(jìn)行計(jì)數(shù),有時(shí)候用會(huì)報(bào)錯(cuò),可以用實(shí)例運(yùn)用簡(jiǎn)單版透視表上面以部門為索引,下面有二級(jí)索引,部門小組。 本節(jié)學(xué)習(xí)數(shù)據(jù)透視表 引用激勵(lì)數(shù)據(jù),連接數(shù)據(jù)庫(kù)jili表,jili這幾個(gè)太難打了,下文用df代表激勵(lì)數(shù)據(jù)(代碼省略)之前在excel中用爛了的透視表,終于用python來實(shí)現(xiàn)了,其實(shí)主要是講pivot...

    lily_wang 評(píng)論0 收藏0
  • 客官,這里有一份《MySQL 必知必會(huì)》讀書筆記,請(qǐng)您笑納!

    摘要:主鍵唯一標(biāo)識(shí)表中每行的這個(gè)列稱為主鍵。不為空,每行數(shù)據(jù)必須具有一個(gè)主鍵值。主要負(fù)責(zé)與用戶進(jìn)行交互,接受用戶的指令,然后發(fā)出請(qǐng)求給,負(fù)責(zé)數(shù)據(jù)訪問和處理,然后將結(jié)果返回給。注意雖然似乎通配符可以匹配任何東西,但有一個(gè)例外,即。 為什么寫這篇文章 因?yàn)槲易罱囊恍┕ぷ鲀?nèi)容跟數(shù)據(jù)分析比較密切,所以需要對(duì)SQL使用得比較熟練,所以便閱讀了《MySQL 必知必會(huì)》這本書,為了檢驗(yàn)自己的閱讀效果及幫...

    liuyix 評(píng)論0 收藏0

發(fā)表評(píng)論

0條評(píng)論

最新活動(dòng)
閱讀需要支付1元查看
<