摘要:問題來源問我有一個(gè),我想刪除它特定列中字符串差姑娘是大于的行,我知道我可以使用來去除包含的行,但我沒有找到如何根據(jù)條件刪除行。如果要應(yīng)用于列中的每個(gè)元素,請(qǐng)使用。例如刪除列和的所有行
問題來源:https://stackoverflow.com/que...
問:
我有一個(gè)pandas DataFrame,我想刪除它特定列中字符串差姑娘是大于2的行,我知道我可以使用df.dropna()來去除包含NaN的行,但我沒有找到如何根據(jù)條件刪除行。
似乎我能夠這樣做:
df[(len(df["column name"]) < 2)]
但卻報(bào)錯(cuò)了:
KeyError: u"no item named False"
誰能告訴我錯(cuò)在哪里了?
回答一:
當(dāng)你這樣做時(shí),len(df["column name"])你只得到一個(gè)數(shù)字,即DataFrame中的行數(shù)(即列本身的長度)。如果要應(yīng)用于len列中的每個(gè)元素,請(qǐng)使用df["column name"].map(len)。
嘗試使用:
df[df["column name"].map(len) < 2]
評(píng)論:
我想出了一種使用列表解析的方法:df[[(len(x) < 2) for x in df["column name"]]] 但是你這種方法更好些。
回答二:
要直接回答這個(gè)問題,一種方法是使用drop方法:
df = df.drop(some labels) df = df.drop(df[].index)
要?jiǎng)h除列“score”<50的所有行:
df = df.drop(df[df.score < 50].index)
替換版本
df.drop(df[df.score < 50].index, inplace=True)
多條件情況:
可以使用操作符: | 只需其中一個(gè)成立, & 同時(shí)成立, ~ 表示取反,它們要用括號(hào)括起來。
例如刪除列“score<50 和>20的所有行
df = df.drop(df[(df.score < 50) & (df.score > 20)].index)
文章版權(quán)歸作者所有,未經(jīng)允許請(qǐng)勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。
轉(zhuǎn)載請(qǐng)注明本文地址:http://systransis.cn/yun/43354.html
摘要:前言在數(shù)據(jù)分析和建模之前需要審查數(shù)據(jù)是否滿足數(shù)據(jù)處理應(yīng)用的要求,以及對(duì)數(shù)據(jù)進(jìn)行清洗,轉(zhuǎn)化,合并,重塑等一系列規(guī)整化處理。通過數(shù)據(jù)信息查看可知數(shù)據(jù)中存在缺失值,比如各存在個(gè),各存在個(gè)。 前言 在數(shù)據(jù)分析和建模之前需要審查數(shù)據(jù)是否滿足數(shù)據(jù)處理應(yīng)用的要求,以及對(duì)數(shù)據(jù)進(jìn)行清洗,轉(zhuǎn)化,合并,重塑等一系列規(guī)整化處理。pandas標(biāo)準(zhǔn)庫提供了高級(jí)靈活的方法,能夠輕松地將數(shù)據(jù)規(guī)整化為正確的形式,本文通...
前言: 先感受一下數(shù)據(jù)科學(xué)的魅力,上圖是在Smart Dubai 2017 GITEX科技周展臺(tái)上推出Smart Decision-Making Platform(智能決策平臺(tái)),于10月8日至12日在迪拜世界貿(mào)易中心舉行。游客可以通過一個(gè)沉浸式的空間將數(shù)據(jù)可視化,讓他們了解迪拜的未來。讓參觀者可以在現(xiàn)場查閱觀看全市數(shù)據(jù),這意味著迪拜將成為了世界上第一個(gè)與公眾分享實(shí)時(shí)實(shí)時(shí)數(shù)據(jù)的城市,同時(shí)還可以預(yù)...
摘要:查看數(shù)據(jù)的基本統(tǒng)計(jì)信息。用處是用于數(shù)據(jù)讀寫處理更改提取等一系列操作的包,可以說,所有能實(shí)現(xiàn)的功能,都可以通過代碼輕松實(shí)現(xiàn),因此,對(duì)于學(xué)習(xí)非常重要。如果在里,需要翻到最低和最右,而且可能由于溢出無法窮盡可以簡單的實(shí)現(xiàn)。 放在前面的話? ? ????? ? ? ?? ????????這學(xué)期刻意少...
摘要:中面向行和面向列的操作基本是平衡的。用層次化索引,將其表示為更高維度的數(shù)據(jù)。使用浮點(diǎn)值表示浮點(diǎn)和非浮點(diǎn)數(shù)組中的缺失數(shù)據(jù)。索引的的格式化輸出形式選取數(shù)據(jù)子集在內(nèi)層中進(jìn)行選取層次化索引在數(shù)據(jù)重塑和基于分組的操作中很重要。 我們?cè)谏弦黄榻B了 NumPy,本篇介紹 pandas。 pandas入門 Pandas 是基于Numpy構(gòu)建的,讓以NumPy為中心的應(yīng)用變的更加簡單。 pandas...
摘要:在這些情況下,了解如何從標(biāo)準(zhǔn)列表或字典創(chuàng)建會(huì)很有幫助。大多數(shù)人會(huì)注意到列的順序看起來不對(duì)。這個(gè)問題出現(xiàn)的原因是標(biāo)準(zhǔn)的字典不保留其鍵的順序。列表從創(chuàng)建的另一個(gè)選擇是將數(shù)據(jù)包含在列表結(jié)構(gòu)中。 介紹 每當(dāng)我使用pandas進(jìn)行分析時(shí),我的第一個(gè)目標(biāo)是使用眾多可用選項(xiàng)中的一個(gè)將數(shù)據(jù)導(dǎo)入Pandas的DataFrame 。對(duì)于絕大多數(shù)情況下,我使用的 read_excel , read_csv ...
閱讀 3719·2021-11-19 09:56
閱讀 1513·2021-09-22 15:11
閱讀 1189·2019-08-30 15:55
閱讀 3401·2019-08-29 14:02
閱讀 2955·2019-08-29 11:07
閱讀 465·2019-08-28 17:52
閱讀 3195·2019-08-26 13:59
閱讀 461·2019-08-26 13:53