根据“不在”条件从数据框中删除行[重复]
- 2025-04-15 09:19:00
- admin 原创
- 28
问题描述:
当日期列的值位于日期列表中时,我想从 Pandas DataFrame 中删除行。以下代码不起作用:
a=['2015-01-01' , '2015-02-01']
df=df[df.datecolumn not in a]
我收到以下错误:
ValueError:Series 的真值不明确。请使用 a.empty、a.bool()、a.item()、a.any() 或 a.all()。
解决方案 1:
您可以使用pandas.Dataframe.isin
。
pandas.Dateframe.isin
将根据每个元素是否在列表中返回布尔值a
。然后使用 将其反转,~
即可转换True
为False
,反之亦然。
import pandas as pd
a = ['2015-01-01' , '2015-02-01']
df = pd.DataFrame(data={'date':['2015-01-01' , '2015-02-01', '2015-03-01' , '2015-04-01', '2015-05-01' , '2015-06-01']})
print(df)
# date
#0 2015-01-01
#1 2015-02-01
#2 2015-03-01
#3 2015-04-01
#4 2015-05-01
#5 2015-06-01
df = df[~df['date'].isin(a)]
print(df)
# date
#2 2015-03-01
#3 2015-04-01
#4 2015-05-01
#5 2015-06-01
解决方案 2:
您可以使用Series.isin
:
df = df[~df.datecolumn.isin(a)]
虽然错误消息表明可以使用all()
或any()
,但它们仅在需要将结果简化为单个布尔值时才有用。然而,这并不是您现在要做的,您现在要做的是根据外部列表测试 Series 中每个值的成员资格,并保持结果的完整性(即,一个布尔 Series,然后用于对原始 DataFrame 进行切片)。
您可以在Gotchas中阅读有关此内容的更多信息。
相关推荐
热门文章
项目管理软件有哪些?
热门标签
曾咪二维码
扫码咨询,免费领取项目管理大礼包!
云禅道AD