Python pandas cumsum 每次出现 0 时都会重置
- 2025-04-10 09:44:00
- admin 原创
- 21
问题描述:
我有一个包含 0 和 1 的矩阵,我想对每列进行累加求和,当观察到零时,累加求和将重置为 0。例如,如果我们有以下内容:
df = pd.DataFrame([[0,1],[1,1],[0,1],[1,0],[1,1],[0,1]],columns = ['a','b'])
print(df)
a b
0 0 1
1 1 1
2 0 1
3 1 0
4 1 1
5 0 1
我想要的结果是:
print(df)
a b
0 0 1
1 1 2
2 0 3
3 1 0
4 2 1
5 0 2
但是,当我尝试时df.cumsum() * df
,我能够正确识别 0 个元素,但计数器不会重置:
print(df.cumsum() * df)
a b
0 0 1
1 1 2
2 0 3
3 2 0
4 3 4
5 0 5
解决方案 1:
您可以使用:
a = df != 0
df1 = a.cumsum()-a.cumsum().where(~a).ffill().fillna(0).astype(int)
print (df1)
a b
0 0 1
1 1 2
2 0 3
3 1 0
4 2 1
5 0 2
解决方案 2:
尝试一下
df = pd.DataFrame([[0,1],[1,1],[0,1],[1,0],[1,1],[0,1]],columns = ['a','b'])
df['groupId1']=df.a.eq(0).cumsum()
df['groupId2']=df.b.eq(0).cumsum()
New=pd.DataFrame()
New['a']=df.groupby('groupId1').a.transform('cumsum')
New['b']=df.groupby('groupId2').b.transform('cumsum')
New
Out[1184]:
a b
0 0 1
1 1 2
2 0 3
3 1 0
4 2 1
5 0 2
解决方案 3:
您也可以尝试以下简单但可靠的方法。
每列 - 创建要在其中计数的组。一旦出现按行排序的连续值差异,组就开始了,并且值保持不变:(x != x.shift()).cumsum()
。
示例:
a b
0 1 1
1 2 1
2 3 1
3 4 2
4 4 3
5 5 3
pd.DataFrame
使用apply
和方法计算每列组内的累积 groupby
和,您可以在一行中获得零重置的累积和:
import pandas as pd
df = pd.DataFrame([[0,1],[1,1],[0,1],[1,0],[1,1],[0,1]], columns = ['a','b'])
cs = df.apply(lambda x: x.groupby((x != x.shift()).cumsum()).cumsum())
print(cs)
a b
0 0 1
1 1 2
2 0 3
3 1 0
4 2 1
5 0 2
解决方案 4:
一个稍微有点技巧的方法是先确定零的索引,然后在执行之前将相应的值设置为这些索引的负数cumsum
:
import pandas as pd
df = pd.DataFrame([[0,1],[1,1],[0,1],[1,0],[1,1],[0,1]],columns = ['a','b'])
z = np.where(df['b']==0)
df['b'][z[0]] = -z[0]
df['b'] = np.cumsum(df['b'])
df
a b
0 0 1
1 1 2
2 0 3
3 1 0
4 1 1
5 0 2
相关推荐
热门文章
项目管理软件有哪些?
热门标签
曾咪二维码
扫码咨询,免费领取项目管理大礼包!
云禅道AD