Python pandas cumsum 每次出现 0 时都会重置-IT科技

Python pandas cumsum 每次出现 0 时都会重置

2025-04-10 09:44:00

admin

原创

摘要：问题描述：我有一个包含 0 和 1 的矩阵，我想对每列进行累加求和，当观察到零时，累加求和将重置为 0。例如，如果我们有以下内容：df = pd.DataFrame([[0,1],[1,1],[0,1],[1,0],[1,1],[0,1]],columns = ['a','b']) print(df) ...

问题描述：

我有一个包含 0 和 1 的矩阵，我想对每列进行累加求和，当观察到零时，累加求和将重置为 0。例如，如果我们有以下内容：

df = pd.DataFrame([[0,1],[1,1],[0,1],[1,0],[1,1],[0,1]],columns = ['a','b'])
print(df)
   a  b
0  0  1
1  1  1
2  0  1
3  1  0
4  1  1
5  0  1

我想要的结果是：

但是，当我尝试时df.cumsum() * df，我能够正确识别 0 个元素，但计数器不会重置：

print(df.cumsum() * df)
   a  b
0  0  1
1  1  2
2  0  3
3  2  0
4  3  4
5  0  5

解决方案 1：

您可以使用：

a = df != 0
df1 = a.cumsum()-a.cumsum().where(~a).ffill().fillna(0).astype(int)
print (df1)
   a  b
0  0  1
1  1  2
2  0  3
3  1  0
4  2  1
5  0  2

解决方案 2：

尝试一下

df = pd.DataFrame([[0,1],[1,1],[0,1],[1,0],[1,1],[0,1]],columns = ['a','b'])
df['groupId1']=df.a.eq(0).cumsum()
df['groupId2']=df.b.eq(0).cumsum()
New=pd.DataFrame()
New['a']=df.groupby('groupId1').a.transform('cumsum')
New['b']=df.groupby('groupId2').b.transform('cumsum')

New
Out[1184]: 
   a  b
0  0  1
1  1  2
2  0  3
3  1  0
4  2  1
5  0  2

解决方案 3：

您也可以尝试以下简单但可靠的方法。

每列 - 创建要在其中计数的组。一旦出现按行排序的连续值差异，组就开始了，并且值保持不变：(x != x.shift()).cumsum()。

示例：

pd.DataFrame使用apply和方法计算每列组内的累积 groupby和，您可以在一行中获得零重置的累积和：

import pandas as pd

df = pd.DataFrame([[0,1],[1,1],[0,1],[1,0],[1,1],[0,1]], columns = ['a','b'])

cs = df.apply(lambda x: x.groupby((x != x.shift()).cumsum()).cumsum())
print(cs)

   a  b
0  0  1
1  1  2
2  0  3
3  1  0
4  2  1
5  0  2

解决方案 4：

一个稍微有点技巧的方法是先确定零的索引，然后在执行之前将相应的值设置为这些索引的负数cumsum：

import pandas as pd
df = pd.DataFrame([[0,1],[1,1],[0,1],[1,0],[1,1],[0,1]],columns = ['a','b'])
z = np.where(df['b']==0)
df['b'][z[0]] = -z[0]
df['b'] = np.cumsum(df['b'])
df

   a  b
0  0  1
1  1  2
2  0  3
3  1  0
4  1  1
5  0  2

问题描述：

解决方案 1：

解决方案 2：

解决方案 3：

解决方案 4：

云端的项目管理软件