如何将熊猫数据框的索引转换为列

2024-12-09 08:29:00
admin
原创
181
摘要:问题描述:如何将数据框的索引转换为列?例如: gi ptt_loc 0 384444683 593 1 384444684 594 2 384444686 596 到 index1 gi ptt_loc 0...

问题描述:

如何将数据框的索引转换为列?

例如:

        gi       ptt_loc
 0  384444683      593  
 1  384444684      594 
 2  384444686      596  

    index1    gi       ptt_loc
 0  0     384444683      593  
 1  1     384444684      594 
 2  2     384444686      596  

解决方案 1:

任何一个:

df['index1'] = df.index

或者.reset_index

df = df.reset_index()

如果您有一个具有 3 个级别索引的多索引框架,例如:

>>> df
                       val
tick       tag obs        
2016-02-26 C   2    0.0139
2016-02-27 A   2    0.5577
2016-02-28 C   6    0.0303

并且您想要将索引中的第一 ( tick) 级和第三 ( ) 级转换为列,您可以执行以下操作:obs

>>> df.reset_index(level=['tick', 'obs'])
          tick  obs     val
tag                        
C   2016-02-26    2  0.0139
A   2016-02-27    2  0.5577
C   2016-02-28    6  0.0303

解决方案 2:

rename_axis+reset_index

您可以先将索引重命名为所需的标签,然后提升为系列:

df = df.rename_axis('index1').reset_index()

print(df)

   index1         gi  ptt_loc
0       0  384444683      593
1       1  384444684      594
2       2  384444686      596

这也适用于MultiIndex数据框:

print(df)
#                        val
# tick       tag obs        
# 2016-02-26 C   2    0.0139
# 2016-02-27 A   2    0.5577
# 2016-02-28 C   6    0.0303

df = df.rename_axis(['index1', 'index2', 'index3']).reset_index()

print(df)

       index1 index2  index3     val
0  2016-02-26      C       2  0.0139
1  2016-02-27      A       2  0.5577
2  2016-02-28      C       6  0.0303

解决方案 3:

为了更清楚一点,我们看一下索引中有两个级别的 DataFrame(MultiIndex)。

index = pd.MultiIndex.from_product([['TX', 'FL', 'CA'], 
                                    ['North', 'South']], 
                                   names=['State', 'Direction'])

df = pd.DataFrame(index=index, 
                  data=np.random.randint(0, 10, (6,4)), 
                  columns=list('abcd'))

在此处输入图片描述

reset_index方法使用默认参数调用,将所有索引级别转换为列,并使用简单RangeIndex的新索引。

df.reset_index()

在此处输入图片描述

使用level参数来控制将哪些索引级别转换为列。如果可能,请使用级别名称,这样更明确。如果没有级别名称,您可以通过其整数位置来引用每个级别,从外部开始为 0。您可以在此处使用标量值或要重置的所有索引的列表。

df.reset_index(level='State') # same as df.reset_index(level=0)

在此处输入图片描述

在极少数情况下,您想要保留索引并将索引转换为列,您可以执行以下操作:

# for a single level
df.assign(State=df.index.get_level_values('State'))

# for all levels
df.assign(**df.index.to_frame())

解决方案 4:

对于 MultiIndex,您可以使用提取其子索引

df['si_name'] = R.index.get_level_values('si_name') 

其中si_name是子索引的名称。

解决方案 5:

如果您想使用该reset_index方法并且保留现有索引,您应该使用:

df.reset_index().set_index('index', drop=False)

或者就地改变它:

df.reset_index(inplace=True)
df.set_index('index', drop=False, inplace=True)

例如:

print(df)
          gi  ptt_loc
0  384444683      593
4  384444684      594
9  384444686      596

print(df.reset_index())
   index         gi  ptt_loc
0      0  384444683      593
1      4  384444684      594
2      9  384444686      596

print(df.reset_index().set_index('index', drop=False))
       index         gi  ptt_loc
index
0          0  384444683      593
4          4  384444684      594
9          9  384444686      596

如果您想摆脱索引标签,您可以这样做:

df2 = df.reset_index().set_index('index', drop=False)
df2.index.name = None
print(df2)
   index         gi  ptt_loc
0      0  384444683      593
4      4  384444684      594
9      9  384444686      596

解决方案 6:

这应该可以解决问题(如果不是多级索引) -

df.reset_index().rename({'index':'index1'}, axis = 'columns')

代码结果

当然,如果您不想将其分配给 rename 函数参数中的新变量,您可以随时设置inplace = True 。

解决方案 7:

要将索引(已转换为列)保留为索引,请使用to_frame()和的组合join()。特别是,这不会产生SettingWithCopyWarning, 不同赋值。

df = df.index.to_frame(name='A').join(df)

res1

这也适用于 MultiIndex。

df = df.index.to_frame(name=['A', 'B']).join(df)

此外,正如Quinten所提到的,自 pandas 1.5.0 以来,rename_axis+ reset_index(或reset_index+ rename)语法已过时。您可以直接将names=参数传递给reset_index()。如果传递,甚至允许重复的列名allow_duplicates=True(尽管非常不建议重复列标签)。

df = df.reset_index(names=['A', 'B'])

res2

解决方案 8:

df1 = pd.DataFrame({"gi":[232,66,34,43],"ptt":[342,56,662,123]})
p = df1.index.values
df1.insert( 0, column="new",value = p)
df1

    new     gi     ptt
0    0      232    342
1    1      66     56 
2    2      34     662
3    3      43     123

解决方案 9:

我通常这样做:

df = df.assign(index1=df.index)

解决方案 10:

在最新版本的 中,您可以使用带有新参数的pandas 1.5.0函数来指定要赋予索引列的名称列表。以下是具有一个索引列的可重现示例:reset_index`names`

import pandas as pd

df = pd.DataFrame({"gi":[232,66,34,43],"ptt":[342,56,662,123]})

    gi  ptt
0  232  342
1   66   56
2   34  662
3   43  123

df.reset_index(names=['new'])

输出:

   new   gi  ptt
0    0  232  342
1    1   66   56
2    2   34  662
3    3   43  123

这也可以轻松应用MultiIndex。只需创建您想要的名称列表即可。

相关推荐
  政府信创国产化的10大政策解读一、信创国产化的背景与意义信创国产化,即信息技术应用创新国产化,是当前中国信息技术领域的一个重要发展方向。其核心在于通过自主研发和创新,实现信息技术应用的自主可控,减少对外部技术的依赖,并规避潜在的技术制裁和风险。随着全球信息技术竞争的加剧,以及某些国家对中国在科技领域的打压,信创国产化显...
工程项目管理   3938  
  为什么项目管理通常仍然耗时且低效?您是否还在反复更新电子表格、淹没在便利贴中并参加每周更新会议?这确实是耗费时间和精力。借助软件工具的帮助,您可以一目了然地全面了解您的项目。如今,国内外有足够多优秀的项目管理软件可以帮助您掌控每个项目。什么是项目管理软件?项目管理软件是广泛行业用于项目规划、资源分配和调度的软件。它使项...
项目管理软件   2732  
  本文介绍了以下10款项目管理软件工具:禅道项目管理软件、Freshdesk、ClickUp、nTask、Hubstaff、Plutio、Productive、Targa、Bonsai、Wrike。在当今快速变化的商业环境中,项目管理已成为企业成功的关键因素之一。然而,许多企业在项目管理过程中面临着诸多痛点,如任务分配不...
项目管理系统   72  
  本文介绍了以下10款项目管理软件工具:禅道项目管理软件、Monday、TeamGantt、Filestage、Chanty、Visor、Smartsheet、Productive、Quire、Planview。在当今快速变化的商业环境中,项目管理已成为企业成功的关键因素之一。然而,许多项目经理和团队在管理复杂项目时,常...
开源项目管理工具   79  
  本文介绍了以下10款项目管理软件工具:禅道项目管理软件、Smartsheet、GanttPRO、Backlog、Visor、ResourceGuru、Productive、Xebrio、Hive、Quire。在当今快节奏的商业环境中,项目管理已成为企业成功的关键因素之一。然而,许多企业在选择项目管理工具时常常面临困惑:...
项目管理系统   66  
热门文章
项目管理软件有哪些?
曾咪二维码

扫码咨询,免费领取项目管理大礼包!

云禅道AD
禅道项目管理软件

云端的项目管理软件

尊享禅道项目软件收费版功能

无需维护,随时随地协同办公

内置subversion和git源码管理

每天备份,随时转为私有部署

免费试用