格式化/抑制 Pandas 聚合结果中的科学计数法

2025-01-08 08:49:00
admin
原创
151
摘要:问题描述:如何修改 pandas 中 groupby 操作输出的格式,从而为非常大的数字生成科学计数法?我知道如何在 python 中进行字符串格式化,但如何在这里应用它却不知所措。df1.groupby('dept')['data1'].sum() dept value1 1.192433e+...

问题描述:

如何修改 pandas 中 groupby 操作输出的格式,从而为非常大的数字生成科学计数法?

我知道如何在 python 中进行字符串格式化,但如何在这里应用它却不知所措。

df1.groupby('dept')['data1'].sum()

dept
value1       1.192433e+08
value2       1.293066e+08
value3       1.077142e+08

如果我将其转换为字符串,这会抑制科学计数法,但现在我只是想知道如何格式化字符串并添加小数。

sum_sales_dept.astype(str)

解决方案 1:

当然,我在评论中链接的答案并不是很有帮助。您可以像这样指定自己的字符串转换器。

In [25]: pd.set_option('display.float_format', lambda x: '%.3f' % x)

In [28]: Series(np.random.randn(3))*1000000000
Out[28]: 
0    -757322420.605
1   -1436160588.997
2   -1235116117.064
dtype: float64

我不确定这是否是实现此目的的首选方法,但它确实有效。

纯粹为了美观而将数字转换为字符串似乎是个坏主意,但如果您有充分的理由,这是一种方法:

In [6]: Series(np.random.randn(3)).apply(lambda x: '%.3f' % x)
Out[6]: 
0     0.026
1    -0.482
2    -0.694
dtype: object

解决方案 2:

这是另一种方法,类似于Dan Allan 的答案,但没有 lambda 函数:

>>> pd.options.display.float_format = '{:.2f}'.format
>>> Series(np.random.randn(3))
0    0.41
1    0.99
2    0.10

或者

>>> pd.set_option('display.float_format', '{:.2f}'.format)

解决方案 3:

您可以使用 round 函数来抑制特定数据框的科学计数法:

df1.round(4)

或者您可以通过以下方式全局抑制:

pd.options.display.float_format = '{:.4f}'.format

解决方案 4:

如果要设置 jupyter notebook 单元中数据框输出的样式,可以针对每个数据框设置显示样式:

df = pd.DataFrame({'A': np.random.randn(4)*1e7})
df.style.format("{:.1f}")

在此处输入图片描述

请参阅此处的文档。

解决方案 5:

全局设置固定的小数位数通常不是一个好主意,因为无论大小,对于您要显示的所有各种数据,这个小数位数都不太可能是合适的。相反,请尝试以下方法,它只会为大值和非常小的值提供科学计数法(并且会添加千位分隔符,除非您省略“,”):

pd.set_option('display.float_format', lambda x: '%,g' % x)

或者,为了几乎完全抑制科学计数法而不损失精度,请尝试以下操作:

pd.set_option('display.float_format', str)

解决方案 6:

扩展这个有用的评论,这里有一个解决方案,设置格式选项仅显示结果而不永久更改选项:

with pd.option_context('display.float_format', lambda x: f'{x:,.3f}'):
    display(sum_sales_dept)

dept
value1  119,243,300.0
value2  129,306,600.0
value3  107,714,200.0

解决方案 7:

我有多个具有不同浮点数的数据框,因此感谢 Allans 的想法实现了动态长度。

pd.set_option('display.float_format', lambda x: f'%.{len(str(x%1))-2}f' % x)

缺点是,如果浮点数中最后一个为 0,它会被截断。所以结果不是 0.000070,而是 0.00007。

解决方案 8:

如果您想使用这些值,比如作为 csvfile csv.writer 的一部分,可以在创建列表之前格式化数字:

df['label'].apply(lambda x: '%.17f' % x).values.tolist()
相关推荐
  政府信创国产化的10大政策解读一、信创国产化的背景与意义信创国产化,即信息技术应用创新国产化,是当前中国信息技术领域的一个重要发展方向。其核心在于通过自主研发和创新,实现信息技术应用的自主可控,减少对外部技术的依赖,并规避潜在的技术制裁和风险。随着全球信息技术竞争的加剧,以及某些国家对中国在科技领域的打压,信创国产化显...
工程项目管理   2577  
  为什么项目管理通常仍然耗时且低效?您是否还在反复更新电子表格、淹没在便利贴中并参加每周更新会议?这确实是耗费时间和精力。借助软件工具的帮助,您可以一目了然地全面了解您的项目。如今,国内外有足够多优秀的项目管理软件可以帮助您掌控每个项目。什么是项目管理软件?项目管理软件是广泛行业用于项目规划、资源分配和调度的软件。它使项...
项目管理软件   1553  
  IPD(Integrated Product Development)流程作为一种先进的产品开发管理模式,在众多企业中得到了广泛应用。其中,技术评审与决策评审是IPD流程中至关重要的环节,它们既有明显的区别,又存在紧密的协同关系。深入理解这两者的区别与协同,对于企业有效实施IPD流程,提升产品开发效率与质量具有重要意义...
IPD管理流程   26  
  本文介绍了以下10款项目管理软件工具:禅道项目管理软件、ClickUp、Freshdesk、GanttPRO、Planview、Smartsheet、Asana、Nifty、HubPlanner、Teamwork。在当今快速变化的商业环境中,项目管理软件已成为企业提升效率、优化资源分配和确保项目按时交付的关键工具。然而...
项目管理系统   21  
  建设工程项目质量关乎社会公众的生命财产安全,也影响着企业的声誉和可持续发展。高质量的建设工程不仅能为使用者提供舒适、安全的环境,还能提升城市形象,推动经济的健康发展。在实际的项目操作中,诸多因素会对工程质量产生影响,从规划设计到施工建设,再到后期的验收维护,每一个环节都至关重要。因此,探寻并运用有效的方法来提升建设工程...
工程项目管理制度   18  
热门文章
项目管理软件有哪些?
曾咪二维码

扫码咨询,免费领取项目管理大礼包!

云禅道AD
禅道项目管理软件

云端的项目管理软件

尊享禅道项目软件收费版功能

无需维护,随时随地协同办公

内置subversion和git源码管理

每天备份,随时转为私有部署

免费试用