将列转换为日期格式 (Pandas Dataframe)
- 2025-03-04 08:27:00
- admin 原创
- 71
问题描述:
我有一个如下的熊猫数据框:
Symbol Date
A 02/20/2015
A 01/15/2016
A 08/21/2015
我想按它进行排序Date
,但该列只是一个object
。
我尝试将列设为日期对象,但遇到了一个问题,即该格式不是所需的格式。所需的格式是2015-02-20,
等。
所以现在我正在尝试弄清楚如何让 numpy 将“美国”日期转换为 ISO 标准,以便我可以将它们变成日期对象,以便我可以按它们进行排序。
我该如何将这些美国日期转换为 ISO 标准,或者是否存在我在熊猫中遗漏的更直接的方法?
解决方案 1:
您可以使用pd.to_datetime()
转换为 datetime 对象。它需要一个格式参数,但就您而言,我认为您不需要它。
>>> import pandas as pd
>>> df = pd.DataFrame( {'Symbol':['A','A','A'] ,
'Date':['02/20/2015','01/15/2016','08/21/2015']})
>>> df
Date Symbol
0 02/20/2015 A
1 01/15/2016 A
2 08/21/2015 A
>>> df['Date'] =pd.to_datetime(df.Date)
>>> df.sort('Date') # This now sorts in date order
Date Symbol
0 2015-02-20 A
2 2015-08-21 A
1 2016-01-15 A
为了以后的搜索,您可以更改排序语句:
>>> df.sort_values(by='Date') # This now sorts in date order
Date Symbol
0 2015-02-20 A
2 2015-08-21 A
1 2016-01-15 A
解决方案 2:
sort
方法已被弃用并被替换sort_values
。在使用转换为 datetime 对象后df['Date']=pd.to_datetime(df['Date'])
df.sort_values(by=['Date'])
注意:按就地排序和/或按降序排序(最近的在前):
df.sort_values(by=['Date'], inplace=True, ascending=False)
解决方案 3:
@JAB 的回答简洁明了。但它会改变DataFrame
你试图排序的内容,这可能是你想要的,也可能不是。
(注意:您几乎肯定会想要它,因为您的日期列应该是日期,而不是字符串!)
如果您不想将日期更改为日期,您也可以采用其他方式进行。
首先,从已排序列中获取索引Date
:
In [25]: pd.to_datetime(df.Date).order().index
Out[25]: Int64Index([0, 2, 1], dtype='int64')
然后使用它来索引您的原始内容DataFrame
,保持不变:
In [26]: df.ix[pd.to_datetime(df.Date).order().index]
Out[26]:
Date Symbol
0 2015-02-20 A
2 2015-08-21 A
1 2016-01-15 A
魔法!
注意:对于 Pandas 0.20.0 及更高版本,请使用loc
而不是ix
,后者现已弃用。
解决方案 4:
由于pandas >= 1.0.0
我们有key
参数DataFrame.sort_values
。这样,我们可以通过指定键对数据框进行排序,而无需调整原始数据框:
df.sort_values(by="Date", key=pd.to_datetime)
Symbol Date
0 A 02/20/2015
2 A 08/21/2015
1 A 01/15/2016
解决方案 5:
可以使用以下代码读取包含日期列的数据:
data = pd.csv(file_path,parse_dates=[date_column])
一旦使用上面的代码行读取数据,就可以使用pd.date_time()
以下命令访问包含日期信息的列:
pd.date_time(data[date_column], format = '%d/%m/%y')
根据要求更改日期格式。
解决方案 6:
data['Date'] = data['Date'].apply(pd.to_datetime) # non-null datetime64[ns]
扫码咨询,免费领取项目管理大礼包!