如何在 Pandas 中读取以空格分隔的值的文件
- 2025-03-18 08:55:00
- admin 原创
- 45
问题描述:
我尝试将文件读入 pandas。该文件的值以空格分隔,但我尝试的空格数不同:
pd.read_csv('file.csv', delimiter=' ')
但它不起作用
解决方案 1:
添加delim_whitespace=True
参数,它比正则表达式更快。
但请注意,在 pandas 2.2.0 之后,此功能已弃用,最好使用sep="s+"
解决方案 2:
您可以使用正则表达式作为分隔符:
pd.read_csv("whitespace.csv", header=None, delimiter=r"s+")
解决方案 3:
Pandas read_fwf 获胜:
import pandas as pd
df = pd.read_fwf(file_path)
解决方案 4:
您还可以将正则表达式作为 read_table 的分隔符传递,而且速度很快:)。
result = pd.read_table('file', sep='s+')
解决方案 5:
如果您无法使用接受的答案使文本解析工作(例如,如果您的文本文件包含非统一的行),那么值得尝试使用 Python 的 csv 库 - 这是一个使用用户定义的方言的示例:
import csv
csv.register_dialect('skip_space', skipinitialspace=True)
with open(my_file, 'r') as f:
reader=csv.reader(f , delimiter=' ', dialect='skip_space')
for item in reader:
print(item)
相关推荐
热门文章
项目管理软件有哪些?
热门标签
曾咪二维码
扫码咨询,免费领取项目管理大礼包!
云禅道AD