您的当前位置:首页正文

使用Pandas如何读取多个分隔方式的文件

2024-11-09 来源:个人技术集锦

用Pandas读取多个分隔方式的文件

如果你的文本文件的第一行数据是使用逗号分隔的,而其余行是使用 tab 分隔的

你需要在 Pandas 中使用 read_csv 函数,并使用正则表达式指定多个分隔符。

1,2,3,4,5,6
a	b	c	d	e	f
z	x	c	v	b	n

以下是如何使用 Pandas 读取该文件的代码:

import pandas as pd
 
# 读取文本文件,使用正则表达式指定多个分隔符,并将第一行作为列名
df = pd.read_csv('data.txt', sep=r'[,\t]', engine='python', header=0)
 
# 打印数据框
print(df)

输出结果应为:

   1  2  3  4  5  6
0  a  b  c  d  e  f
1  z  x  c  v  b  n

这里的 sep 参数使用了正则表达式 [,\t],表示分隔符可以是逗号或者 tab。

engine 参数指定了解析器的引擎,这里我们选择了 Python 自带的解析器。

最后,header=0 参数告诉 Pandas 使用第一行作为列名。

Pandas读取TXT,txt中数据以空格间隔

可以使用pandas的read_csv函数来读取TXT文件中的数据。

在调用read_csv函数时,可以使用sep参数指定数据之间的分隔符。

例如:

如果TXT文件中的数据以空格间隔,则可以使用sep=' '调用read_csv函数。

下面是一个例子

import pandas as pd
 
# 读取TXT文件中的数据
df = pd.read_csv('data.txt', sep=' ')
 
# 显示前5行数据
df.head()

总结

以上为个人经验,希望能给大家一个参考,也希望大家多多支持。

Top