python的pandas库读取csv,,首先建立test.c


首先建立test.csv原始数据,内容如下

时间,地点一月,北京二月,上海三月,广东四月,深圳五月,河南六月,郑州七月,新密八月,大连九月,盘锦十月,沈阳十一月,武汉十二月,南京

导出pandas

import pandas as pd
csv=pd.read_csv(‘test.csv‘)print(len(csv))  #结果是12,证明length是csv的列数

参数sep:str, default ‘,’指定分隔符。如果不指定参数,默认使用逗号分隔。

usecols: array-like, default None返回一个数据子集,该列表中的值必须可以对应到文件中的位置(数字可以对应到指定的列)或者是字符传为文件中的列名。例如:usecols有效参数可能是 [0,1,2]或者是 [‘foo’, ‘bar’, ‘baz’]。使用这个参数可以加快加载速度并降低内存消耗。

csv1=pd.read_csv(‘test.csv‘,sep=‘,‘,usecols=[0,1])

上述代码输出结果

     时间  地点0    一月  北京1    二月  上海2    三月  广东3    四月  深圳4    五月  河南5    六月  郑州6    七月  新密7    八月  大连8    九月  盘锦9    十月  沈阳10  十一月  武汉11  十二月  南京
csv2=pd.read_csv(‘test.csv‘,sep=‘,‘,usecols=[0])

上述代码输出结果

     时间0    一月1    二月2    三月3    四月4    五月5    六月6    七月7    八月8    九月9    十月10  十一月11  十二月

csv=pd.read_csv(‘test.csv‘,sep=‘,‘,usecols=[0,1])
print(csv[0:1])
print(‘--------------‘)
print(csv[1:3])

上述代码输出结果

时间 地点
0 一月 北京
--------------
时间 地点
1 二月 上海
2 三月 广东

可见pandas将第一行数据当作表头,不算做正式数据里。方括号里的两个数字表示从第几行到第几行

print(csv[0:2][‘时间‘])

上述代码运行结果

0    一月1    二月Name: 时间, dtype: object
print(csv[0:2][‘时间‘].values[0])

上述代码运行结果

一月

可以看出从方括号里引用的某几行数据可以根据表头单独输出,并可以选择特定一行的值输出

python的pandas库读取csv

评论关闭