数据导入方法
在Python中,将CSV文件导入的常用方法有以下三种:
- 使用Python标准库导入
- 使用NumPy导入
- 使用Pandas导入
Python标准库导入方式
1 2 3 4 5 6 7 8
| from csv import reader import numpy as np filename='/path/to/file' with open(filename,'rt') as raw_data: readers=reader(raw_date,delimiter=',') x=list(readers) data=np.array(x).astype('float') print(data.shape)
|
w是写模式,r是读模式。
t是windows平台特有的所谓text mode(文本模式),区别在于会自动识别windows平台的换行符。
类Unix平台的换行符是\n,而windows平台用的是\r\n两个ASCII字符来表示换行,python内部采用的是\n来表示换行符。
rt模式下,python在读取文本时会自动把\r\n转换成\n.
wt模式下,Python写文件时会用\r\n来表示换行。
使用NumPy导入
1 2 3 4 5
| from numpy import loadtxt filename='/path/to/file' with open(filename,'rt') as raw_data: data=loadtxt(raw_data,delimiter=',') print(data.shape)
|
使用Pandas导入
1 2 3 4 5
| from pandas import read_csv filename='/path/to/file' names=['title1','title2',...] data=read_csv(filename,names=names) print(data.shape)
|