《机器学习,Python实践》读书笔记之三

数据导入方法

在Python中,将CSV文件导入的常用方法有以下三种:

  • 使用Python标准库导入
  • 使用NumPy导入
  • 使用Pandas导入

Python标准库导入方式

1
2
3
4
5
6
7
8
from csv import reader
import numpy as np
filename='/path/to/file'
with open(filename,'rt') as raw_data:
readers=reader(raw_date,delimiter=',')
x=list(readers)
data=np.array(x).astype('float')
print(data.shape)

w是写模式,r是读模式。
t是windows平台特有的所谓text mode(文本模式),区别在于会自动识别windows平台的换行符。
类Unix平台的换行符是\n,而windows平台用的是\r\n两个ASCII字符来表示换行,python内部采用的是\n来表示换行符。
rt模式下,python在读取文本时会自动把\r\n转换成\n.
wt模式下,Python写文件时会用\r\n来表示换行。

使用NumPy导入

1
2
3
4
5
from numpy import loadtxt
filename='/path/to/file'
with open(filename,'rt') as raw_data:
data=loadtxt(raw_data,delimiter=',')
print(data.shape)

使用Pandas导入

1
2
3
4
5
from pandas import read_csv
filename='/path/to/file'
names=['title1','title2',...]
data=read_csv(filename,names=names)
print(data.shape)

声明:该系列读书笔记所引用知识点均出于《机器学习,Python实践》