當輸入的文件是csv文件時,我們有一下幾種打開方式:
1、
import csv #r表示讀 datapath=csv.reader(open('data.csv','r')) #如果文件里有中文,就用下面的代碼 datapath=csv.reader(open('data.csv',encoding='utf-8'))
python中csv文件?2、
import pandas as pddata=pd.read_csv('data.csv') #如果中文,見下面代碼 data=pd.read_csv('data.csv',encoding='gb2312') data.head#預覽一部分數據
3、
#csv文件整體讀取為一個數組或者矩陣 import numpy my_matrix = numpy.loadtxt(open("c:\\1.csv","rb"),delimiter=",",skiprows=0) #將數組或者矩陣存儲為csv文件可以使用如下代碼實現 numpy.savetxt('new.csv', my_matrix, delimiter = ',')
?
Python csv?4、將csv的文件轉為數組類型
import numpy as np from numpy import genfromtxt #可以將非array格式的list轉化為array datapath = "data.csv" deliverData = genfromtxt(datapath,delimiter=",") #將csv文件轉化為numpy.array格式 #這樣就可以進行數組數據的切分選擇 X_train= deliverData[:3000,6:46] Y_train= deliverData[:3000,-1]
注意:使用genfromtxt時,需要保證文件里沒有中文,這應該怎么處理?