CSV
csv文件格式是一种通用的电子表格和数据库导入导出格式
简介
Python csv模块封装了常用的功能,使用的简单例子如下:
写入
# 写入csv文件 import csvcsvfile = open('csv_test.csv', 'w',newline='') # 如果不指定newline='',有时则每写入一行将有一空行被写入 writer = csv.writer(csvfile) writer.writerow(['姓名', '年龄', '电话']) # 写入一行用writerow data = [('al', '25', '1367890900'),('eg', '18', '1367890800') ] writer.writerows(data) # 多行用writerows csvfile.close()
读取
# 读取csv文件 csv_reader = csv.reader(open('csv_test.csv', encoding='utf-8')) for row in csv_reader:print(row)# ['姓名', '年龄', '电话'] # ['al', '25', '1367890900'] # ['eg', '18', '1367890800']
默认的情况下, 读和写使用逗号做分隔符(delimiter),用双引号作为引用符(quotechar),当遇到特殊情况是,可以根据需要手动指定字符, 例如:
import csv with open('/etc/passwd', 'r') as f:reader = csv.reader(f, delimiter=':', quoting=csv.QUOTE_NONE)for row in reader:print(row)['root', 'x', '0', '0', 'root', '/root', '/bin/bash'] ['bin', 'x', '1', '1', 'bin', '/bin', '/sbin/nologin'] ['daemon', 'x', '2', '2', 'daemon', '/sbin', '/sbin/nologin'] ……
上述示例指定冒号作为分隔符,并且指定quote方式为不引用。这意味着读的时候都认为内容是不被默认引用符(")包围的。
Python csv。quoting的可选项为: QUOTE_ALL, QUOTE_MINIMAL, QUOTE_NONNUMERIC, QUOTE_NONE
.
有点需要注意的是,当用writer写数据时, None
会被写成空字符串,浮点类型会被调用 repr()
方法转化成字符串。所以非字符串类型的数据会被 str()
成字符串存储。
字典方式地读写
csv还提供了一种类似于字典方式的读写,方式如下:
格式如下:
headers = ['name', 'age']datas = [{'name': 'Bob', 'age': 23},{'name': 'Jerry', 'age': 44},{'name': 'Tom', 'age': 15}]with open('example.csv', 'w', newline='') as f:# 标头在这里传入,作为第一行数据writer = csv.DictWriter(f, headers)writer.writeheader()for row in datas:writer.writerow(row)# 还可以写入多行 writer.writerows(datas)# 读 import csv with open('example.csv','r') as csvfile:reader = csv.DictReader(csvfile)for row in reader:print(row['name'], row['age']) # name,age # Bob,23 # Jerry,44 # Tom,15 # Bob,23 # Jerry,44 # Tom,15
案例:使用csv格式展示磁盘空间
import re import csv import os from prettytable import from_csv import subprocess # 写入csv文件 import csvdef cmd_exec(cmd):"""执行shell命令返回命令返回值和结果:param cmd::return:"""p = subprocess.Popen(cmd,shell=True,stdin=subprocess.PIPE,stdout=subprocess.PIPE,stderr=subprocess.PIPE)stdout, stderr = p.communicate()if p.returncode != 0:return {'code':p.returncode, 'res':to_str(stderr)}return {'code':p.returncode, 'res':to_str(stdout)}def to_str(bytes_or_str):"""把byte类型转换为str:param bytes_or_str::return:"""if isinstance(bytes_or_str, bytes):value = bytes_or_str.decode('utf-8')else:value = bytes_or_strreturn valuef = open('disk.csv', 'w+', newline='', encoding='utf-8' ) fieldnames = ['Dir', 'Use%', 'Avail', 'Used', 'Size'] writer = csv.writer(f) writer.writerow(fieldnames) df_ret = cmd_exec('df -h| grep -E \([1-9]?[1-9]\%\)\|\(100\%\)') if df_ret['code'] == 0:if df_ret['res']:for item in df_ret['res'].split('\n')[:-1]: # 截取回车d = re.split(r'\s+', item) # 去除空格符writer.writerow(d[-1:-6:-1])f.flush() # 写入到磁盘# os.fsync() 方法强制将文件描述符为fd的文件写入硬盘。在Unix, 将调用fsync()函数;在Windows, 调用 _commit()函数。# 如果你准备操作一个Python文件对象f, 首先f.flush(),然后os.fsync(f.fileno()),# 确保与f相关的所有内存都写入了硬盘.在unix,Windows中有效。 os.fsync(f.fileno())f.seek(0) # 把文件指针置于开头tb = from_csv(f)### 设定左对齐tb.align = 'l'### 设定T_ID右对齐tb.align["Use%"] = "r"### 设定数字输出格式tb.float_format = "2.2"### 设定边框连接符为'*"tb.junction_char = "*"# ### 设定排序列# tb.sortby = "Use%"# ### 设定排序方式# tb.reversesort = True### 设定左侧不填充空白字符tb.left_padding_width = 0print(tb) # 打印表格*---------*-----*------*-----*-----* |Dir |Use% |Avail |Used |Size | *---------*-----*------*-----*-----* |/ | 11% |82G |9.3G |96G | |/dev/shm | 1% |931M |72K |931M | |/boot | 9% |421M |39M |485M | *---------*-----*------*-----*-----*