工作中要核对很多的数据,所以我想到了要用编程来解决重复性的劳动工作,因为以前要核对数据的时候啊,会用筛选功能,一个个去核对,再后来学了vlookup,稍微高级一点,但是vlookup的时候也会遇到很多问题,比如经常找不到相关的数据,比如数据格式不同,导致找不到想要的数据。
python怎么读取csv的一部分数据。学编程有一段时间了,没有什么使用场景,也就没什么精进了。刚好遇到这些问题就想到了要用编程来解决这个问题。首先要先把表格里的数据读取出来,然后在跟另外一个表格里读取出来的数据去进行比
python写入csv?对,如果数据在两个表格当中都存在的话就是没问题的,如果只在一个表格中存在,就把它找出来,写入另外一个文件当中。
首先要做的就是在python中安装csv。然后学习csv这个模块的方法,怎么样读取数据,怎么样写入数据。
遇到过的很多问题:比如单词写错,电脑识别不了;文件命名问题;gbk转码问题;数据格式问题,等等。终于算是成了,目前只是比对6000条数据而已,找出表1有两条不在表2,表2有100多条没在表1。
6000条数据缩少到100多条数据,大大减少了工作时间。虽然这次前面学写程序花了一点时间,但更重要的是,以后我就快了。
哈哈,好高兴的说。以下是编码。
import csv
with open('表1.csv','r') as f:reader = csv.DictReader(f)column = [row['证件号码'] for row in reader]#print(column)with open('表2.csv','r') as f:reader = csv.DictReader(f)column2 = [row['证件号码'] for row in reader]#print(column2) #a 在表1,不在表2
a = [x for x in column if x not in column2]
#b 在表2,不在表1
b = [y for y in column2 if y not in column]
print('差异数量a:', len(a))
print('差异数量b', len(b))
#print('在表1,不在表2的值:n',a)
#print('在表2,不在表1的值:n',b)
for i in a:#print(i)with open('不在表22.xls', 'a') as f:f.write('%sn'%i)
for n in b:#print(n)with open('不在表11.xls', 'a', newline='') as f:f.write('%sn'%n)
版权声明:本站所有资料均为网友推荐收集整理而来,仅供学习和研究交流使用。
工作时间:8:00-18:00
客服电话
电子邮件
admin@qq.com
扫码二维码
获取最新动态