博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
Python拼接两个TXT文件(遍历文件夹,去除重复记录)
阅读量:5340 次
发布时间:2019-06-15

本文共 1005 字,大约阅读时间需要 3 分钟。

# -*- coding:utf-8 -*-#将所有TXT连接成一个,并删除掉重复记录import osimport timedef BianLi(rootDir):    print "开始拼接数据,请稍等..."    start_time = time.time()    fh = open('C://Users//Administrator//PycharmProjects//···//ALL.txt', "w")    list1=[]    for root,dirs,files in os.walk(rootDir):        for filename in files:  #这里得到的filename只是一个文件名的字符串而已,如:test.txt            filepath = rootDir+filename  #拼接目录和文件名得到完整路径            file = open(filepath, 'r')              for i in file:  #i即为file中的一行,不用再readline()了                line = str(i).strip()                print str(line)                if line in list1:  #判断list里面是否有这个记录了,如果没有就加入list,如果有就跳过                    continue                else:                    list1.append(line)  #向list里添加记录                    fh.write(line+'\n')    fh.close()    end_time = time.time()    print "全部数据拼接完毕,用时%.2f秒" % (end_time - start_time)rootDir = 'C://Users//Administrator//PycharmProjects//···//test//'BianLi(rootDir)  #调用方法

 

转载于:https://www.cnblogs.com/huangyanjia/p/8424081.html

你可能感兴趣的文章
ArraySort--冒泡排序、选择排序、插入排序工具类demo
查看>>
composer 安装laravel
查看>>
8-EasyNetQ之Send & Receive
查看>>
Android反编译教程
查看>>
java重写LinkedList
查看>>
zTree节点重叠或者遮挡
查看>>
List<string> 去重复 并且出现次数最多的排前面
查看>>
js日志管理-log4javascript学习小结
查看>>
Android之布局androidmanifest.xml 资源清单 概述
查看>>
How to Find Research Problems
查看>>
Linux用户管理
查看>>
数据库第1,2,3范式学习
查看>>
《Linux内核设计与实现》第四章学习笔记
查看>>
使用iperf测试网络性能
查看>>
struts2入门之准备工作
查看>>
从C语言的弱类型属性说起
查看>>
大牛博客
查看>>
图片的显示隐藏(两张图片,默认的时候显示第一张,点击的时候显示另一张)...
查看>>
Docker 安装MySQL5.7(三)
查看>>
python 模块 来了 (调包侠 修炼手册一)
查看>>