python实现TXT转xlsx并切割文件

话不多说,上代码

1.本次使用的是python3环境,使用pandas读取文件,读取速度有点慢,建议数据量50W以下

  1. 优化方案可以使用mysql来操作sql来完成大数据量的操作,下一篇博客介绍
# -*- coding: utf-8 -*-


import pandas as pd
import sys
#from bbb import *
import time

curr_date=time.strftime("%Y-%m-%d", time.localtime()) 

#文件名路径
path="C:/Users/Desktop/test.txt"
# 结果文件存放地址
res_file_path="C:/Users/Desktop/test/"
#produce_name=sys.argv[1]
#num=sys.argv[2] 
# 读取文件内容 ,含表头 
df =  pd.read_table(path,sep='\t',header=0,dtype=str)

 # 按某一行规则切割并返回该行值的数据量
def cnt_produce(produce_name):
    cnt = df[df['产品']==produce_name].shape[0]
    return cnt

# txt 转 excel 
def Txt_To_Excel(produce_name,num1,num2,num3) :
  
# 要读取某一列的数据值
    df_2=df[df['产品']==produce_name].iloc[num1:num2]
    
    # 结果文件数据量
    num=num2-num1
    # 结果文件名
    res_file_name=(res_file_path+curr_date + str(num) + '_' + str(num3) + '_' +  produce_name + '.xlsx')
    df_2.to_excel(res_file_name,index=False)
    print(res_file_name)
    #print(df_2)
    #pd.read_table?

# 设置文件步长 , 此处按2000行一个文件切割
def result(produce_name):
    print('开始')
    pro_cnt=cnt_produce(produce_name)
    print(pro_cnt)
    n=0
    i=0
    while n  <= pro_cnt :
        if n > pro_cnt - 2000 :
            m=pro_cnt
            i=i+1
            print('n='+ str(n),'m=' + str(m),'i='+str(i))
            Txt_To_Excel(produce_name,n,m,i)
            break
        else:
            m=n+2000
            i=i+1
            print('n='+ str(n),'m=' + str(m),'i='+str(i))
            Txt_To_Excel(produce_name,n,m,i)
            n=m
            #print(m,n,'bbbb') 

# 执行模块
if __name__ == '__main__':
    print('开始')
    # 传入要读取列值
    result('产品名')
    print('结束')
    True
©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

  • 不论是数据分析,数据可视化,还是数据挖掘,一切的一切全都是以数据作为最基础的元素。利用Python进行数据分析,同...
    Shirley_3ec8阅读 341评论 0 1
  • 不论是数据分析,数据可视化,还是数据挖掘,一切的一切全都是以数据作为最基础的元素。利用Python进行数据分析,同...
    蝴蝶兰玫瑰阅读 10,330评论 1 30
  • 上一篇文件用VBA介绍了如何实现一键按列分类汇总并保存单独文件,代码有几十行,而且一旦数据量多了,效果可能不尽如人...
    永恒君的百宝箱阅读 7,229评论 3 57
  • 久违的晴天,家长会。 家长大会开好到教室时,离放学已经没多少时间了。班主任说已经安排了三个家长分享经验。 放学铃声...
    飘雪儿5阅读 7,780评论 16 22
  • 今天感恩节哎,感谢一直在我身边的亲朋好友。感恩相遇!感恩不离不弃。 中午开了第一次的党会,身份的转变要...
    余生动听阅读 10,793评论 0 11

友情链接更多精彩内容