stata--最强的文件循环命令filesearch

参考爬虫俱乐部 Stata&Python的推文

例子,常用的tjj清洗方法。

将需要的文件下到一个路径中,随后使用filesearch获取文件名暂元,随后挨个循环

cd "需要搜索的路径"
filesearch *.xls,local(qq) 
local qq: subinstr local qq ".xls" "", all  //剔除掉后缀
foreach i of local qq{
    import excel using `i'.xls,clear
    drop if _n >= 36
    drop if _n<=3
    foreach j of varlist _all{
        replace `j' = regexs(0) if regexm(`j', "^[0-9]+")&_n==1  //剔除掉年份
    }
    drop B C O-U
    export excel using `i'.xls,replace
}

筛选文件利器——filesearch命令

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 本文作者:王玉婷,中南财经政法大学金融学院文字编辑:崔赵雯技术总编:余术玲   各位小伙伴、大伙伴大家好,我爬虫俱...
    StataPython数据分析阅读 3,674评论 0 3
  • 本文作者:王碧琪,中南财经政法大学金融学院文字编辑:任 哲技术总编:张馨月 一、多列变一列   在文章《用stac...
    StataPython数据分析阅读 1,361评论 0 0
  • Hello! Hello! 小伙伴们大家好,我是豆豆,好长时间没有和大家见面了。最近小编在做数据挖掘分析的项目,...
    xw_欢乐豆阅读 1,539评论 1 8
  • 数仓总结 数据开发的本质是理解业务,设计合适的数仓结构,数据模型问题往往是一环扣一环的,需要有足够的技术深度,将知...
    Miracle_Data阅读 1,852评论 0 2
  • 我是黑夜里大雨纷飞的人啊 1 “又到一年六月,有人笑有人哭,有人欢乐有人忧愁,有人惊喜有人失落,有的觉得收获满满有...
    陌忘宇阅读 8,614评论 28 53