参考爬虫俱乐部 Stata&Python的推文
例子,常用的tjj清洗方法。
将需要的文件下到一个路径中,随后使用filesearch获取文件名暂元,随后挨个循环
cd "需要搜索的路径"
filesearch *.xls,local(qq)
local qq: subinstr local qq ".xls" "", all //剔除掉后缀
foreach i of local qq{
import excel using `i'.xls,clear
drop if _n >= 36
drop if _n<=3
foreach j of varlist _all{
replace `j' = regexs(0) if regexm(`j', "^[0-9]+")&_n==1 //剔除掉年份
}
drop B C O-U
export excel using `i'.xls,replace
}