java代码
package com.work.tiangu.workanalysis.util;
import java.io.*;
import java.util.ArrayList;
import java.util.Collections;
import java.util.List;
public class FileUtilDemo {
public static void main(String[] arg0) {
List<File> list = getFileList("D:\\worktile\\export\\2018083122\\demo");//通过文件夹路径,获取文件列表,这里也可以优化成由用户输入路径的方式
List<String> allTxtList = new ArrayList<>();//定义一个集合用于存放所有txt文件的行内容(存放未清洗的数据)
List<String> listTemp = new ArrayList<>();//定义一个集合存放干净的数据(存放清洗后的数据)
List<String> listPerson = new ArrayList<>();//定义一个集合存放人的信息
if (list != null && !list.isEmpty()) {//如果文件列表不是空的
for (File file : list) {
allTxtList.addAll(txtContents(file));//将文件转为集合放入总数据
}
System.out.println("在你选择的文件路径中,已读取到 " + allTxtList.size() + " 条数据");
//去除缺失数据
for (String str : allTxtList) {//遍历所有数据
if (str.length() > 5) {//如果数据未缺失
listTemp.add(str);//就把数据放入集合,这个集合里存在重复数据,接下来统计这个集合里的人数出勤情况
}
if (str.length() > 5 && !listPerson.contains(str)) {//如果数据未缺失并且不重复
listPerson.add(str);
}
}
//统计个人出勤次数
for (String str : listPerson) {
System.out.println(str + "出勤次数:" + Collections.frequency(listTemp, str));
}
System.out.println("据有效数据统计显示,有 " + listPerson.size() + " 人有考勤记录");
}
System.out.println("=============================================统计已完成");
}
/**
* 读取文件夹中的所有文件
*
* @param path 文件夹路径
*/
private static List<File> getFileList(String path) {
List<File> fileList = new ArrayList<>();//定义一个存放文件的集合
try {
File file = new File(path);//获取路径所指向的东西,判断这个东西是个文件夹还是个文件
if (file.isDirectory()) {//如果它是个文件夹
File[] files = file.listFiles();//定义一个数组存放这个文件夹下面的所有文件(包括文件夹)
for (File fileIndex : files) {//遍历这个数组,挨个获取里面的文件,不确定这个文件是不是文件夹,如果是文件夹,还需要再读取文件夹中的文件,这里可能会报NullPointerException
if (fileIndex.isDirectory()) {//如果是个文件夹
fileList.addAll(getFileList(fileIndex.getPath()));//递归获取文件夹里的文件,放到集合里面,在遇到子文件夹为空时,也会报异常
} else {
fileList.add(fileIndex);
}
}
}
//如果不是个文件夹地址,则不做任何处理
} catch (NullPointerException e) {
System.out.println("空指针异常,信息提示为:" + e.getMessage());
} catch (Exception e) {
System.out.println("未知异常,信息提示为:" + e.getMessage());
}
return fileList;
}
/**
* 读取一个txt文件,按行读取,存入集合,这里返回的集合只是一个txt文件的行内容
*/
private static List<String> txtContents(File file) {
ArrayList<String> txtList = new ArrayList<>();//定义一个集合存储txt文件每行字符串
if (file.getName().endsWith(".txt")) {
try {
InputStreamReader inputReader = new InputStreamReader(new FileInputStream(file), "GB2312");//引入文件流读取的工具类,编码在控制台输出时用GB2312,其他地方换成UTF-8
BufferedReader bf = new BufferedReader(inputReader);//引入字符缓冲输入流,加快读取速度
// 按行读取字符串
String str;//定义一个字符串变量
while ((str = bf.readLine()) != null) {//只要没有读到文件末尾,就一直读取,读到末尾会返回null
txtList.add(str.trim());//去除字符串两端的空格,缓存在集合中
//System.out.println(str);
}
bf.close();//文件读取完毕后,关闭缓冲流
inputReader.close();//关闭文件流
} catch (IOException e) {
e.printStackTrace();
}
return txtList;
} else {
System.out.println("跳过一个非txt文件:" + file.getName());
}
return txtList;
}
}