os.listdir():列出该路径下的文件及文件夹名称;需要注意的有两点,一是路径应该用单引号''框起来,二是在windows下直接复制路径可能不识别,应该用r' '的形式。
read():不带参数时读取所有;
open创建一个文件对象,这个文件对象拥有readlines等方法;f.readlines()返回一个列表,列表的每个值是文件中的每一行(是一个字符串);f.readline()返回一个字符串,可以看到此方法对内存需求较小;f.read()则是读取若干个字符,换行符“\n”算一个字符;linecache.getline( , )第一个参数为文件名,第二个为指定的某一行,为整数型;
有返回值的函数要拿一个变量来接收它;
需要注意的是a=open(' '),此处a返回的是一个文件变量,而并非一个字符串;str.find("str"),若str存在,返回第一个str的索引值,若不存在,返回-1。
tqdm是一个终端控制条,可以在循环中添加一个进度提示信息,语法为tqdm([" "," "," "])或tqdm(range( )),前者为在一个字符串变量的矩阵,后者为一个range()。需要注意的是,tqdm是一个模块,这个模块中有tqdm()方法和trange()方法
time.strftime('format'),以指定形式的字符串返回某个时间
os.path.exist(path),返回一个逻辑值;
panda库:用于大数据处理。read_csv,read_xlsx。
若为一个字符串形式的数字,适宜先用float转换为浮点型,再用Int等进行处理(如果有相应的需求的话)
读取文件时经常会用到路径,关于路径需要注意的几点:一,一定注意Windows下的“\”和“/”差别,一般是用“/”,因为“\”经常被当做转义来用;二,缩进的问题,通过显示所有字符解决;三,中文的问题,一般通过前面加u解决以及开头加上utf-8的编码,python3似乎对中文支持更好一些;四,python对于格式要求及其严格,缩进这块,多一个少一个字符都有问题;五,路径输入时,多一个或者少一个“/”也会出问题