【Human Sorting】
常见的python排序只需要一个sort或者sorted函数即可。但是默认采用的是字典序,这会带来一个问题,如果列表中的元素是字符串+数字组合,往往无法得到我们想要的排序结果。
比如对于列表 ['file11', 'file2', 'file1'] :
使用sort/sorted函数的排序结果如下:
test_list = ['file11', 'file2', 'file1']
test_list.sort()
print(test_list)
可以看到file11排在了file2前面,元素名中的数字也按照字典序进行排序了。很多时候这并不是我们期待的。比如对日志文件排序的时候,我们希望file11排在file2后面。这时候就需要对排序逻辑进行调整。
基本思路是将列表元素名中的字符串和数字分割开来。
import re
def tryint(s): //将元素中的数字转换为int后再排序
try:
return int(s)
except ValueError:
return s
def str2int(v_str): //将元素中的字符串和数字分割开
return [tryint(sub_str) for sub_str in re.split('([0-9]+)', v_str)]
def sort_humanly(v_list): //以分割后的list为单位进行排序
return sorted(v_list, key=str2int)
测试结果如下:
test_list = ['file11', 'file2', 'file1', 'file101']
common_sort_list = sorted(test_list)
human_sort_list = sort_humanly(test_list)
print('before sort: ' + str(test_list))
print('after common sort: ' + str(common_sort_list))
print('after human sort: ' + str(human_sort_list))
可以看到返回了我们期望的结果。
排序代码来自以下链接:
https://nedbatchelder.com/blog/200712/human_sorting.html
【python排序拓展】
一、dict按照key进行排序
1.返回dict的key list,对key list排序后,再依次输出对应的value。
2.使用lamdda表达式。
def sortbykey1(v_dict):
v_keys = list(v_dict.keys())
v_keys.sort()
return dict(zip(v_keys, [v_dict[key] for key in v_keys]))
def sortbykey2(v_dict):
return sorted(v_dict.items(), key=lambda x: x[0])
测试结果如下:
test_dict = {'hkg11': 2, 'hkg101': 101, 'hkg2': 3, 'hkg1': 4}
print('before sort by key: ' + str(test_dict))
print('after sort bey key 1: ' + str(sortbykey1(test_dict)))
print('after sort bey key 2: ' + str(sortbykey2(test_dict)))
二、dict按照value进行排序
1.通过dict.items()返回(key, value)形式的list,然后将key和value对调,对list进行排序就相当于是对value进行排序了,最后将排序后的list恢复回dict。
2.使用lamdda表达式。
def sortbyvalue1(v_dict):
v_items = v_dict.items()
backuplist = [[i[1], i[0]] for i in list(v_items)]
backuplist.sort()
sortkey = [i[1] for i in backuplist]
sortvalue = [i[0] for i in backuplist]
return dict(zip(sortkey, sortvalue))
def sortbyvalue2(v_dict):
return sorted(v_dict.items(), key=lambda x: x[1])
测试结果如下:
test_dict = {'hkg11': 2, 'hkg101': 101, 'hkg2': 3, 'hkg1': 4}
print('before sort by value: ' + str(test_dict))
print('after sort bey value 1: ' + str(sortbyvalue1(test_dict)))
print('after sort bey value 2: ' + str(sortbyvalue2(test_dict)))