多字段排序 -- PHP版

上期单机redis平稳重启的我的解决办法:
用不同的端口来搭建一个cluster,这样就可以不中断服务重启了,而且,管理多块小内存可能比管理一大块内存要好。


闲来有空,说一下自己写的一个多字段排序算法。
之前有一个需求是每日更新游戏排行榜,需要把近7天新增的游戏评价集合,计算平均分,按平均分倒序排列,平均分相等的按照游戏发行时间倒序来排。

数据库设计的时候是按照游戏id进行hash,对10取模获取游戏评价表名的。然而把数据集合起来之后,需要对数据进行重新排序,这里就不能用mysql的order by了。(其实也可以的,新建一个临时表来查询,但是估计没人想用这么傻的方法)

既然这样,就需要自己手写一个多字段排序的算法来解决这个问题了。(先说一下结果,我写完之后,发现php有现成的function可以用,array_multisort,看官们可以去查一下手册看用法,但是我自己写的这个还有另外一个用处,就是对不进行排序的字段可以一并保留输出。但从性能来说,肯定是php原生的function会高得多,所以要看情况来使用)

首先来明确一下思路,对一个 list 进行排序(这里我用 list,因为 set 没有重复值,list更符合大多数情况),排序有顺序和倒序。list 中 n 个元素前面 j 个值都相同,则比较下一级字段,如果所有字段的值都相等,则这 n 个元素可以视为相同,则只要它们的排序是相连的即可。另外,如果某两个元素全部字段都相等,它们可以互换位置,也可以不换位置。如果换位置,这个排序就称为不稳定的,反之就是稳定的。
ps:我写的这个算法是不稳定的。。。o(╥﹏╥)o

做法:建立一个新的空 list,从输入的 list 取出一个(头尾都可)这里称为tmp,按顺序去跟新的 list 中的元素比较(顺序搜索法),如果搜索到一个元素是,按照当前排序规则是可以排在当前元素的前面的,或者两元素相等,则让tmp占据新 list 的当前位置,当前元素及其后面的元素依次往后移动(插入排序)。到最后如果搜索不到符合条件的元素,则让tmp直接进入队尾。说的有点多,来看代码。talk is cheap,show me the code。

/**
 * [multiSortArray 数组多字段排序(算法为顺序搜索和插入排序,是不稳定的排序,但可以维持其他不排序字段不变,时间复杂度大概是O(n²),空间复杂度不会算),不关心非排序字段可用PHP原生函数:array_multisort ()]
 * @author [KAEL] <[<email address>]>
 * @param  [Array]  $arr    [原数组]
 * @param  [Array]  $fields [排序字段]
 * @param  [Array]  $sorts   [排序规则,正序传SORT_ASC,倒序传SORT_DESC]
 * @return [type]         [description]
 */
public static function multiSortArray(Array $arr, Array $fields, Array $sorts) {
// 这里的$sorts的长度可以$fields少,不足的按照最后一个补齐,让调用者可以稍微偷点懒

// 以下代码都是进行参数验证的代码,可以忽略不看,是为了程序的鲁棒性-----------------------

    if (empty($arr) || empty($fields) || empty($sorts)) {
        return false;
    }
    // 二维数组
    $arr = array_values($arr);
    if (!is_array($arr[0])) {
        return false;
    }
    $fields = array_values($fields);
    $sorts = array_values($sorts);

    $tmp = array_unique($sorts);
    $sortType = array(SORT_ASC, SORT_DESC);
    if ((!in_array($tmp[0], $sortType)) || (isset($tmp[1]) && !in_array($tmp[1], $sortType))) {
        return false;
    }

    $tmp = array_slice($sorts, -1, 1);
    $tmp = $tmp[0];// 最后一个排序
    $sorts = array_pad($sorts, count($fields), $tmp);// 填充排序数组
    foreach ($fields as $key => $value) {
        if (!is_string($value) || !isset($arr[0][$value])) {
            return false;
        }
    }

    $fcount = count($fields);
    $list = array();
    $list[] = array_shift($arr);

// 以上代码都是进行参数验证的代码,可以忽略不看,是为了程序的鲁棒性-----------------------

    while ($tmp = array_shift($arr)) {
        $count = count($list);
        $flag = false;// 一个标记是否有进行插入排序的flag
        foreach ($list as $key => $value) {
            if (self::recurseCompare($tmp, $value, $fields, $sorts, 0)) {
                        // 匹配成功就进行插入排序
                for ($i = $count; $i > $key; --$i) {
                    $list[$i] = $list[$i-1];
                }
                $list[$key] = $tmp;
                $flag = true;
                break;
            }
        }
        if (!$flag) {
                // 插入队尾
            array_push($list, $tmp);
        }
    }
    return $list;
}

以下是字段比较的递归算法:

        /**
         * [recurseCompare 多字段排序递归比较]
         * @param  [Array]   $var1   [变量1]
         * @param  [Array]   $var2   [变量2]
         * @param  [Array]   $fields [字段数组]
         * @param  [Array]   $sorts  [排序数组]
         * @param  [integer] $index  [比较字段索引]
         * @return [type]          [description]
         */
        private static function recurseCompare(Array $var1, Array $var2, Array $fields, Array $sorts, $index = 0) {
            $index = intval($index);
            $key = $fields[$index];
            $count = count($fields);
            if (!is_numeric($var1[$key]) && is_string($var1[$key])) {
                // 字符串排序,英文的,中文别想了,大兄dei
                $res = StrUtil::dictCompare($var1[$key], $var2[$key]);
                // -1表示 val1 比 val2 小,0表示相等,1表示 val1 的比 val2 要大
                if ($res === 0 && $key == $count - 1) {
                // 当前字段相等且已经没有下一字段可供比较,返回true
                // 这里可以返回其他值,供调用方判断,减少一位元素的移动,以提高性能,变成稳定的排序
                    return true;
                }elseif (($sorts[$index] == SORT_ASC && $res == 1) || ($sorts[$index] == SORT_DESC && $res == -1)) {
                    return false;
                }elseif (($sorts[$index] == SORT_ASC && $res == -1) || ($sorts[$index] == SORT_DESC && $res == 1)) {
                    return true;
                }elseif ($res === 0 && $key < $count - 1) {
                    // 当前字段相等则比较下一字段
                    return self::recurseCompare($var1, $var2, $fields, $sorts, ++$index);
                }
            }
            // 数字排序
            if ($key == $count - 1 && $var1[$key] == $var2[$key]) {
                // 与上面同理
                return true;
            }elseif ($sorts[$index] == SORT_ASC && $var1[$key] > $var2[$key]) {
                return false;
            }elseif ($sorts[$index] == SORT_DESC && $var1[$key] < $var2[$key]) {
                return false;
            }elseif ($sorts[$index] == SORT_ASC && $var1[$key] < $var2[$key]) {
                return true;
            }elseif ($sorts[$index] == SORT_DESC && $var1[$key] > $var2[$key]) {
                return true;
            }elseif ($count - 1 > $index && $var1[$key] == $var2[$key]) {
                // 与上面同理
                return self::recurseCompare($var1, $var2, $fields, $sorts, ++$index);
            }
        }

下面送上字典排序方法(实际上就是比较ASCII码,想到更好方法的小伙伴可以在下面留言):

        /**
         * [dictCompare 比较两个字符串的字典顺序]
         * @param  [string] $str1 [字符串1]
         * @param  [string] $str2 [字符串2]
         * @return [type]       [description]
         */
        public static function dictCompare($str1, $str2) {
            if (!is_string($str1) || !is_string($str2)) {
                return false;
            }
            if ($str1 == $str2) {
                return 0;
            }
            $len1 = strlen($str1);
            $len2 = strlen($str2);
            $maxlen = $len1>$len2?$len1:$len2;
            for ($i = 0; $i < $maxlen; ++$i) {
                if (!isset($str1[$i])) {
                    return -1;
                }elseif (!isset($str2[$i])) {
                    return 1;
                }
                $asc1 = ord($str1[$i]);
                $asc2 = ord($str2[$i]);
                if ($asc1 > $asc2) {
                    return 1;
                }elseif ($asc1 < $asc2) {
                    return -1;
                }
            }
        }

这期的代码和文字有点多,但是算法的时间复杂度大O是n2,空间复杂度估计不是很高吧,适合数据量不大的情况,把顺序搜索法换成二分法搜索估计时间复杂度会降低不少,也能处理多一点的数据。另外如果字符串比较的方法能够改进一下的话,那这个算法就比较通用了。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 215,539评论 6 497
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,911评论 3 391
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 161,337评论 0 351
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,723评论 1 290
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,795评论 6 388
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,762评论 1 294
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,742评论 3 416
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,508评论 0 271
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,954评论 1 308
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,247评论 2 331
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,404评论 1 345
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,104评论 5 340
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,736评论 3 324
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,352评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,557评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,371评论 2 368
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,292评论 2 352

推荐阅读更多精彩内容

  • 概述:排序有内部排序和外部排序,内部排序是数据记录在内存中进行排序,而外部排序是因排序的数据很大,一次不能容纳全部...
    每天刷两次牙阅读 3,729评论 0 15
  • 概述 排序有内部排序和外部排序,内部排序是数据记录在内存中进行排序,而外部排序是因排序的数据很大,一次不能容纳全部...
    蚁前阅读 5,178评论 0 52
  • 楔子 渭河岸边矗立着一座这样的城池,由肥沃却饱经风霜苍凉的黄土筑起的高高城墙上千疮百孔,城楼上残破的旌旗在迎风飘扬...
    绛冬阅读 547评论 6 18
  • 1. JavaScript 定义了几种数据类型? 哪些是原始类型?哪些是复杂类型?原始类型和复杂类型的区别是什么?...
    谨言_慎行阅读 169评论 0 0
  • 路遥先生曾这样说过:“只有永不遏制的奋斗,才能使青春之花即便是凋谢,也是壮丽的凋谢。”是啊,青春是人生之王,一旦逝...
    木籽离阅读 881评论 0 2