使用php实现稀疏数组

场景一

在这里插入图片描述

场景二

报表的存储场景(这里暂不涉及表间取数和勾稽关系的计算)

image.png

而且此类的报表往往分类很多,例如:

image.png

定义

稀疏数组可以看做是普通数组的压缩,这里的普通数组特点是值无效数据量远大于有效数据量的数组

形如:

0 0 0 0 0 0 0 0 0 0 0
0 0 1 0 0 0 0 0 0 0 0
0 0 0 0 2 0 0 0 0 0 0
0 0 0 0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0 0 0 0

稀疏数组形式:

11 11 2
1  2  1
2  4  2

为什么要进行压缩存储呢

  • 原数组中存在大量的无效数据,占据了大量的存储空间,真正有用的数据却少之又少.
  • 压缩存储可以节省存储空间以避免资源的不必要的浪费,在数据序列化到磁盘时,压缩存储可以提高IO效率 .

备注:数据密集型结构不太适合这种解决方式

实现

第一行存储原始数据行数,列数,非0数据个数

其它每行都存储非0数行,列坐标和具体值

11 11 2  // 代表11行,11列,有2个非0值
1  2  1
2  4  2

这里分步解析,具体请看注释

具体代码如下:

image.png
image.png

最终结果:

image.png

代码改进一下,采用文件存储,当然最终的数据是要存到db里的.

具体代码如下:

<?php

class HandelArray
{
    public $x;
    public $y;

    /**
     * 设置数组边界
     * HandelArray constructor.
     * @param $x
     * @param $y
     */
    public function __construct($x, $y)
    {
        $this->x = $x;
        $this->y = $y;
    }

    /**
     * 初始化数据
     * @return array
     */
    public function initArray(): array
    {
        $initArr = [];
        for ($i = 0; $i < $this->x; $i++) {
            for ($j = 0; $j < $this->y; $j++) {
                $initArr[$i][$j] = 0;
            }
        }
        return $initArr;
    }

    /**
     * 压缩数据(创建稀疏数组)
     * @param array $rawArr
     * @return array
     */
    public function sparseArray(array $rawArr): array
    {
        $sparseArray = [];
        $count = 0;
        $sparseArray[$this->x][$this->y] = 0;
        for ($i = 0; $i < $this->x; $i++) {
            if ($rawArr[$i] == 0) {
                continue;
            }
            for ($j = 0; $j < $this->y; $j++) {
                if ($rawArr[$i][$j] == 0) {
                    continue;
                }
                $count++;
                $sparseArray[$i][$j] = $rawArr[$i][$j];
            }
        }
        $sparseArray[$i][$j] = $count;
        return $sparseArray;

    }

    /**
     * 压缩数据恢复
     * @param array $sparseArray
     * @return array
     */
    public function recoveryArray(array $sparseArray): array
    {

        $recoveryArray = $this->initArray();

        // array_shift 会重置指针,请注意
        unset($sparseArray[$this->x]);

        foreach ($recoveryArray as $k => $v) {
            foreach ($recoveryArray[$k] as $index => $value) {
                // 获取非0值
                if (isset($sparseArray[$k][$index]) && $sparseArray[$k][$index] > 0) {
                    $recoveryArray[$k][$index] = $sparseArray[$k][$index];
                }
            }
        }
        return $recoveryArray;
    }


    /**
     * 打印压缩数据
     * @param array $data
     */
    public function printPosition(array $data): void
    {
        foreach ($data as $k => $v) {
            foreach ($data[$k] as $index => $value) {
                printf("%s %s %s" . PHP_EOL, $k, $index, $value);
            }
        }
    }

    /**
     * 打印结构数据
     * @param array $data
     */
    public function printStruct(array $data): void
    {
        foreach ($data as $k => $v) {
            foreach ($data[$k] as $index => $value) {
                printf("%s ", $value);
            }
            echo PHP_EOL;
        }
    }

    /**
     * 写入文件
     * @param string $file
     * @param array $data
     */
    public function sparseArrayToFile(string $file, array $data): bool
    {
        return file_put_contents($file, serialize($data), LOCK_EX);
    }

    /**
     * 读取文件
     * @param string $file
     * @return bool|string
     */
    public function sparseArrayFromFile(string $file)
    {
        return file_get_contents($file);
    }
}

// 1 初始化数组
$x = $y = 11;
$hArr = new HandelArray($x, $y);
$initArr = $hArr->initArray();

// 2 数据填充
$rawArr = $initArr;
$rawArr[1][2] = 1;
$rawArr[2][4] = 2;
print_r("创建原始数组" . PHP_EOL);
$hArr->sparseArrayToFile('raw_array.data', $rawArr);
$hArr->printStruct($rawArr);

// 3 创建稀疏数组
$sparseArray = $hArr->sparseArray($rawArr);
$hArr->sparseArrayToFile('sparse_array.data', $sparseArray);
$sparseArray = unserialize($hArr->sparseArrayFromFile('sparse_array.data'));

print_r("创建稀疏数组" . PHP_EOL);
$hArr->printPosition($sparseArray);

// 4 还原稀疏数组
print_r("还原稀疏数组" . PHP_EOL);
$rawArr = $hArr->recoveryArray($sparseArray);
$hArr->printStruct($rawArr);



打印输出:

image.png

我们来看下保存的文件大小.

image.png

我们在来对比文件内容:

压缩前
压缩后
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 220,137评论 6 511
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 93,824评论 3 396
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 166,465评论 0 357
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 59,131评论 1 295
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 68,140评论 6 397
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,895评论 1 308
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,535评论 3 420
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 39,435评论 0 276
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,952评论 1 319
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 38,081评论 3 340
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 40,210评论 1 352
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,896评论 5 347
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,552评论 3 331
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 32,089评论 0 23
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 33,198评论 1 272
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 48,531评论 3 375
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 45,209评论 2 357