针对前端大数据量处理(如10W+)

遇到问题

一般对两个数组做做交集和并集处理用遍历方法一般就是通过遍历for等方法,但是如果遇到大数据量(10万条数据)就会用到很长的时间和耗费内存,因为javascrip为单线程,会影响到用户的体验和页面渲染、逻辑处理等问题!

解决方案

使用定时器去让大数据遍历的时候能分成很多个异步方法(每个异步方法去遍历大数据数组的一部分数据)去执行,互相也不影响,并监听到所有异步方法执行完成再进行下一步处理!岂不美滋滋!

setTimrout(()=>{

    ......

},200)

之前方法

使用for循环一次性遍历0W条数据来查找交集和并集,发现使用的时间能达到10S左右(相当影响体验感受和逻辑处理)

方法优化 DataProcessing 类

enum TypeFun {

  Intersection = 'intersection', // 交集

  Difference = 'difference', // 差集

}

class DataProcessing {

  public groupNumber: number = 10000;//每组的个数

  public onFinish: any = null;//全部完成的回调

  public sourceDataField: string = "";

  public targetDataField: string = "";

  private matchList: any = [];//找出的符合比配的列表

  private groupCount: number = 0;//当前处理有多少个分组

  private groupFinishList: any = [];//标记每个分组完成

  private targetDataObj: any = {};

  private stime: any;

  private Type: TypeFun = TypeFun.Intersection;//差集1 ,交集2

  //差集

  Except(sourceDataList: any, targetDataList: any): void {

    this.Type = TypeFun.Difference;

    this.init(sourceDataList, targetDataList);

  }

  //交集

  Intersect(sourceDataList: any, targetDataList: any): void {

    this.Type = TypeFun.Intersection;

    this.init(sourceDataList, targetDataList);

  }

  // 开始

  private init(sourceDataList: any, targetDataList: any) {

    this.stime = new Date();

    this.InitTargetDataObj(targetDataList);

    //通过 groupNumber 计算 得到需要做多少个分组去延迟并行比对

    this.groupCount = Math.ceil(sourceDataList.length / this.groupNumber);

    //循环分组处理

    for (let index = 0; index < this.groupCount; index++) {

      let grouplist = sourceDataList.slice(index * this.groupNumber, ((index + 1) * this.groupNumber));

      this.groupProcess(grouplist);

    }

    this.monitorFinish();

  }

  // 标记字段名

  private InitTargetDataObj(targetDataList: any) {

    this.targetDataObj = {};

    let len = targetDataList.length;

    for (let index = 0; index < len; index++) {

      // 给目标列表的每一个targetDataField字段名做一次标记

      let field = targetDataList[index][this.targetDataField];

      this.targetDataObj[field] = 1;

    }

  }

  //监听是否全部分组都做完了

  private monitorFinish() {

    let Interval = setInterval((This: DataProcessing) => {

      if (This.groupCount == This.groupFinishList.length) {

        let etime: any = new Date();

        let exetime = etime - This.stime;

        console.log("执行时间:" + exetime + "毫秒");

        //取消

        clearInterval(Interval);

        This.onFinish(This.matchList);

        This.clearTargetDataObj();

      }

    }, 10, this);

  }

  ///清空临时对象

  private clearTargetDataObj() {

    for (let f in this.targetDataObj) {

      delete this.targetDataObj[f];

    }

    this.targetDataObj = null;

    this.groupFinishList = [];

  }

  //分组处理

  private groupProcess(list: any) {

    setTimeout((This: DataProcessing) => {

      //延迟处理每组数据

      for (let index = 0; index < list.length; index++) {

        const element = list[index];

        let val = element[This.sourceDataField];

        switch (this.Type) {

          case TypeFun.Difference:

            //判断使用源数据列表的字段放在 标记targetDataObj里面看是否存在

            if (This.targetDataObj[val] == undefined) {

              This.matchList.push(element);

            }

            break;

          case TypeFun.Intersection:

            if (This.targetDataObj[val] != undefined) {

              This.matchList.push(element);

            }

            break;

        }

      }

      This.groupFinishList.push(1);

    }, 0, this);

  }

}
使用

// 测试数据

class TestData {

  public do() {

    //初始化数据

    //处理所有源数据

    let testList: any[] = [];

    for (let index = 0; index < 100000; index++) {

      testList.push({

        id: index,

        name: "测试" + index

      });

    }

    //对比的目标对象

    let targetDataList: any[] = [];

    for (let index = 0; index < 5000; index++) {

      let id = Number.parseInt((Math.random() * 100000) + "");

      targetDataList.push({

        id: id,

        code: "测试" + id

      });

    }

    //调用DataProcessing类来实现处理方法

    let manage = new DataProcessing();

    //设置每个异步方法要处理的数据量

    manage.groupNumber = 5000;

    //设置数据列表需要比对的字段

    manage.sourceDataField = "name";

    //设置目标列表需要比对的字段

    manage.targetDataField = "code";

    manage.onFinish = function (list: any) {

      //完成后的处理;

      console.log("空闲:" + list.length);

    };

    manage.Except(testList, targetDataList);

  }

}
调用
let arrayHandle = new TestData();

arrayHandle.do();
效果

63毫秒! 可以对DataProcessing进行更多的扩展!

结语

多学习、多看报、多运动,不对的地方望指出来,谢谢

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 220,458评论 6 513
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 94,030评论 3 396
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 166,879评论 0 358
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 59,278评论 1 295
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 68,296评论 6 397
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 52,019评论 1 308
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,633评论 3 420
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 39,541评论 0 276
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 46,068评论 1 319
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 38,181评论 3 340
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 40,318评论 1 352
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,991评论 5 347
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,670评论 3 331
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 32,183评论 0 23
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 33,302评论 1 272
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 48,655评论 3 375
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 45,327评论 2 358