多任务分布式调度算法——合理分配任务资源

问题:A网站抓取需要8个小时,B网站需要半个小时,如果A网站先开始那么B网站需要8个小时候才能执行到。如果A网站的紧迫性没那么高,只期望能慢慢的刷新譬如论坛网站,而B网站期望能尽快执行完毕。因此我们期望通过调配资源达到谋种和谐状态。
分析:若设置权重B权重高,A权重低,可以满足先执行B网站,但是如果A网站是循环任务,就会导致B网站永远获取不到资源。所以我们期望A网站每次执行的概率大,B网站执行任务的概率小。所以就转化为“权重to概率问题”。
设想方案参见:


调度方案

简述:A、B、C三个网站的任务,权重分别设为:2、3、5,它们衍生出来的抓取请求分别排队入A、B、C队列(当然也可以拓展深度、广度算法,比较简单可自行按需拓展)。


权重池

这个图是当前任务权重池,新来添加完成移除。


权重转概率

每个线程获取任务时根据当前权重池的所有权重,随机一个随机因子看会落到哪个范围,然后从该范围对应的权重队列中获取任务执行。
任务分布式调度时最后几个请求被多个节点并行获取并执行时,很难区分到底是哪一个线程最后执行完毕并通知任务结束。采用from_que/to_que这种方案比较优。
任务分布式调度

并且若某个节点的任务执行一半宕机后,还可以从to_que中将任务恢复并重新拉入from_que中供执行,这些请求需要追加一个retry_times属性,重试多次后需要记录到failed_record表,供问题分析。
还可以从队列中查看待执行的任务、正在执行的任务、需要重试的任务等等做统计和展示。

此方案是针对爬虫分布式多网站抓取所涉及也适用于类似分布式调度, 若有好的建议可以深入讨论分析~

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 212,657评论 6 492
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 90,662评论 3 385
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 158,143评论 0 348
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 56,732评论 1 284
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 65,837评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,036评论 1 291
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,126评论 3 410
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,868评论 0 268
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,315评论 1 303
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,641评论 2 327
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,773评论 1 341
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,470评论 4 333
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,126评论 3 317
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,859评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,095评论 1 267
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,584评论 2 362
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,676评论 2 351

推荐阅读更多精彩内容

  • 背景 随着互联网的发展,应用服务中的定时任务数量日益增加,常规的垂直应用架构已无法应对,分布式服务架构势在必行。同...
    凯睿看世界阅读 1,147评论 0 10
  • 阿里妹导读:搜索中台建设过程中,单个系统不再能满足复杂业务的需求,更多时候需要多个子系统互相协作,异步地按照指定流...
    高级java架构师阅读 4,474评论 0 7
  • 写在前面的话 代码中的# > 表示的是输出结果 输入 使用input()函数 用法 注意input函数输出的均是字...
    FlyingLittlePG阅读 2,743评论 0 8
  • 真正体会到了每分每秒都活在当下的感觉,脑子里时刻被目标填满,第一次感受到原来人生还有这样的活法。 早上起早赶车,然...
    幽蝴阅读 392评论 0 1
  • 张学友——《情书》 你瘦了憔悴得让我好心疼 有时候爱情比时间还残忍 把人变得盲目而奋不顾身 忘了爱要两个同样用心的...
    温故而之馨阅读 298评论 0 0