Inverted index(Map Reduce)

image.png

Python Solution:

class WordCount:
    def mapper(self, key, line):
        # key我们可以当做是index,或者URL
        for word in line.split():
            yield word, key

    # @param key is from mapper
    # @param values is a set of value with the same key
    def reducer(self, key, values):
        # values 是一组index 或者 URL
        indexes = []
        for v in values:
            indexes.append(v)
        yield key, indexes

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • # Python 资源大全中文版 我想很多程序员应该记得 GitHub 上有一个 Awesome - XXX 系列...
    aimaile阅读 26,657评论 6 427
  • GitHub 上有一个 Awesome - XXX 系列的资源整理,资源非常丰富,涉及面非常广。awesome-p...
    若与阅读 18,927评论 4 418
  • 环境管理管理Python版本和环境的工具。p–非常简单的交互式python版本管理工具。pyenv–简单的Pyth...
    MrHamster阅读 9,227评论 1 61
  • 我是一个试着用文字来表达自己的人 因为我觉得这个方式很难 所以用试着这个词。没有什么人生阅历并没有什么故事可以...
    李青塬阅读 1,293评论 0 0
  • 你每每躺在我身邊,我都覺得不真實,怎麼漂亮的人怎麽會是我的朋友。我跟每一個認識我的人說,這是我的閨密,...
    話嘮姑娘阅读 1,053评论 0 1