Hadoop的具体使用案例,我们选取了Yahoo!、百度、Facebook、eBay和海量数据排序为例进行说明,主要介绍了商业公司如何使用Hadoop来增强自己的服务,以及它们在使用Hadoop中遇到的各种问题和改进的方法。Hadoop是开源的系统,任何公司可以根据自己的业务需要对Hadoop进行修改或改进,同时也为Hadoop的改进贡献了自己的力量。
随着Hadoop的不断改进,其强大的分布式功能被越来越多的人熟知,使用Hadoop的公司队伍也在不断壮大中,具体可以登录http://wiki.apache.org/hadoop/PoweredBy查看。
参考文献
另外,本章关于Hadoop在Yahoo!的应用内容是根据Hadoop云计算大会上Yahoo!研究人员的报告整理而成的,Pig和Hive应用相关内容来自Yahoo!研究人员的博客[插图],大家如果想要了解Hadoop在Yahoo!应用中的更多细节和进展,请关注Yahoo!Hadoop团队的博客(http://developer.yahoo.com/blogs/hadoop)。
Hadoop在eBay的应用内容是根据eBay研究人员的技术博客[插图]整理而成的,其中参考了eBay分析平台开发部Anil Madan介绍的Hadoop在eBay的使用情况,大家如果想要了解Hadoop在eBay应用的更多信息,可以关注eBay研究人员的技术博客(http://www.ebaytechblog.com)。
百度使用Hadoop平台的情况则是根据近几届Hadoop中国云计算大会上百度研究人员的报告整理而成,大家如果想了解更详细的信息或Hadoop中国云计算大会的相关信息可登录Hadoop in China网站:http://www.hadooper.cn。
Facebook使用Hadoop的情况是根据Facebook相关技术人员在各个云计算大会上所做的报告整理而成的。
Hadoop平台上的海量数据排序的相关内容是根据Hadoop基准排序测试的报告[插图],[插图]撰写而成,如果大家想要了解排序基准测试的更多细节或排名情况,可以登录http://sortbenchmark.org查看。