ubuntu15.10下nutch2.2.1+hbase1.1.1搭建爬虫平台(失败的尝试)

前言

这篇博客是建立在上一篇<a href="http://www.jianshu.com/p/5e30a6f24d59">ubuntu15.10下nutch2.2.1+mysql搭建爬虫平台</a>基础上的。劝懵逼的小伙伴看一下。

nutch配置的区别

  • 修改conf/nutch-site.xml
<property>
  <name>storage.data.store.class</name>
  <value>org.apache.gora.hbase.store.HBaseStore</value>
  <description>Default class for storing data</description>
</property>
  • 修改 conf/gora.properties
gora.datastore.default=org.apache.gora.hbase.store.HBaseStore
gora.sqlstore.jdbc.driver=org.hsqldb.jdbc.JDBCDriver
gora.sqlstore.jdbc.url=jdbc:hsqldb:hsql://localhost/nutchtest
gora.sqlstore.jdbc.user=youth
gora.sqlstore.jdbc.password=
  • 修改ivy/ivy.xml


<dependency org="org.apache.gora" name="gora-hbase" rev="0.3" conf="*->default" />

####结语
剩下的又是漫长的等待,这个月想自己建一个maven,把常用的jar都放进去
####预告
下一篇<a href="http://www.jianshu.com/p/4979d6eb4ea7">nutch2.2.1与solr4.5.1的整合</a>
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

友情链接更多精彩内容