Hadoop-based-distributed-crawler

所属分类:搜索引擎
开发工具:Java
文件大小:5062KB
下载次数:13
上传日期:2013-11-25 16:23:06
上 传 者zpp117711
说明:  本文讨论了搜索引擎的基本技术和网络爬虫的基本原理,并对分布式爬虫的技术原型Nutch进行了剖析。
(This article discusses the basic principles and basic techniques of search engine web crawlers, and distributed Nutch crawler technology prototypes were analyzed.)

文件列表:
Hadoop-based distributed crawler.nh (5636076, 2013-10-30)

近期下载者

相关文件


收藏者