bloodxia 在 2009-03-11 01:18:27 上传
说明:搜索引擎正文提取程序,通过html分析和正则,去掉html代码,保留网页正文,只针对中文有效。英文稍加修改即可使用。
开发平台:C# | 大小:71KB | 下载176次
lemontree1257 在 2009-03-10 22:15:38 上传
说明:Follow me超级搜索引擎 源码,是目前全国功能最优秀的超级搜索引擎之一
开发平台:C/C++ | 大小:321KB | 下载8次
书袋熊 在 2009-03-06 22:18:33 上传
说明:关键词提取算法-搜索引擎技术代码实例。该算法由C#编写,采用经典的TF-IDF权重公式计算并确定关键词,对研究搜索引擎的初学者有较大帮助。
开发平台:C++ Builder | 大小:15KB | 下载127次
huazheng 在 2009-03-05 22:58:24 上传
说明:一个基于lucene&heritrix的搜索引擎
开发平台:Java | 大小:9693KB | 下载66次
fuwa_jane 在 2009-03-05 16:18:45 上传
说明:一本很好的介绍搜索引擎-原理、技术与系统的电子书籍,供大家学习交流
开发平台:PDF | 大小:2966KB | 下载18次
yanke0309 在 2009-02-26 11:33:20 上传
说明:1、真正的搜索引擎: 2、 网页蜘蛛灵活高效。 3、可控的正文提取。 4、可控的中文分词及新词学习。 5、无人值守。 6、BS架构,虚拟主机支持。 7、强大功能,简单使用。 8、个性化。 9、增强网站软实力
开发平台:ASP | 大小:22886KB | 下载86次
mood008 在 2009-02-24 10:29:22 上传
说明:自己写的Lucene写搜引擎 简单搜索引擎的设计与实现
开发平台:Java | 大小:10120KB | 下载75次
yhj360599665 在 2009-02-15 15:19:11 上传
说明:搜索引擎程序包括网络把从,网页净化,建立索引,排序等步骤。这是网页净化部分的代码。
开发平台:Visual C++ | 大小:2402KB | 下载60次
lindabinsixiang 在 2009-02-09 18:11:17 上传
说明:larbin是一种开源的网络爬虫/网络蜘蛛,由法国的年轻人 Sébastien Ailleret独立开发。larbin目的是能够跟踪页面的url进行扩展的抓取,最后为搜索引擎提供广泛的数据来源。   Larbin只是一个爬虫,也就是说larbin只抓取网页,至于如何parse的事情则由用户自己完成。另外,如何存储到数据库以及建立索引的事情 larbin也不提供。 latbin最初的设计也是依据设计简单但是高度可配置性的原则,因此我们可以看到,一个简单的larbin的爬虫可以每天获取500万的网页,实在是非常高效。
开发平台:C/C++ | 大小:165KB | 下载110次
zhangjianhua4089 在 2009-02-05 15:25:45 上传
说明:这里提供一个喜欢做lucene搜索引擎的朋友一个lucene中文手册,帮组大家更好的了解lucene
开发平台:Java | 大小:1374KB | 下载17次
ok330 在 2009-01-17 09:10:34 上传
说明:对于垂直搜索引擎来说,网络蜘蛛是非常重要的,因为在垂直搜索领域,数据的收集工作都是由蜘蛛程序来完成的。垂直搜索引擎除了要设计蜘蛛程序外,还要管理这些蜘蛛程序的运行,这是比较复杂的工作。如果缺乏一套有效的管手段,那么垂直搜索引擎将面临一场恶梦。   然而幸运的是,我们有了海蛛--这个领先的垂直搜索专用网络蜘蛛系统。有了海蛛,垂直搜索更简单!使用了海蛛,一切变得有条不紊,变得简单起来。
开发平台:HTML | 大小:16402KB | 下载127次
neugraduzyq 在 2009-01-14 08:26:13 上传
说明:这个文件是和北大TSE搜索引擎配套的更详细的文档,希望对大家有所帮助!
开发平台:Visual C++ | 大小:249KB | 下载116次
liumangtu 在 2009-01-09 21:28:36 上传
说明:搜索引擎索引数据库的设计与实现搜索引擎索引数据库的设计与实现
开发平台:Visual Basic | 大小:5670KB | 下载42次
鲁迅开发 在 2008-12-29 10:40:12 上传
说明:RiSearch PHP是一个高效,功能强大的搜索引擎,特别适用于中小型网站。RiSearch PHP非常快,它能够在不到1秒钟内搜索5000-10000个页面。RiSearch是一个索引搜索引擎,这就意味着它先将你的网站做索引并建立一个数据库来存储你网站所有页面的关键词以便快速搜索。Risearch是全文搜索引擎脚本,它把所有的关键词都编成一个文档索引除了配置文件里面的定义排除的关键词。 RiSearch使用经典的反向索引算法(与大型的搜索引擎相同),这就是为什么它会比其它搜索引擎快的原因。
开发平台:PHP | 大小:38KB | 下载37次
larryptboat 在 2008-12-25 22:16:14 上传
说明:《搜索引擎--原理、技术与系统》 相当好的一本书。
开发平台:Windows_Unix | 大小:2966KB | 下载5次
ruanyang1234 在 2008-12-24 17:19:13 上传
说明:搜索引擎 C#编写多线程搜索引擎。可实现不用的数据库服务器与文件服务器。
开发平台:C# | 大小:5668KB | 下载47次
techshen 在 2008-12-22 22:08:54 上传
说明:一种网络爬虫,带图形界面的,能够定制爬虫需求,对搜索引擎的开发有一定帮助
开发平台:Unix_Linux | 大小:3894KB | 下载26次
pipalcn 在 2008-12-19 15:30:41 上传
说明:ftp搜索引擎源码。里面包含了该搜索引擎所需的各种文件。
开发平台:C/C++ | 大小:28KB | 下载33次
hftwwww 在 2008-12-09 22:37:56 上传
说明:在SSH框架下用Lucene做的一个搜索引擎系统,供学习参考!
开发平台:Java | 大小:11123KB | 下载23次
weiyufeng59 在 2008-12-09 14:25:03 上传
说明:关于暴力视频的搜索引擎,来源于学生的笔意设计
开发平台:Visual C++ | 大小:18509KB | 下载16次
200828009029002 在 2008-12-05 16:48:30 上传
说明:这个是用C++语言实现的lucence—搜索引擎,含有所有的源代码
开发平台:Visual C++ | 大小:1900KB | 下载45次
liping365 在 2008-12-04 21:21:28 上传
说明:一款搜索引擎的源代码 功能齐全,望大家下载
开发平台:C++ | 大小:6016KB | 下载169次
yktchina 在 2008-12-03 17:41:06 上传
说明:最近花了2天时间看了一本由浩维互动推出的免费电子书《搜索引擎优化魔法书SEO Magic》 , 收获挺大的,特别向大家推荐。这是我目前为止看到的最新最全面的关于中文网页搜索引擎优化的电子书。
开发平台:PDF | 大小:3428KB | 下载163次
doso123 在 2008-12-02 19:50:40 上传
说明:JEECSM是JavaEE版网站管理系统(Java Enterprise Edition Content Manage System)的简称。 基于java技术开发,继承其强大、稳定、安全、高效、跨平台等多方面的优点 采用hibernate3+struts2+spring2+freemarker主流技术架构 懂html就能建站,提供最便利、合理的使用方式 强大、灵活的标签,用户自定义显示内容和显示方式 在设计上自身预先做了搜索引擎优化,增强对搜索引擎的友好性 采用伪静态页面技术,可自定义路径结构,无需urlrewrite 轻松建设大规模网站,可通过次级域名建立子站群,各子站后台管理权限分离,全站实现单点登录
开发平台:Java | 大小:167KB | 下载81次
starbuaa 在 2008-12-02 13:35:33 上传
说明:用Matlab辅助实现网络图片搜索的源代码。(平台为Matlab,就是用Matlab调用Google的图片搜索引擎)有个小例子
开发平台:matlab | 大小:6KB | 下载47次
dilei4148 在 2008-11-23 00:02:14 上传
说明:php开源搜索引擎,垂直搜索引擎带蜘蛛,适合做行业垂直搜索引擎
开发平台:PHP | 大小:278KB | 下载34次
dilei4148 在 2008-11-22 23:57:44 上传
说明:搜索引擎带web爬虫,开源PHP源码,非常好的开源垂直搜索引擎
开发平台:PHP | 大小:39KB | 下载182次
caribbean_dna 在 2008-11-22 14:31:34 上传
说明:搜索引擎的研究与实现(Java)(含源码) 导入工程可以直接使用
开发平台:Java | 大小:872KB | 下载27次
yuezejun 在 2008-11-21 09:45:59 上传
说明:一个信息检索模型,改进之处在于利用词汇之间的聚合网络实现了搜索引擎参数的自动调整和优化
开发平台:Visual C++ | 大小:4678KB | 下载78次
spidermanzhuting 在 2008-11-18 22:10:41 上传
说明:北大天网搜索引擎测试源程序 非常好,适合初学者
开发平台:Visual C++ | 大小:137KB | 下载183次