wass44

积分:389
上传文件:5
下载次数:51
注册日期:2016-09-28 21:33:04

上传列表
ThemeCrawler.rar - 现在常见的搜索策略主要分为两种:一种是基于网页链接结构的搜索策略,另一种是基于内容评价的搜索策略。第一种是通过网页之间的链接关系来确定网页的重要性,从而决定链接访问的顺序。此方法虽然考虑了网页链接结构和网页之间的链接关系,但忽略了网页内容与主题的相关度,容易出现网页搜索“主题漂移”。第二种主要考虑网页内容,好处就是思路清晰且计算简单。但这种方法忽略了网页的链接关系,故在预测链接网页价值方面存在不足。考虑到这些问题,提出将布谷鸟搜索算法应用到主题爬虫中。,2016-10-02 00:27:12,下载5次
ga.zip - 遗传算法是一种借鉴生物界自然选择和自然遗传机制的随机搜索算法。它简单、鲁棒性好,具有自组织 性、自适应性、自学习性,其本质是一种高效、并行、全局搜索的方法,它能在搜索过程中自动获取和积累有 关搜索空间的知识,并自适应地控制搜索过程以求得最优解, ,2016-10-02 00:24:59,下载4次
focus-crawler.rar - 网络爬虫作为一个自动爬取网页的程序,为搜索引擎从网站上下载网页,是搜索引擎的重要组成部分。主题爬虫是专为查询某一主题或者某一领域应运而生的页面抓取工具。不同于通用搜索引擎,主题搜索引擎具有针对性,输入主题关键字,搜到的网页都是主题相关度极高的网页。,2016-10-02 00:22:43,下载7次
cs.zip - 布谷鸟搜索算法是一种全局收敛性的随机算法。布谷鸟搜索算法模拟了布谷鸟寻找巢穴产卵的行为,算法具有简单,易于实现,随机搜索的路径优、寻优能力强的特点,在工程应用上已经有了许多成功的应用。,2016-10-01 22:21:19,下载21次
2016NLPIR.zip - 应各位ICTCLAS用户的要求,张华平博士正式发布ICTCLAS2013 版本,为了与以前工作进行大的区隔,并推广NLPIR自然语言处理与信息检索共享平台,从本版本开始,系统名称调整为NLPIR汉语分词系统。张博士先后倾力打造十余年,内核升级10次,全球用户突破20万,先后获得了2010年钱伟长中文信息处理科学技术奖一等奖,2003年国际SIGHAN分词大赛综合第一名,2002年国内973评测综合第一名。 NLPIR汉语分词系统(又名ICTCLAS2013),主要功能包括中文分词;词性标注;命名实体识别;用户词典功能;支持GBK编码、UTF8编码、BIG5编码。新增微博分词、新词发现与关键词提取;,2016-10-01 22:16:11,下载7次

近期下载

收藏