970054507

积分:340
上传文件:3
下载次数:3
注册日期:2013-04-15 08:47:35

上传列表
Write-Yourself-Web-crawler.rar - C++教学编写自己的网络爬虫软件,教会从理论到实际,从基础到高级,打造自己的网络爬虫软件,2014-03-13 22:31:28,下载7次
LoalaSam_Beta_V0.3.1_cn.zip - 网络爬虫程序,可以自动下载相关信息,也可以根据关键字检索,2014-03-13 22:26:55,下载5次
TextAnalysis.rar - TextAnalysis系统及算法设计 输入为ICTCLAS分词后的词语结构信息,对每个词语的词性进行判断。 1. 如果不存在词性,则跳过这次循环。用来跳过一些语气助词等无意义的信息。 2. 由于每个句子都有几个子句,而每个子句都是一个独立的主谓宾结构,所以系统将子句通过标点符号来分隔。最后将所以子句的总情感权值相加得到总句的情感权值。 3. 在对字典的预处理阶段,系统对不同程度的词语赋予了不同的权值。为了提高处理程序的效率,系统只分析对体现语言情感有较大作用的词性(包括形容词、副词、动词、名词、数词)。 4. 对于副词,需要特殊处理。首先副词是加强语气的作用,如“非常好”,“非常糟糕”。此时句子的情感权值就需要用到副词乘以原来的权值。另外,如“非常非常的不好”,这是就需要用副词来乘以副词了。对应函数sentenceAnalysis。 5. 对于字典中词语权值的说明。对于否定词语,系统设置为-1,即与原来的权值相反,这样也满足双重或多重否定的要求。对于不同的程度词语,对应的分为6个层次,分别赋予不同的权值,以表示不同语气的情感权值的强弱。对于褒义词和贬义词,系统简单的赋予1和-1的权值。对应函数sentenceAnalysis。 ,2014-03-13 22:16:24,下载12次

近期下载

收藏