KG-demo-for-movie-master

所属分类:数据挖掘/数据仓库
开发工具:Python
文件大小:2009KB
下载次数:31
上传日期:2018-05-14 14:09:15
上 传 者water160
说明:  小型电影知识图谱,包含一个简易的智能问答程序
(A small film knowledge map contains a simple intelligent question answering program.)

文件列表:
catalog-v001.xml (265, 2018-01-28)
data (0, 2018-01-28)
data\ER_diagram.mwb (10547, 2018-01-28)
data\kg_demo_movie.sql (1757163, 2018-01-28)
fuseki_conf.ttl (1527, 2018-01-28)
kg_demo_movie.nt (8915766, 2018-01-28)
kg_demo_movie (0, 2018-01-28)
kg_demo_movie\.idea (0, 2018-01-28)
kg_demo_movie\.idea\inspectionProfiles (0, 2018-01-28)
kg_demo_movie\.idea\inspectionProfiles\profiles_settings.xml (228, 2018-01-28)
kg_demo_movie\.idea\kg_demo_movie.iml (459, 2018-01-28)
kg_demo_movie\.idea\misc.xml (213, 2018-01-28)
kg_demo_movie\.idea\modules.xml (278, 2018-01-28)
kg_demo_movie\.idea\workspace.xml (31453, 2018-01-28)
kg_demo_movie\KB_query (0, 2018-01-28)
kg_demo_movie\KB_query\external_dict (0, 2018-01-28)
kg_demo_movie\KB_query\external_dict\__init__.py (133, 2018-01-28)
kg_demo_movie\KB_query\external_dict\csv2txt.py (490, 2018-01-28)
kg_demo_movie\KB_query\external_dict\movie_title.csv (31633, 2018-01-28)
kg_demo_movie\KB_query\external_dict\movie_title.txt (38267, 2018-01-28)
kg_demo_movie\KB_query\external_dict\person_name.csv (2425, 2018-01-28)
kg_demo_movie\KB_query\external_dict\person_name.txt (3171, 2018-01-28)
kg_demo_movie\KB_query\jena_sparql_endpoint.py (2802, 2018-01-28)
kg_demo_movie\KB_query\jena_sparql_endpoint.pyc (2964, 2018-01-28)
kg_demo_movie\KB_query\query_main.py (1715, 2018-01-28)
kg_demo_movie\KB_query\question2sparql.py (1181, 2018-01-28)
kg_demo_movie\KB_query\question2sparql.pyc (1577, 2018-01-28)
kg_demo_movie\KB_query\question_temp.py (22926, 2018-01-28)
kg_demo_movie\KB_query\question_temp.pyc (22081, 2018-01-28)
kg_demo_movie\KB_query\word_tagging.py (1472, 2018-01-28)
kg_demo_movie\KB_query\word_tagging.pyc (2176, 2018-01-28)
kg_demo_movie\crawler (0, 2018-01-28)
kg_demo_movie\crawler\__init__.py (129, 2018-01-28)
kg_demo_movie\crawler\movie_crawler.py (9495, 2018-01-28)
kg_demo_movie\crawler\tradition2simple (0, 2018-01-28)
kg_demo_movie\crawler\tradition2simple\__init__.py (129, 2018-01-28)
kg_demo_movie\crawler\tradition2simple\langconv.py (7953, 2018-01-28)
kg_demo_movie\crawler\tradition2simple\traditional2simple.py (283, 2018-01-28)
... ...

# Data文件夹 包含ER图模型文件和创建数据库、表,插入所有数据的sql文件。用户可以直接使用sql文件导入数据到mysql中。 # kg\_demo_movie文件夹 - crawler中的movie_crawler用于从The Movie DB下载数据,用户需要自己去网站注册账号,申请API KEY。在脚本中填入自己的API KEY,填写mysql相关参数即可运行。用户需要额外下载的包:requests和pymysql。tradition2simple用于将繁体字转为简体字(声明一下,我找不到该文件的出处了,我是从网上找到的解决方案,如果有用户知道该作者,麻烦告知,我会备注)。 - KB_query文件夹包含的是完成整个问答demo流程所需要的脚本。 - "external_dict"包含的是人名和电影名两个外部词典。csv文件是从mysql-workbench导出的,按照jieba外部词典的格式,我们将csv转为对应的txt。 - "word_tagging",定义Word类的结构(即我们在REfO中使用的对象);定义"Tagger"类来初始化词典,并实现自然语言到Word对象的方法。 - "jena\_sparql_endpoint",用于完成与Fuseki的交互。 - "question2sparql",将自然语言转为对应的SPARQL查询。 - "question_temp",定义SPARQL模板和匹配规则。 - "query\_main",main函数。在运行"query_main"之前,读者需要启动Fuseki服务。 # ontology.owl 通过protege构建的本体,用户可以直接用protege打开,查看或修改。 # kg\_demo\_movie_mapping.ttl 根据d2rq mapping language编辑的映射文件,将数据库中的数据映射到我们构建的本体上。 # kg\_demo_movie.nt 利用d2rq,根据mapping文件,由Mysql数据库转换得到的RDF数据。 # fuseki_conf.ttl fuseki server配置文件,指定推理引擎,本体文件路径,规则文件路径,TDB路径等 # rules.ttl 规则文件,用于基于规则的推理。

近期下载者

相关文件


收藏者