NewsRecommends

所属分类:数据采集/爬虫
开发工具:Python
文件大小:149462KB
下载次数:0
上传日期:2021-05-22 01:34:35
上 传 者sh-1993
说明:  Python网络爬虫与推荐算法新闻推荐平台:网络爬虫:通过Python实现新浪新闻的爬取,可爬取新闻页面上的标题、文本、图片、视频链接(保留排版) 推荐算法:权重衰减+标签推荐+区域推荐+热点推荐
(Python web crawler and recommendation algorithm News recommendation platform)

文件列表:
FinalProject (0, 2021-05-22)
FinalProject\.idea (0, 2021-05-22)
FinalProject\.idea\FinalProject.iml (583, 2021-05-22)
FinalProject\.idea\dataSources.xml (527, 2021-05-22)
FinalProject\.idea\encodings.xml (868, 2021-05-22)
FinalProject\.idea\inspectionProfiles (0, 2021-05-22)
FinalProject\.idea\inspectionProfiles\profiles_settings.xml (174, 2021-05-22)
FinalProject\.idea\misc.xml (303, 2021-05-22)
FinalProject\.idea\modules.xml (276, 2021-05-22)
FinalProject\Demo (0, 2021-05-22)
FinalProject\Demo\DetailSpiderTest.py (1912, 2021-05-22)
FinalProject\Demo\GetNewsList.py (999, 2021-05-22)
FinalProject\Demo\GetUserList.py (912, 2021-05-22)
FinalProject\Demo\__init__.py (0, 2021-05-22)
FinalProject\news.sql (14950102, 2021-05-22)
FinalProject\newsapi (0, 2021-05-22)
FinalProject\newsapi\Recommend (0, 2021-05-22)
FinalProject\newsapi\Recommend\Controller (0, 2021-05-22)
FinalProject\newsapi\Recommend\Controller\RecommendController.py (2698, 2021-05-22)
FinalProject\newsapi\Recommend\Controller\__init__.py (0, 2021-05-22)
FinalProject\newsapi\Recommend\Controller\__pycache__ (0, 2021-05-22)
FinalProject\newsapi\Recommend\Controller\__pycache__\RecommendController.cpython-39.pyc (2472, 2021-05-22)
FinalProject\newsapi\Recommend\Controller\__pycache__\__init__.cpython-39.pyc (147, 2021-05-22)
FinalProject\newsapi\Recommend\HotWordLibrary.py (4195, 2021-05-22)
FinalProject\newsapi\Recommend\NewsCorrelationCalculation.py (4430, 2021-05-22)
FinalProject\newsapi\Recommend\NewsHotValueCal.py (3568, 2021-05-22)
FinalProject\newsapi\Recommend\NewsKeyWordsSelect.py (6638, 2021-05-22)
FinalProject\newsapi\Recommend\NewsRecommendByCity.py (5649, 2021-05-22)
FinalProject\newsapi\Recommend\NewsRecommendByHotValue.py (3061, 2021-05-22)
FinalProject\newsapi\Recommend\NewsRecommendByTags.py (4644, 2021-05-22)
FinalProject\newsapi\Recommend\TextTool.py (1414, 2021-05-22)
FinalProject\newsapi\Recommend\__init__.py (0, 2021-05-22)
FinalProject\newsapi\Recommend\__pycache__ (0, 2021-05-22)
FinalProject\newsapi\Recommend\__pycache__\HotWordLibrary.cpython-39.pyc (3860, 2021-05-22)
FinalProject\newsapi\Recommend\__pycache__\NewsCorrelationCalculation.cpython-39.pyc (3848, 2021-05-22)
FinalProject\newsapi\Recommend\__pycache__\NewsHotValueCal.cpython-39.pyc (3498, 2021-05-22)
FinalProject\newsapi\Recommend\__pycache__\NewsKeyWordsSelect.cpython-39.pyc (5392, 2021-05-22)
FinalProject\newsapi\Recommend\__pycache__\NewsRecommendByCity.cpython-39.pyc (5299, 2021-05-22)
... ...

# Python网络爬虫与推荐算法的新闻推荐平台 #### 介绍 网络爬虫:通过Python实现新浪新闻的爬取,可爬取新闻页面上的标题、文本、图片、视频链接(保留排版) 推荐算法:权重衰减+标签推荐+区域推荐+热点推荐 - 权重衰减进行用户兴趣标签权重的衰减,避免内容推荐的过度重复 - 标签推荐进行用户标签与新闻标签的匹配,按照匹配比例进行新闻的推荐 - 区域推荐进行IP区域确定,匹配区域性文章进行推荐 - 热点推荐进行新闻热点的计算的依据是新闻阅读量、新闻评论量、新闻发布时间 涉及框架:Django、jieba、selenium、BeautifulSoup、vue.js #### 软件功能结构/页面展示 ![输入图片说明](https://images.gitee.com/uploads/images/2021/0521/115103_525fc802_5294263.png "功能结构图.png") 用户端 ![![输入图片说明](https://images.gitee.com/uploads/images/2021/0522/093008_a4c54509_5294263.png "3.png")](https://images.gitee.com/uploads/images/2021/0522/092955_1dc4513b_5294263.png "2.png") ![输入图片说明](https://images.gitee.com/uploads/images/2021/0522/093027_24d2e7c3_5294263.png "5.png") ![输入图片说明](https://images.gitee.com/uploads/images/2021/0522/093042_c6e24eb2_5294263.png "7.png") ![输入图片说明](https://images.gitee.com/uploads/images/2021/0522/093054_fdab818a_5294263.png "Snipaste_2021-05-16_15-06-00.png") ![输入图片说明](https://images.gitee.com/uploads/images/2021/0522/093138_c168ffdb_5294263.png "Snipaste_2021-05-16_15-06-58.png") 管理端 ![输入图片说明](https://images.gitee.com/uploads/images/2021/0522/093157_d790df42_5294263.png "Snipaste_2021-05-16_15-07-21.png") ![输入图片说明](https://images.gitee.com/uploads/images/2021/0522/093233_2d55078f_5294263.png "Snipaste_2021-05-16_15-07-35.png") ![输入图片说明](https://images.gitee.com/uploads/images/2021/0522/093242_17a7d49a_5294263.png "Snipaste_2021-05-16_15-07-47.png") #### 安装教程 1. 安装Python依赖 ``` pip install -r requirements.txt #(requirements.txt文件已经包含在源码根目录下) ``` 2. 安装Vue.js依赖 ``` npm install ``` 前端页面里用户端和管理端是分开的两个项目,所以需要再两个项目下都进行依赖安装! 3. 数据库创建/数据导入 SQL文件已经放在了Django项目根目录下,自行Navicat或其他方式导入即可 4. 数据库配置 ``` DATABASES = { 'default': { 'ENGINE': 'django.db.backends.mysql', 'NAME': 'news', 'USER': 'root', 'PASSWORD': 'root', 'HOST': '127.0.0.1', 'PORT': '3306', } } ``` #### 使用说明 1. Django项目启动 ``` # 进入newsapi的目录 python manage.py runserver 0.0.0.0:8000 ``` 2. Vue项目启动 ``` //用户端 npm run dev //管理端 npm run serve ```

近期下载者

相关文件


收藏者