NewsRecommends
所属分类:数据采集/爬虫
开发工具:Python
文件大小:149462KB
下载次数:0
上传日期:2021-05-22 01:34:35
上 传 者:
sh-1993
说明: Python网络爬虫与推荐算法新闻推荐平台:网络爬虫:通过Python实现新浪新闻的爬取,可爬取新闻页面上的标题、文本、图片、视频链接(保留排版) 推荐算法:权重衰减+标签推荐+区域推荐+热点推荐
(Python web crawler and recommendation algorithm News recommendation platform)
文件列表:
FinalProject (0, 2021-05-22)
FinalProject\.idea (0, 2021-05-22)
FinalProject\.idea\FinalProject.iml (583, 2021-05-22)
FinalProject\.idea\dataSources.xml (527, 2021-05-22)
FinalProject\.idea\encodings.xml (868, 2021-05-22)
FinalProject\.idea\inspectionProfiles (0, 2021-05-22)
FinalProject\.idea\inspectionProfiles\profiles_settings.xml (174, 2021-05-22)
FinalProject\.idea\misc.xml (303, 2021-05-22)
FinalProject\.idea\modules.xml (276, 2021-05-22)
FinalProject\Demo (0, 2021-05-22)
FinalProject\Demo\DetailSpiderTest.py (1912, 2021-05-22)
FinalProject\Demo\GetNewsList.py (999, 2021-05-22)
FinalProject\Demo\GetUserList.py (912, 2021-05-22)
FinalProject\Demo\__init__.py (0, 2021-05-22)
FinalProject\news.sql (14950102, 2021-05-22)
FinalProject\newsapi (0, 2021-05-22)
FinalProject\newsapi\Recommend (0, 2021-05-22)
FinalProject\newsapi\Recommend\Controller (0, 2021-05-22)
FinalProject\newsapi\Recommend\Controller\RecommendController.py (2698, 2021-05-22)
FinalProject\newsapi\Recommend\Controller\__init__.py (0, 2021-05-22)
FinalProject\newsapi\Recommend\Controller\__pycache__ (0, 2021-05-22)
FinalProject\newsapi\Recommend\Controller\__pycache__\RecommendController.cpython-39.pyc (2472, 2021-05-22)
FinalProject\newsapi\Recommend\Controller\__pycache__\__init__.cpython-39.pyc (147, 2021-05-22)
FinalProject\newsapi\Recommend\HotWordLibrary.py (4195, 2021-05-22)
FinalProject\newsapi\Recommend\NewsCorrelationCalculation.py (4430, 2021-05-22)
FinalProject\newsapi\Recommend\NewsHotValueCal.py (3568, 2021-05-22)
FinalProject\newsapi\Recommend\NewsKeyWordsSelect.py (6638, 2021-05-22)
FinalProject\newsapi\Recommend\NewsRecommendByCity.py (5649, 2021-05-22)
FinalProject\newsapi\Recommend\NewsRecommendByHotValue.py (3061, 2021-05-22)
FinalProject\newsapi\Recommend\NewsRecommendByTags.py (4644, 2021-05-22)
FinalProject\newsapi\Recommend\TextTool.py (1414, 2021-05-22)
FinalProject\newsapi\Recommend\__init__.py (0, 2021-05-22)
FinalProject\newsapi\Recommend\__pycache__ (0, 2021-05-22)
FinalProject\newsapi\Recommend\__pycache__\HotWordLibrary.cpython-39.pyc (3860, 2021-05-22)
FinalProject\newsapi\Recommend\__pycache__\NewsCorrelationCalculation.cpython-39.pyc (3848, 2021-05-22)
FinalProject\newsapi\Recommend\__pycache__\NewsHotValueCal.cpython-39.pyc (3498, 2021-05-22)
FinalProject\newsapi\Recommend\__pycache__\NewsKeyWordsSelect.cpython-39.pyc (5392, 2021-05-22)
FinalProject\newsapi\Recommend\__pycache__\NewsRecommendByCity.cpython-39.pyc (5299, 2021-05-22)
... ...
# Python网络爬虫与推荐算法的新闻推荐平台
#### 介绍
网络爬虫:通过Python实现新浪新闻的爬取,可爬取新闻页面上的标题、文本、图片、视频链接(保留排版)
推荐算法:权重衰减+标签推荐+区域推荐+热点推荐
- 权重衰减进行用户兴趣标签权重的衰减,避免内容推荐的过度重复
- 标签推荐进行用户标签与新闻标签的匹配,按照匹配比例进行新闻的推荐
- 区域推荐进行IP区域确定,匹配区域性文章进行推荐
- 热点推荐进行新闻热点的计算的依据是新闻阅读量、新闻评论量、新闻发布时间
涉及框架:Django、jieba、selenium、BeautifulSoup、vue.js
#### 软件功能结构/页面展示
![输入图片说明](https://images.gitee.com/uploads/images/2021/0521/115103_525fc802_5294263.png "功能结构图.png")
用户端
![![输入图片说明](https://images.gitee.com/uploads/images/2021/0522/093008_a4c54509_5294263.png "3.png")](https://images.gitee.com/uploads/images/2021/0522/092955_1dc4513b_5294263.png "2.png")
![输入图片说明](https://images.gitee.com/uploads/images/2021/0522/093027_24d2e7c3_5294263.png "5.png")
![输入图片说明](https://images.gitee.com/uploads/images/2021/0522/093042_c6e24eb2_5294263.png "7.png")
![输入图片说明](https://images.gitee.com/uploads/images/2021/0522/093054_fdab818a_5294263.png "Snipaste_2021-05-16_15-06-00.png")
![输入图片说明](https://images.gitee.com/uploads/images/2021/0522/093138_c168ffdb_5294263.png "Snipaste_2021-05-16_15-06-58.png")
管理端
![输入图片说明](https://images.gitee.com/uploads/images/2021/0522/093157_d790df42_5294263.png "Snipaste_2021-05-16_15-07-21.png")
![输入图片说明](https://images.gitee.com/uploads/images/2021/0522/093233_2d55078f_5294263.png "Snipaste_2021-05-16_15-07-35.png")
![输入图片说明](https://images.gitee.com/uploads/images/2021/0522/093242_17a7d49a_5294263.png "Snipaste_2021-05-16_15-07-47.png")
#### 安装教程
1. 安装Python依赖
```
pip install -r requirements.txt
#(requirements.txt文件已经包含在源码根目录下)
```
2. 安装Vue.js依赖
```
npm install
```
前端页面里用户端和管理端是分开的两个项目,所以需要再两个项目下都进行依赖安装!
3. 数据库创建/数据导入
SQL文件已经放在了Django项目根目录下,自行Navicat或其他方式导入即可
4. 数据库配置
```
DATABASES = {
'default': {
'ENGINE': 'django.db.backends.mysql',
'NAME': 'news',
'USER': 'root',
'PASSWORD': 'root',
'HOST': '127.0.0.1',
'PORT': '3306',
}
}
```
#### 使用说明
1. Django项目启动
```
# 进入newsapi的目录
python manage.py runserver 0.0.0.0:8000
```
2. Vue项目启动
```
//用户端
npm run dev
//管理端
npm run serve
```
近期下载者:
相关文件:
收藏者: