ataset-of-financial-news-sentiment-classification
所属分类:金融证券系统
开发工具:Others
文件大小:0KB
下载次数:0
上传日期:2019-05-15 11:15:56
上 传 者:
sh-1993
说明: 财经新闻情感分类数据集,
(Financial news sentiment classification dataset,)
文件列表:
news_seed.xlsx (416152, 2019-05-15)
test_data.csv (1270217, 2019-05-15)
train_data.csv (6905394, 2019-05-15)
# 财经新闻情感分类数据集
### 数据说明
本数据集主要用于训练财经新闻情感分类的深度学习模型。
数据来源于雪球网上万得资讯发布的正负面新闻标题,通过爬虫采集到7046条新闻标题作为种子数据集,其中正面新闻5147条,负面新闻1899条。
由于数据量太少,所以需要对数据进行扩充,扩充的策略是通过搜索引擎搜索和筛选,得到最终的数据集。
数据集中包含17149条新闻数据,包括`日期`、`公司`、`代码`、`正/负面`、`标题`、`正文`6个字段,其中正面新闻12514条,负面新闻4635条。
![数据样例](https://cdn.weiweiblog.cn/20190515190731.png)
### 文件说明
- news_seed.xlsx: 种子数据集
- train_data.csv: 可用于训练的数据集
- test_data.csv: 可用于测试的数据集
近期下载者:
相关文件:
收藏者: