hotnews

所属分类:大数据
开发工具:Java
文件大小:0KB
下载次数:0
上传日期:2022-12-16 09:49:32
上 传 者sh-1993
说明:  热点新闻日志实时分析,
(hotnews-log-real-time-analysis,)

文件列表:
pom.xml (9626, 2020-01-06)
src/ (0, 2020-01-06)
src/main/ (0, 2020-01-06)
src/main/java/ (0, 2020-01-06)
src/main/java/pojo/ (0, 2020-01-06)
src/main/java/pojo/bo/ (0, 2020-01-06)
src/main/java/pojo/bo/WebLogBO.java (682, 2020-01-06)
src/main/java/service/ (0, 2020-01-06)
src/main/java/service/WebLogServiceImpl.java (732, 2020-01-06)
src/main/java/service/WebSocket.java (1957, 2020-01-06)

# hotnews-log-real-time-analysis ### 项目描述 本项目是一个完整的大数据项目实战,实时|离线统计分析用户的搜索话题,并用JavaEE工程前端界面展示出来。这些指标对网站的精准营销、运营都有极大帮助。架构大致是按照企业标准来的,从日志的采集、转化处理、实时计算、JAVA后台开发、WEB前端展示,一条完整流程线下来,甚至每个节点都用的高可用架构,都考虑了故障转移和容错性。 ### 项目技术栈 Flume + KafKa + Hbase + Hive + Spark(SQL、Structured Streaming) Mysql + SpringMVC + Mybatis + Websocket + AugularJs + Echarts JAVA + Scala + Shell ### 项目技术架构 ![1](https://github.com/Ylisen/hotnews/blob/master/1) ### 项目环境 Linux、 win、 idea ### 项目基本流程 #### 一、数据处理 利用SAXReader获取xml文件内容,清洗内容并构建News实体类以便写入txt文件,然后编写ReadWebLog类并编写脚本运行在Liunx上模拟新闻搜索日志产生 ~~~ Liunx运行jar命令:java -jar readNews.jar args0 args1 ~~~ #### 二、Flume与HBase、Kafka数据对接 * Flume采集源数据与Kafka集成 --> Kafka与Spark Streaming对接 --> Spark+MySQL完成实时计算分析 --> 前台Echart展示 * Flume采集源数据与HBase集成 --> HBase与Hive对接 --> Hadoop MapReduce 完成离线计算分析 --> 前台Echart展示 #### 三、Flume + Kafka + Spark Streaming + MySQL实时计算分析 实时:话题浏览量 1、数据库连接池编写 2、spark streaming 程序读取kafka数据 3、spark streamign 实时计算处理后的数据写入MySQL 实时分析思路: 从Kafka读取数据后 --> 新闻数据 --> 将value映射为Map[String,String] --> 分割、根据key分组、聚合 --> 根据key值写sql --> 保存于MySQL #### 四、Flume + HBase + Hive 离线计算分析 离线:日访问量、话题数 1、Kafka与HBase对接 2、HBase与Hive对接 处理思路:在Hive创建外部表weblogs连接HBase对应表weblogs 离线分析思路: 数据高速存入HBase --> 通过外部表同步至Hive --> 书写sql完成数据离线统计 --> 选择时间间隔存入MySQL --> 前台展示 #### 五、前端展示(SSM+Echarts) 1、SSM工程搭建 2、采用WebSocket全双工通信方式使前端与后端实时交互 #### 六、效果图 ![png](https://github.com/Ylisen/hotnews/blob/master//png) #### 七、Links * Flume与Hbase整合经验 [https://cloud.tencent.com/developer/article/1025430](https://github.com/Ylisen/hotnews/blob/master/https://cloud.tencent.com/developer/article/1025430)

近期下载者

相关文件


收藏者