Journal | [J] 计算机系统网络和电信 Volume 2, Issue 3. 2020.
基于大数据的哔哩哔哩网站统计分析研究
作者 : 凃 文豪, 张 桂花
摘要 / Abstract
随着智能时代的到来,视频网站哔哩哔哩应运而生,越来越多的用户加入,哔哩哔哩每天产生的数据是成倍增长的。哔哩哔哩用户对自己的排名等,需要个性化了解。本文利用大数据生态系统中的Hadoop-Spark-Flume-Kafka构成分析处理框架,并采用python对网站数据进行爬取,最终构建springmvc+ECharts解决方案将数据在网页上进行可视化展示。最终获取用户喜好等相关重要分析结果,通过前端可视化展示,可以让用户可直观地了解自己在哔哩哔哩网站的排名等重要信息,用户体验良好。
关键词 / Keywords
Spark;Hadoop;FlumeKafka;哔哩哔哩
《中国学术期刊(光盘版)》电子杂志社有限公司 KDN平台基础技术由KBASE 11.0提供