Journal | [J] 计算机系统网络和电信 Volume 1, Issue 4. 2019.
基于Spark的聚类算法的优化
作者 : 晨曦 李, 正德 鲍
摘要 / Abstract
对于聚类算法在整个过程的最初数据选择的随机性问题,在非均匀采样的基础上对聚类算法进行优化与此同时,出于要进行优化聚类算法这问题,Spark为基础让算法有所改观并进行优化数据集采样阶段,聚类阶段以及算法的并行优化,这最主要的三个阶段极大的实现了聚类算法的优化,在存在大量数据时,都会有定的精准性同时,Spark的基础之上,实行聚类算法速度更快,扩展性更好,此说明聚类算法的优化可以处理更高要求的数据
关键词 / Keywords
聚类算法 Spark 优化 大数据
《中国学术期刊(光盘版)》电子杂志社有限公司 KDN平台基础技术由KBASE 11.0提供