Journal | [J] 计算机系统网络和电信 Volume 4, Issue 5. 2022.
使用监督学习识别虚假评论的数据分析
作者 : 阿尔 萨德, 泰亚 兹·
摘要 / Abstract
虚假评论,也称为欺骗性意见,用于误导人们,最近变得越来越普遍。 这是由于在线营销交易的快速增长, 例如销售和采购。 电子商务为客户提供了一种设施,可以在购买时发布有关产品或服务的评论和评论。 新客户通常 会在做出购买决定之前浏览网站上发布的评论或评论。 然而,当前的挑战是新人如何区分真实评论和虚假评论,从 而欺骗客户、造成损失并损害公司声誉。 本文尝试开发一种智能系统,该系统可以使用评论文本的 n-gram 和评论 者给出的情感分数来检测电子商务平台上的虚假评论。 本研究采用的拟议方法使用标准的酒店评论数据集进行实验 和数据预处理方法,并使用词频 - 逆文档频率 (TF-IDF) 方法提取特征。 对于检测和分类,本文将评论文本的 n-gram 输入到构建的模型中,以分类为虚假或真实。 然而,实验是使用四种不同的监督机器学习技术进行的,并在从 Trip Advisor 网站收集的数据集上进行了训练和测试。这些实验的分类结果表明,朴素贝叶斯 (NB)、支持向量机 (SVM)、 自适应增强 (AB) 和随机森林 (RF) 分别获得了 88%、93%、94% 和 95% 的基于 关于测试准确性和 tje F1 分数。 作者 将获得的结果与使用相同数据集的现有工作进行比较,所提出的方法在准确性方面优于可比较的方法。
关键词 / Keywords
电子商务;虚假评论检测; 方法; 机器学习; 酒店点评
《中国学术期刊(光盘版)》电子杂志社有限公司 KDN平台基础技术由KBASE 11.0提供