留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

基于多维度文本特征的电商平台评论有用性研究

孙士伟,王川,贾琳

downloadPDF
孙士伟, 王川, 贾琳. 基于多维度文本特征的电商平台评论有用性研究[J]. bob手机在线登陆学报(社会科学版), 2023, 25(2): 176-188. doi: 10.15918/j.jbitss1009-3370.2023.3376
引用本文: 孙士伟, 王川, 贾琳. 基于多维度文本特征的电商平台评论有用性研究[J]. bob手机在线登陆学报(社会科学版), 2023, 25(2): 176-188.doi:10.15918/j.jbitss1009-3370.2023.3376
SUN Shiwei, WANG Chuan, JIA Lin. Research on Help Fulness of E-commerce Platform Reviews Based on Multi-dimensional Text Features[J]. Journal of Beijing Institute of Technology (Social Sciences Edition), 2023, 25(2): 176-188. doi: 10.15918/j.jbitss1009-3370.2023.3376
Citation: SUN Shiwei, WANG Chuan, JIA Lin. Research on Help Fulness of E-commerce Platform Reviews Based on Multi-dimensional Text Features[J].Journal of Beijing Institute of Technology (Social Sciences Edition), 2023, 25(2): 176-188.doi:10.15918/j.jbitss1009-3370.2023.3376

基于多维度文本特征的电商平台评论有用性研究

doi:10.15918/j.jbitss1009-3370.2023.3376
基金项目:国家自然科学基金项目(72110107003,72061127001);国家自然科学基金面上项目(72172013);国家自然科学基金青年项目(71602009)
详细信息
    作者简介:

    孙士伟(1987—),男,博士,助理教授(副研究员),E-mail:shiweisun@bit.edu.cn

    王川(1998—),男,硕士研究生,E-mail:wangchuan_98@163.com

    贾琳(1987—),男,博士,副教授,E-mail:jialin87@bit.edu.cn

  • 数据清洗主要剔除了存在属性值缺失的在线评论。
  • 中图分类号:G0209

Research on Help Fulness of E-commerce Platform Reviews Based on Multi-dimensional Text Features

  • 摘要:伴随电子商务的发展,基于Web 2.0的在线评论体系不断完善,但海量评论降低了有效信息的获取效率,引发信息过载问题。如何迅速识别对消费者有用的评论、缓解信息过载问题,引起了业内与学界的广泛关注。利用大众点评网近5万条餐厅在线评论数据,综合考虑评论的多维度文本特征与情感表达倾向,采用Tobit、负二项回归方法对评论有用性影响因素开展实证研究。在此基础上,提出餐厅在线评论有用性分类阈值并使用支持向量机算法检验阈值的分类性能。研究结果表明:在线评论内容的菜品品质维度属性数量与平均长度、商家服务维度属性数量与平均长度以及正向情感倾向均显著正向影响在线评论有用性,且阈值为2的模型分类性能最佳。因此,电子商务网站可以进一步优化在线评论体系,提高消费者信息获取效率,促进在线评论生态持续向好发展。
    注释:
    1) 数据清洗主要剔除了存在属性值缺失的在线评论。
  • 图 1信息采纳模型(IAM)

    图 2在线评论有用性影响因素的研究模型

    图 3大众点评网的餐厅在线评论数据展现形式

    图 4因变量数值分布

    图 5不同阈值的分类性能

    图 6预测模型的性能表现

    表 1关注评论内容特征的相关文献梳理总结

    作者 关注的评论内容特征 评论对象 主要结论
    郝媛媛等[4] 评论长度、评论平均长度、平均正向情感倾向 电影 评论长度、评论平均长度、评论平均正向情感倾向对电影在线评论有用性的正向影响
    Kuan等[27] 评论长度 图书和DVD 体验型产品的评论长度正向影响在线评论有用性
    Zhang和Lin[31] 评论长度、情感得分 餐厅 评论长度与评论有用性之间呈“倒U型”关系,情感得分与有用性水平呈负向关系
    Xiang等[32] 5个LDA提取主题(基本服务、价值、地标景点、餐饮体验、核心产品) 酒店 价值、地标景点的相关描述与评论有用性之间存在正向关系,但基本服务、餐饮体验、核心产品的相关描述与评论有用性之间存在负向关系
    王月辉等[33] 内容质量、系统质量、交易质量、结果质量 社交电商商品 内容质量从信息质量和呈现质量两个方面影响B2C社交电商平台顾客在线购物体验质量
    Sun等[8] 产品、平台维度特征信息 搜索型商品、体验型商品 产品维、平台维的属性数与平均属性长度会对在线评论有用性产生影响
    Cao等[26] 评论情感 电脑软件 评论内容所传达的情感对评论有用性产生积极影响
    艾时钟和
    曾鑫[20]
    评论情感总量 搜索型商品、体验型商品 情感强度对有用性的积极影响,且这一影响对于搜索型产品更加有效
    Zhou等[9] 评论情感倾向 美容、食品杂货、手机、服装和视频 情感倾向对评论有用性影响不显著
    Yin等[34] 评论情感倾向 移动应用程序 当产品平均评分较高时,正面评论比负面评论对评论有用性产生了更高的积极效应
    下载: 导出CSV

    表 2基于Word2Vector对象的维度词表

    维度 属性 属性词 数量
    A菜品品质 A1 口味 口味,入味,味道,好吃,清爽,地道,正宗,清淡…… 22
    A2 口感 口感,软烂,香韧,紧实,弹滑,脱骨,绵柔,糯口,劲道,酥脆…… 24
    A3 观感 观感,颜色,摆盘,样貌,精致,造型,色泽…… 26
    A4 价格 价格,价钱,菜价,价位,性价比,贵,便宜,均价,人均,实惠…… 24
    A5 食材 食材,新鲜,选材,运送,即享,血色,调馅,开背,剪掉,剥壳…… 22
    A6 制作 烹饪,工艺,技法,烹制,严谨,烧制,现场,繁琐,工序,精良…… 24
    A7 营养 补品,均衡,富含,健康,滋养,保健食品,膳食,进补,润肠…… 25
    B商家服务 B1 服务 服务,热情,周到,态度,礼貌待客,领路,换盘,递水…… 31
    B2 环境 环境,装修,风格,外观设计,装饰,主色调,简约,现代感…… 30
    B3 座位 座椅,座位,扶手,靠垫,靠背,长椅,沙发,桌距,卡座,间隔…… 31
    B4 位置 位置,好找,电梯,卖场,直梯,上楼,扶梯,地铁,直达,层…… 32
    B5 排队 排队,等位,错开,排号,取号,翻台率,发号,坐满,等候…… 29
    B6 结账 结账,买单,能省,多结,转账,优惠,扫过去,支付,抵用券…… 30
    下载: 导出CSV

    表 3程度副词词典

    程度 个数 权重 词汇
    极其|extreme/最|most 69 4 百分之百,倍加,备至,不得了,不堪,不可开交,不亦乐乎,不折不扣……
    很|very 42 3 不过,不少,不胜,惨,沉,沉沉,出奇,大为……
    较|more 37 2 大不了,多,更,更加,更进一步,更为,还,还要……
    稍|-ish 29 1 点点滴滴,多多少少,怪,好生,还,或多或少,略,略加……
    欠|insufficiently 12 0.5 半点,不大,不丁点儿,不甚,不怎么,聊,没怎么,轻度……
    下载: 导出CSV

    表 4研究变量的描述性统计与多重共线性检验

    研究变量 样本量 平均值 标准差  最小值 最大值   VIF Tolerance
    *r_praise 47 186 2.340 016 4.267 794 0 32
    Dishes_attri_nums 47 186 2.445 577 2.442 683 0 43 1.44 0.694 3
    Dishes_attri_avglen 47 186 7.137 108 6.251 386 0 247 1.18 0.845 1
    Service_attri_nums 47 186 1.483 025 1.728 192 0 22 1.37 0.731 1
    Service_attri_avglen 47 186 5.770 987 6.685 196 0 191 1.37 0.729 3
    Sentiment_score 47 186 2.712 833 3.799 603 −29 54 1.35 0.740 5
    ID_anonymity 47 186 0.963 294 0.188 041 0 1 1.03 0.974 8
    Rank 47 186 4.925 931 1.648 863 0 8 1.86 0.538 5
    VIP_info 47 186 0.879 604 0.801 305 0 2 1.93 0.516 9
    Rate 47 186 4.289 270 0.968 376 0.5 5 1.11 0.897 6
    Recommendations 47 186 0.991 544 1.796 548 0 20 1.09 0.916 8
    Pictures 47 186 3.247 277 3.503 034 0 31 1.46 0.686 5
    ln_elapsed_days 47 186 5.366 836 0.947 305 0 8.280 711 1.16 0.864 3
    下载: 导出CSV

    表 5餐厅在线评论有用性的回归结果

    变量 Tobit回归 负二项回归
    *r_praise 模型1 模型2 模型3 模型4 模型5 模型6 模型7 模型8
    Dishes_attri_nums 0.054 8*** 0.044 7*** 0.009 0*** 0.006 2**
    Dishes_attri_avglen 0.015 3*** 0.009 2** 0.004 3*** 0.003 0***
    Service_attri_nums 0.163 0*** 0.161 0*** 0.036 2*** 0.036 4***
    Service_attri_avglen 0.0204 0*** 0.017 7*** 0.005 4*** 0.004 5***
    Sentiment_score 0.078 8*** 0.064 4*** 0.063 5*** 0.052 7*** 0.0176*** 0.015 0*** 0.014 1*** 0.012 4***
    ID_anonymity 2.688 0*** 2.676 0*** 2.704 0*** 2.695 0*** 0.988 0*** 0.986 0*** 0.993 0*** 0.991 0***
    Rank 1.105 0*** 1.099 0*** 1.104 0*** 1.100 0*** 0.321 0*** 0.320 0*** 0.321 0*** 0.321 0***
    VIP_info 0.281 0*** 0.269 0*** 0.260 0*** 0.252 0*** 0.076 8*** 0.074 5*** 0.072 0*** 0.070 6***
    Rate 0.258 0*** 0.264 0*** 0.303 0*** 0.307 0*** 0.093 5*** 0.095 3*** 0.106 0*** 0.107 0***
    Recommendations 0.176 0*** 0.169 0*** 0.169 0*** 0.164 0*** 0.041 0*** 0.039 6*** 0.039 3*** 0.038 4***
    Pictures 0.338 0*** 0.326 0*** 0.313 0*** 0.305 0*** 0.081 8*** 0.079 3*** 0.075 6*** 0.074 2***
    ln_elapsed_days −0.357 0*** −0.352 0*** −0.348 0*** −0.345 0*** −0.135 0*** −0.134 0*** −0.133 0*** −0.132 0***
    _cons −8.468 0*** −8.632 0*** −8.938 0*** −9.029 0*** −2.116 0*** −2.159 0*** −2.240 0*** −2.264 0***
    var(e.r_praise) 28.080 0*** 28.06 0*** 27.970 0*** 27.960 0***
    lnalpha 0.159 0*** 0.157 0*** 0.152 0*** 0.151 0***
    Pseudo R2 0.054 9 0.055 1 0.055 7 0.055 8 0.078 7 0.078 9 0.079 6 0.079 7
    AIC 200 793.2 200 759.9 200 626.4 200 610.8 172 090.2 172 059.3 171 915.2 171 903.4
    BIC 200 880.8 200 865.1 200 731.5 200 733.5 172 177.8 172 164.4 172 020.4 172 026.0
    N 47 186 47 186 47 186 47 186 47 186 47 186 47 186 47 186
      注:* 表示p<0.1; **表示p<0.05; ***表示p<0.01。
    下载: 导出CSV

    表 6核函数拟合结果

    核函数 Linear RBF Sigmoid
    准确率 0.729 241 88 0.704 933 81 0.583 874 85
    下载: 导出CSV

    表 7支持向量机参数调优结果

    参数  
    C 1 10 100 100 0
    Gamma 0.002 0.001 0.000 4 0.000 2
    AUC 0.799 916 08 0.806 182 04 0.808 1740 5 0.808 723 79
    Accuracy 0.726 353 79 0.731 648 62 0.734 055 35 0.737 424 79
      注:加粗数字表示支持向量机所采用的最优参数。
    下载: 导出CSV
  • [1] 商务部电子商务和信息化司. 中国电子商务报告2019[R]. 北京: 商务部电子商务和信息化司, 2020.
    [2] 赵曙光. 网络评论蓝皮书: 中国网络评论发展报告(2019)[R]. 北京: 南京大学, 2019.
    [3] MUDAMBI S M, SCHUFF D. Research note: what makes a helpful online review? a study of customer reviews on amazon. com[J]. MIS Quarterly, 2010, 34(1): 185-200.doi:10.2307/20721420
    [4] 郝媛媛, 叶强, 李一军. 基于影评数据的在线评论有用性影响因素研究[J]. 管理科学学报, 2010, 13(8): 78-88.
    [5] LIU Z, PARK S. What makes a useful online review? Implication for travel product websites[J]. Tourism Management, 2015, 47: 140-151.doi:10.1016/j.tourman.2014.09.020
    [6] MA Y, XIANG Z, DU Q, et al. Effects of user-provided photos on hotel review helpfulness: an analytical approach with deep leaning[J]. International Journal of Hospitality Management, 2018, 71: 120-131.doi:10.1016/j.ijhm.2017.12.008
    [7] SIERING M, MUNTERMANN J, RAJAGOPALAN B. Explaining and predicting online review helpfulness: the role of content and reviewer-related signals[J]. Decision Support Systems, 2018, 108: 1-12.doi:10.1016/j.dss.2018.01.004
    [8] SUN X, HAN M, FENG J. Helpfulness of online reviews: examining review informativeness and classification thresholds by search products and experience products[J/OL]. Decision Support Systems, 2019, 124: 113099.https://www.doc88.com/p-90129299555910.html.
    [9] ZHOU Y, YANG S, LI Y, et al. Does the review deserve more helpfulness when its title resembles the content? locating helpful reviews by text mining[J]. Information Processing & Management, 2020, 57(2): 102179.
    [10] LI X, WU C, MAI F. The effect of online reviews on product sales: a joint sentiment-topic analysis[J]. Information & Management, 2019, 56(2): 172-184.
    [11] SUN M. How does the variance of product ratings matter?[J]. Management Science, 2012, 58: 696-707.doi:10.1287/mnsc.1110.1458
    [12] ABDI A, SHAMSUDDIN S M, HASAN S, et al. Deep learning-based sentiment classification of evaluative text based on Multi-feature fusion[J]. Information Processing & Management, 2019, 56(4): 1245-1259.
    [13] 刘通, 张聪, 吴鸣远. 在线评论中基于边界平均信息熵的产品特征提取算法[J]. 系统工程理论与实践, 2016, 36(9): 2416-2423.doi:10.12011/1000-6788(2016)09-2416-08
    [14] HEYDARI A, TAVAKOLI M, SALIM N. Detection of fake opinions using time series[J]. Expert Systems with Applications, 2016, 58: 83-92.doi:10.1016/j.eswa.2016.03.020
    [15] 郝玫, 马建峰. 在线评论中基于动态窗口提取特征观点对的产品推荐模型[J]. 系统工程理论与实践, 2018, 38(9): 2363-2375.doi:10.12011/1000-6788(2018)09-2363-13
    [16] MORENTE-MOLINERA J, KOU G, SAMOUYLOV K, et al. Carrying out consensual group decision making processes under social networks using sentiment analysis over comparative expressions[J]. Knowledge-Based Systems, 2018, 165: 335-345.
    [17] LIU Y, JIANG C, ZHAO H. Using contextual features and multi-view ensemble learning in product defect identification from online discussion forums[J]. Decision Support Systems, 2018, 105: 1-12.doi:10.1016/j.dss.2017.10.009
    [18] 黄卫来, 潘晓波. 在线商品评价信息有用性模型研究: 纳入应用背景因素的信息采纳扩展模型[J]. 图书情报工作, 2014, 58(S1): 141-151.
    [19] ESLAMI S P, GHASEMAGHAEI M, HASSANEIN K. Which online reviews do consumers find most helpful? a multi-method investigation[J]. Decision Support Systems, 2018, 113: 32-42.doi:10.1016/j.dss.2018.06.012
    [20] 艾时钟, 曾鑫. 基于Ebay评论数据中的情感总量与信息熵对评论有用性的影响[J]. 软科学, 2019, 33(7): 129-132.doi:10.13956/j.ss.1001-8409.2019.07.21
    [21] SRIVASTAVA V, KALRO A D. Enhancing the helpfulness of online consumer reviews: the role of latent (content) factors[J]. Journal of Interactive Marketing, 2019, 48: 33-50.doi:10.1016/j.intmar.2018.12.003
    [22] GHOSE A, IPEIROTIS P G. Estimating the helpfulness and economic impact of product reviews: mining text and reviewer characteristics[J]. IEEE Transactions on Knowledge and Data Engineering, 2011, 23(10): 1498-1512.doi:10.1109/TKDE.2010.188
    [23] YANG S, ZHOU Y, YAO J, et al. Understanding online review helpfulness in omnichannel retailing[J]. Industrial Management & Data Systems, 2019, 119(8): 1565-1580.
    [24] CHATTERJEE S. Drivers of helpfulness of online hotel reviews: a sentiment and emotion mining approach[J/OL]. International Journal of Hospitality Management, 2020, 85: 102356. https://www.sciencedirect.com/science/article/abs/pii/S0278431919300052.
    [25] MITRA S, JENAMANI M. Helpfulness of online consumer reviews: a multi-perspective approach[J/OL]. Information Processing & Management, 2021, 58(3): 102538. https://www.sciencedirect.com/science/article/abs/pii/S0306457321000467.
    [26] CAO Q, DUAN W, GAN Q. Exploring determinants of voting for the "helpfulness" of online user reviews: a text mining approach[J]. Decision Support Systems, 2011, 50(2): 511-521.doi:10.1016/j.dss.2010.11.009
    [27] KUAN K K, HUI K, PRASARNPHANICH P, et al. What makes a review voted? an empirical investigation of review voting in online review systems[J]. Journal of the Association for Information Systems, 2015, 16(1): 47-71.
    [28] HONG H, XU D, WANG G A, et al. Understanding the determinants of online review helpfulness: a meta-analytic investigation[J]. Decision Support Systems, 2017, 102: 1-11.doi:10.1016/j.dss.2017.06.007
    [29] CHEUNG C M K, LEE M K O, RABJOHN N. The impact of electronic word-of-mouth[J]. Internet Research, 2008, 18(3): 229-247.doi:10.1108/10662240810883290
    [30] 袁海霞, 陈俊, 白琳. 电商平台商品标题优化的有效性及其杠杆机制[J]. bob手机在线登陆学报(社会科学版), 2019(2): 116-126.doi:10.15918/j.jbitss1009-3370.2019.1205
    [31] ZHANG Y, LIN Z. Predicting the helpfulness of online product reviews: a multilingual approach[J]. Electronic Commerce Research and Applications, 2018, 27: 1-10.doi:10.1016/j.elerap.2017.10.008
    [32] XIANG Z, DU Q, MA Y, et al. A comparative analysis of major online review platforms: implications for social media analytics in hospitality and tourism[J]. Tourism Management, 2017, 58: 51-65.doi:10.1016/j.tourman.2016.10.001
    [33] 王月辉, 刘爽, 唐胜男, 等. B2C社交电商平台顾客在线购物体验质量测量与实证研究[J]. bob手机在线登陆学报(社会科学版), 2021, 23(3): 71-85.doi:10.15918/j.jbitss1009-3370.2021.2772
    [34] YIN D, MITRA S, ZHANG H. Research note—when do consumers value positive vs. negative reviews? an empirical investigation of confirmation bias in online word of mouth[J]. Information Systems Research, 2016, 27(1): 131-144.doi:10.1287/isre.2015.0617
    [35] DAVIS J M, AGRAWAL D. Understanding the role of interpersonal identification in online review evaluation: an information processing perspective[J]. International Journal of Information Management, 2018, 38(1): 140-149.doi:10.1016/j.ijinfomgt.2017.08.001
    [36] LEE P, HU Y, LU K. Assessing the helpfulness of online hotel reviews: a classification-based approach[J]. Telematics and Informatics, 2018, 35(2): 436-445.doi:10.1016/j.tele.2018.01.001
    [37] TSAI C, CHEN K, HU Y, et al. Improving text summarization of online hotel reviews with review helpfulness and sentiment[J/OL]. Tourism Management, 2020, 80: 104122. https://www.sciencedirect.com/science/article/abs/pii/S0261517720300480.
    [38] FILIERI R, RAGUSEO E, VITARI C. When are extreme ratings more helpful? empirical evidence on the moderating effects of review characteristics and product type[J]. Computers in Human Behavior, 2018, 88: 134-142.doi:10.1016/j.chb.2018.05.042
    [39] SUSSMAN S W, SIEGAL W S. Informational influence in organizations: an integrated approach to knowledge adoption[J]. Information Systems Research, 2003, 14(1): 47-65.doi:10.1287/isre.14.1.47.14767
    [40] 汪旭晖, 聂可昱, 陈荣. “解释行为”还是“解释反应”? 怎样的在线评论更有用: 基于解释类型的在线评论对消费者购买决策的影响及边界条件[J]. 南开管理评论, 2017, 20(4): 27-37.
    [41] 李嘉, 张朋柱, 刘璇. 更丰富的媒介效果一定更好吗?网络口碑对购物决策的影响研究[J]. 信息系统学报, 2014(1): 31-46.
    [42] SALEHAN M, KIM D J. Predicting the performance of online consumer reviews: a sentiment mining approach to big data analytics[J]. Decision Support Systems, 2016, 81: 30-40.doi:10.1016/j.dss.2015.10.006
    [43] RYU K, LEE H R, GON KIM W. The influence of the quality of the physical environment, food, and service on restaurant image, customer perceived value, customer satisfaction, and behavioral intentions[J]. International Journal of Contemporary Hospitality Management, 2012, 24(2): 200-223.doi:10.1108/09596111211206141
    [44] 肖轶楠, 李江敏. 基于在线点评的高端度假酒店宾客感知服务质量研究: 以悦榕庄酒店为例[J]. 价值工程, 2016, 35(3): 192-193.
    [45] NAMKUNG Y, SOOCHEONG S J. Are highly satisfied restaurant customers really different? a quality perception perspective. [J]. International Journal of Contemporary Hospitality Management, 2008, 20(2): 142-155.doi:10.1108/09596110810852131
    [46] 严建援, 张丽, 张蕾. 电子商务中在线评论内容对评论有用性影响的实证研究[J]. 情报科学, 2012, 30(5): 713-716.doi:10.13833/j.cnki.is.2012.05.020
    [47] WANG X, TANG L R, KIM E. More than words: do emotional content and linguistic style matching matter on restaurant review helpfulness?[J]. International Journal of Hospitality Management, 2019, 77: 438-447.doi:10.1016/j.ijhm.2018.08.007
    [48] 苗蕊, 徐健. 评分不一致性对在线评论有用性的影响: 归因理论的视角[J]. 中国管理科学, 2018, 26(5): 178-186.
    [49] 苗蕊. 在线评论有用性研究综述[J]. 中国管理信息化, 2014, 17(18): 126-128.doi:10.3969/j.issn.1673-0194.2014.18.077
  • [1] Ao, 贾萍萍, 张增一.社交媒体中公众对于人脸识别的认知与态度—— 基于Twitter相关话题讨论文本的质性分析. bob手机在线登陆学报(社会科学版), 2022, (): -.
    [2] 梁土坤.多维度视角下社会组织的农村反贫困效应. bob手机在线登陆学报(社会科学版), 2021, 23(2): 69-80.doi:10.15918/j.jbitss1009-3370.2021.4047
    [3] 万艺.宪法对人的分类——基于中国17部宪法文本的分析. bob手机在线登陆学报(社会科学版), 2019, (1): 136-144.doi:10.15918/j.jbitss1009-3370.2019.2558
    [4] 于东山.跨界公共物品的分类治理模式. bob手机在线登陆学报(社会科学版), 2018, (2): 87-94.doi:10.15918/j.jbitss1009-3370.2018.1250
    [5] 初大智, 胡子云.多维邻近性对科研合作质量影响研究——以广东生物技术为例. bob手机在线登陆学报(社会科学版), 2016, (5): 67-74.doi:10.15918/j.jbitss1009-3370.2016.0509
    [6] 纪玉俊, 赵娜.产业集聚有利于提高能源效率吗?——基于产业集聚度与对外开放水平的门槛回归模型检验. bob手机在线登陆学报(社会科学版), 2016, (4): 19-27.doi:10.15918/j.jbitss1009-3370.2016.0403
    [7] 聂长建.法律的“无为”之“有用”. bob手机在线登陆学报(社会科学版), 2015, (4): 139-144.doi:10.15918/j.jbitss1009-3370.2015.0421
    [8] 邹艳芬.能源消费波动特征分析——基于门限分位点回归模型. bob手机在线登陆学报(社会科学版), 2014, (3): 38-42.
    [9] 尹为, 张成虎, 甘凯.基于数据流多维分析的可疑金融交易动态识别. bob手机在线登陆学报(社会科学版), 2013, (5): 52-59.
    [10] 唐葆君, 郑茜.中国电动汽车配套基础设施布局需求侧研究——基于Logit回归的消费偏好分析. bob手机在线登陆学报(社会科学版), 2013, (4): 14-20.
    [11] 唐葆君, 申程.欧洲二氧化碳期货市场有效性分析. bob手机在线登陆学报(社会科学版), 2012, (1): 15-19.
    [12] 周超.主权财富基金投资收益影响因素的回归分析. bob手机在线登陆学报(社会科学版), 2011, (5): 16-20.
    [13] 段明明.中国企业管理实践研究对策——回归原始经验的必要性. bob手机在线登陆学报(社会科学版), 2010, (5): 72-79.
    [14] 丁斌, 王鹏.基于聚类分析的应急物资储备分类方法研究. bob手机在线登陆学报(社会科学版), 2010, (4): 10-13.
    [15] 田捷, 刘蓉晖.基于TOP-100的研究生人格特质研究. bob手机在线登陆学报(社会科学版), 2010, (3): 141-144.
    [16] 孔海宁, 齐二石, 刘晓峰, 何曙光, 李钢.滨海新区K 区域动态发展规划的模型研究. bob手机在线登陆学报(社会科学版), 2008, (4): 12-14.
    [17] 孙树垒, 韩伯棠, 孙健全.企业与客户关系维度模型及契约关系分析. bob手机在线登陆学报(社会科学版), 2007, (3): 74-77.
    [18] 任智军, 朱东华, 谢菲.科技文本的可视化分析研究. bob手机在线登陆学报(社会科学版), 2007, (1): 12-17.
    [19] 赵士德, 田金信, 钱丽萍.基于边际分析的薪酬成本有效性研究. bob手机在线登陆学报(社会科学版), 2006, (2): 68-70.
    [20] 王金凤.一种基于特征聚合理论和LSI的文本分类新方法. bob手机在线登陆学报(社会科学版), 2004, (5): 92-94.
  • 加载中
图(6)/ 表 (7)
计量
  • 文章访问数:225
  • HTML全文浏览量:21
  • PDF下载量:13
  • 被引次数:0
出版历程
  • 收稿日期:2021-10-18
  • 录用日期:2022-05-13
  • 网络出版日期:2022-05-31
  • 刊出日期:2023-03-15

基于多维度文本特征的电商平台评论有用性研究

doi:10.15918/j.jbitss1009-3370.2023.3376
    基金项目:国家自然科学基金项目(72110107003,72061127001);国家自然科学基金面上项目(72172013);国家自然科学基金青年项目(71602009)
    作者简介:

    孙士伟(1987—),男,博士,助理教授(副研究员),E-mail:shiweisun@bit.edu.cn

    王川(1998—),男,硕士研究生,E-mail:wangchuan_98@163.com

    贾琳(1987—),男,博士,副教授,E-mail:jialin87@bit.edu.cn

  • 数据清洗主要剔除了存在属性值缺失的在线评论。
  • 中图分类号:G0209

摘要:伴随电子商务的发展,基于Web 2.0的在线评论体系不断完善,但海量评论降低了有效信息的获取效率,引发信息过载问题。如何迅速识别对消费者有用的评论、缓解信息过载问题,引起了业内与学界的广泛关注。利用大众点评网近5万条餐厅在线评论数据,综合考虑评论的多维度文本特征与情感表达倾向,采用Tobit、负二项回归方法对评论有用性影响因素开展实证研究。在此基础上,提出餐厅在线评论有用性分类阈值并使用支持向量机算法检验阈值的分类性能。研究结果表明:在线评论内容的菜品品质维度属性数量与平均长度、商家服务维度属性数量与平均长度以及正向情感倾向均显著正向影响在线评论有用性,且阈值为2的模型分类性能最佳。因此,电子商务网站可以进一步优化在线评论体系,提高消费者信息获取效率,促进在线评论生态持续向好发展。

注释:
1) 数据清洗主要剔除了存在属性值缺失的在线评论。

English Abstract

孙士伟, 王川, 贾琳. 基于多维度文本特征的电商平台评论有用性研究[J]. bob手机在线登陆学报(社会科学版), 2023, 25(2): 176-188. doi: 10.15918/j.jbitss1009-3370.2023.3376
引用本文: 孙士伟, 王川, 贾琳. 基于多维度文本特征的电商平台评论有用性研究[J]. bob手机在线登陆学报(社会科学版), 2023, 25(2): 176-188.doi:10.15918/j.jbitss1009-3370.2023.3376
SUN Shiwei, WANG Chuan, JIA Lin. Research on Help Fulness of E-commerce Platform Reviews Based on Multi-dimensional Text Features[J]. Journal of Beijing Institute of Technology (Social Sciences Edition), 2023, 25(2): 176-188. doi: 10.15918/j.jbitss1009-3370.2023.3376
Citation: SUN Shiwei, WANG Chuan, JIA Lin. Research on Help Fulness of E-commerce Platform Reviews Based on Multi-dimensional Text Features[J].Journal of Beijing Institute of Technology (Social Sciences Edition), 2023, 25(2): 176-188.doi:10.15918/j.jbitss1009-3370.2023.3376
  • 近年来,借助于互联网、在线支付、物流等环境利好,电子商务的发展日趋成熟。商务部电子商务和信息化司在《中国电子商务报告2019》中指出:全国电子商务交易额达34.81万亿,同比增长6.7%[1]。目前互联网形态仍处于以社交为代表的Web 2.0时代,核心在于用户生成内容(User Generated Content)。而在线评论作为用户生成内容的形式载体之一,逐渐被平台、商家和消费者所重视,其作用愈发凸显。2019年12月,由中央网信办网络评论工作局指导发布的《网络评论蓝皮书:中国网络评论发展报告(2019)》指出:92%的用户认为浏览在线评论是网络活动的重要部分,且半数以上用户表示目前使用体验有明显改善[2]

    为提升竞争力,各类电商平台先后构建起以买方为主导的评价生态体系,借助评论内容所提供的信息减少消费者对产品或服务认知的不确定性,进而促进消费。在商品类型方面,在线评论的发展并未局限于电脑、手机等实物商品,电影、餐饮等体验型商品的在线评论同样受到广泛关注。随着电子商务在线评论生态体系的发展完善,围绕在线评论主题的研究也逐渐形成两大方向:一部分学者从消费者行为学的角度出发,提取在线评论的内容特征,结合实证研究方法来探究在线评论有用性[3-9]、分析在线评论对商品销售的影响[10-11],以加强对用户生成内容的理解,从而指导企业决策;另有部分学者聚焦于提高在线评论体系的性能,结合文本挖掘方法与机器学习算法分别在评论信息提取[12-13]、问题评论识别[14]、评论推荐模型构建[15-16]、基于评论的产品缺陷识别[17]等方面开展研究,提升消费者的使用体验。虽然在线评论有用性影响因素的相关研究已较为丰富,但目前少有学者结合商品特征,进一步挖掘在线评论文本内容的实际含义,探究多维度文本特征信息对在线评论有用性的影响,因此本文聚焦评论文本内容开展评论有用性研究。

    • 为了更清晰地认识和描述在线评论的有用性,现有研究中给出了有用性的定义。Mudambi和Schuff[3]186对有帮助的评论定义为:由消费者产生的有利于其他消费者购买决策过程的产品评价。评论的有用性可以降低潜在消费者的搜索成本,为消费者决策过程提供价值。黄卫来和潘晓波[18]认为评论有用性是消费者购买决策过程中评论在目标商品价值评估上产生的影响力,这种影响力则意味着评论的有用性。Eslami等[19]则认为评论有用性被广泛用于衡量用户生成内容对消费者提高评估产品/服务质量能力的感知价值上。

      随着平台构建的评论体系功能趋于丰富与完整,在线评论有用性影响因素也逐渐引起学者们的重视。在探究在线评论有用性影响因素时,现有研究主要采用基于计量模型的实证研究方法[8-9][20-23],也有部分学者结合结构方程模型[19]、统计学习模型[24]与人工神经网络[25]以构建研究框架,开展在线评论有用性研究。在评论有用性衡量指标方面,目前尚未形成统一的度量方法,现有研究主要采用评论的点赞数量或点赞比例衡量评论有用性[3][23][26-27]。但Hong等[28]通过梳理已有文献统计了两种度量方法的使用频率,发现信息系统领域约1/3的相关文献以点赞数量度量评论有用性,而未采用点赞比例的原因与数据集限制有关。

      已有研究表明,用户生成评论内容包含的论据、理由等细节内容越多,评论提供的信息内容就越全面,消费者就会发现它们越有帮助[19][29],且文本评论可能有利于推动用户消费行为[30]。虽然文本处理技术的发展让学者们逐渐开始关注评论内容挖掘,但囿于计算复杂性、成本与时间限制,评论文本隐含的信息价值仍未被充分挖掘[21]。如表1所示,现有研究主要从三个角度对评论内容进行特征提取并探究这些特征对于有用性的影响。

      表 1关注评论内容特征的相关文献梳理总结

      作者 关注的评论内容特征 评论对象 主要结论
      郝媛媛等[4] 评论长度、评论平均长度、平均正向情感倾向 电影 评论长度、评论平均长度、评论平均正向情感倾向对电影在线评论有用性的正向影响
      Kuan等[27] 评论长度 图书和DVD 体验型产品的评论长度正向影响在线评论有用性
      Zhang和Lin[31] 评论长度、情感得分 餐厅 评论长度与评论有用性之间呈“倒U型”关系,情感得分与有用性水平呈负向关系
      Xiang等[32] 5个LDA提取主题(基本服务、价值、地标景点、餐饮体验、核心产品) 酒店 价值、地标景点的相关描述与评论有用性之间存在正向关系,但基本服务、餐饮体验、核心产品的相关描述与评论有用性之间存在负向关系
      王月辉等[33] 内容质量、系统质量、交易质量、结果质量 社交电商商品 内容质量从信息质量和呈现质量两个方面影响B2C社交电商平台顾客在线购物体验质量
      Sun等[8] 产品、平台维度特征信息 搜索型商品、体验型商品 产品维、平台维的属性数与平均属性长度会对在线评论有用性产生影响
      Cao等[26] 评论情感 电脑软件 评论内容所传达的情感对评论有用性产生积极影响
      艾时钟和
      曾鑫[20]
      评论情感总量 搜索型商品、体验型商品 情感强度对有用性的积极影响,且这一影响对于搜索型产品更加有效
      Zhou等[9] 评论情感倾向 美容、食品杂货、手机、服装和视频 情感倾向对评论有用性影响不显著
      Yin等[34] 评论情感倾向 移动应用程序 当产品平均评分较高时,正面评论比负面评论对评论有用性产生了更高的积极效应

      1. 评论长度。郝媛媛等[4]论证了评论长度、评论平均长度对电影在线评论有用性的正向影响,Kuan等[27]探究了体验型产品的评论长度对其有用性的影响,得到了一致的结论。Zhang和Lin[31]则进一步发现评论长度与评论有用性之间呈“倒U形”关系。

      2. 产品/服务特征。Liu和Park[5]认为评论内容包含的文本信息与嵌入特征可能有助于解释评论有用性。Xiang等[32]采用LDA模型对酒店和旅游业的多源在线评论数据进行主题识别,研究了不同平台的在线评论特征的差异性以及评论特征与有用性的关系。王月辉等[33]基于在线社交电商的评论数据,结合文本挖掘技术构建了顾客体验质量测量维度概念模型,关注了内容、系统、交易与结果四个关键环节的服务质量。Sun等[8]基于评论文本内容提取了产品、平台两个维度的特征信息研究维度属性信息对搜索型商品评论有用性的影响,研究表明产品维、平台维的属性数与平均属性长度会对在线评论有用性产生影响。

      3. 情感表达。由于评论内容承载了消费者的情感,情感强度和情感倾向性对有用性的影响也引起了研究人员的兴趣。Cao等[26]认为评论内容所传达的情感对评论有用性产生积极影响;有学者计算了情感总量(Sent)以反映评论情感强度的大小,证明了情感强度对有用性的积极影响,且这一影响对于搜索型产品更加有效[20]。然而在探究评论内容情感倾向性对在线评论有用性的影响方面,现有研究结论出现了分歧:Zhou等[9]发现情感倾向对评论有用性影响不显著,Zhang和Lin[31]采用Yelp.com的数据发现评论情感得分越高,有用性水平越低;而郝媛媛[4]在分析影评数据时发现评论平均正向情感倾向对有用性有正向影响,Yin等[34]也论证了当产品平均评分较高时,正面评论比负面评论对评论有用性产生了更高的积极效应。

      虽然上述研究可以加深对有用性影响因素的理解,但消费者仍然需要花费一定的认知成本来处理大量在线评论。总的来说,信息过载问题得以缓解,但对于有用评论的高效识别问题依然困扰着消费者[35]。为了解决这一难题,研究人员将有用性研究领域扩展到有用性识别、分类与预测等方向。Ghose和Ipeirotis[22]关注了评论主观性的影响,通过构建有用性评价模型实现了评论有用性预测,该研究结果有助于快速识别并优先展示有用评论。Ma等[6]利用深度学习模型探究了评论中发布的照片对评论有用性预测的影响,研究结果表明:将评论文本与用户提供的图片相结合可以大幅提高算法的性能。Lee等[36]对比了多种机器学习算法,使用110万条酒店评论建立了有用性预测模型,发现随机森林算法的分类性能优于其他三种模型。

      从研究场景来说,现有评论有用性研究更多地围绕实物商品[3]193[8]和以酒店、旅游业产品为代表的体验型商品[37-38]来开展,却较少地关注餐厅背景下的评论有用性研究。与此同时,虽然在线评论的有用性研究已经拓展到不同的应用场景,但有用性因素的影响方式与效果尚未在结论中得到统一[28]。此外,在以餐厅为背景的在线评论有用性研究中,几乎没有文献同时关注评论内容中的文本维度属性信息与情感倾向性,并区分菜品品质维度特征与商家服务维度特征分别对评论有用性产生的影响。

    • 综上所述,现有研究结果认为在线评论对体验型商品的帮助更明显[8],餐厅消费则是具有明显体验特征的线下服务,但已有研究却较少关注餐厅背景下中文评论文本信息特征与评论有用性之间的关系。因此,本文聚焦于餐厅在线评论有用性研究,首先开发中文餐厅背景下的二级维度属性特征量表,从多个维度提取评论内容特征,并基于情感词典计算评论情感特征,进而构建在线评论有用性影响因素的研究模型;再根据餐厅在线评论的文本属性特征提出有用性分类阈值,使用支持向量机算法评估有用性阈值的分类性能。

      本研究有助于加深对在线评论产品/服务特征与情感表达的理解,并有利于电子商务平台推出基于评论文本维度特征信息的评论摘要功能,一定程度上缓解信息过载问题,促进消费点评市场的健康发展。研究提出的有用性分类阈值可以大幅提高消费者阅读在线评论、获取产品/服务详情的信息获取效率,帮助餐厅结合评价反馈有针对性地给提升服务质量,并为电子商务平台构建有用性排序模型提供参考。

      本研究创新之处为:(1)聚焦于餐厅在线评论的多维度本文属性特征,开发了菜品品质与商家服务两个核心维度的二级量表(包含维度属性与属性词汇),并同时考虑评论情感倾向特征开展评论有用性影响因素研究,填补了餐厅背景下评论有用性研究空白;(2)结合餐厅在线评论内容两个维度的属性特征信息,提出评论有用性分类阈值,可以直接帮助消费者提升浏览餐厅在线评论时的评论有用性识别效率。

    • Sussman和Siegal[39]在研究中提出了信息采纳模型(Information Adoption Model, IAM),如图1所示。指出信息有用性是信息发送与信息采纳之间的桥梁,并从两个角度来衡量信息有用性:信息质量和信息源可靠性,两者直接影响信息有用性。借鉴精细加工可能性模型(Elaboration Likelihood Model, ELM)的思想,信息质量作为中心路径影响信息有用性,而信息源可信度则作为外围路径影响信息有用性。在本文的研究场景中,在线评论的多维度特征衡量了评论内容的信息质量,而评论者的专业性与可靠性评估了评论内容信息来源的可信度,即当评论阅读者具有高水平阅读能力与了解商品信息质量的动机时,倾向于仔细阅读评论内容判断评论有用性,反之可能更关注评论者的在线声誉。

      图 1信息采纳模型(IAM)

      结合信息采纳模型,本文基于餐厅在线评论的中文文本内容提出了菜品品质维度属性特征、商家服务维度属性特征与情感倾向得分三个方面的研究假设,以研究在线评论有用性。本文构建了餐厅在线评论有用性影响因素的研究模型,如图2所示。本文所构建的研究模型主要细化探究了“信息质量”对信息有用性的影响:提取在线评论中菜品品质维度、商家服务维度以及情感表达维度特征作为在线评论信息质量的代表来探究对餐厅在线评论有用性的影响。此外,本文将除在线评论文本内容以外的显式数值变量(如:评论者等级、评论评分、评论日期等)作为探究在线评论有用性的控制变量。其中,本文依据评论者的专业性和可靠性对“信息源可信度”进行测量。基于上述研究模型设定,将进一步开展本文研究。

      图 2在线评论有用性影响因素的研究模型

    • 本文聚焦于餐厅背景下在线消费点评的评论有用性研究,评论内容主要包含了对餐厅菜品品质、商家服务两个核心维度的多属性信息描述。研究将餐厅在线评论文本内容按产品/服务介绍与情感表达两个方面进行有效信息提取:(1)基于餐厅背景开发的维度属性词典提取评论文本内容中与产品/服务介绍相关的有效特征信息;(2)基于情感词典提取评论文本内容中的情感表达特征信息。研究根据上述两个方面的评论内容特征信息提取结果计算相关变量,进而分析这些变量对餐厅在线评论有用性的影响。

      1. 基于维度属性词典提取评论文本内容的产品/服务介绍特征信息

      菜品品质是消费者采取餐饮消费决策的主要原因之一,但中餐菜品制作方法与成品自由度较高,难以用固定属性衡量餐品的质量。与本研究关注的体验型产品不同,搜索型产品通常具有确定的属性特征对其质量进行评估[40],如处理器、摄像头等硬件属性特征可以评价手机性能,但菜品品质的属性特征信息只能从评论内容中获取[41]。因此,本研究从菜品品质的通用属性,如口味、观感、价格等属性提取菜品质量特征信息。由于更多的菜品品质维度的介绍与描述可以减少消费者就餐过程中对菜品质量的不确定性[19],从而辅助判断菜品质量,消费者趋向于认可含有更多菜品维属性的在线评论。此外,菜品作为一种体验型产品,在消费前难以被用户感知,对菜品的评判需要借助外在的视觉、味觉等从而形成整体感受,对菜品品质属性的详细描述会对在线评论的有用性产生影响。有研究表明,评论中包含更长句子、更多字数的评论可以获得更多的有用性投票[4][22][42]。当评论者使用更多的篇幅来描述菜品的口味、观感、食材、价格等特征信息时,消费者会对菜品质量、好吃程度这些问题形成更加直观、具体的感受,产生对菜品的深入理解,进而更有可能对在线评论点赞,认可在线评论的价值。综上,本文提出如下假设。

      H1a.评论文本中描述菜品品质的属性数量会积极影响餐厅在线评论有用性;

      H1b.评论文本中描述菜品品质的属性平均长度会积极影响餐厅在线评论有用性。

      用户除了考虑在线评论内容中传递的菜品品质维度信息,商家提供的环境与服务也是影响消费者评价的关键因素[43]。有学者对酒店在线评论进行了语义分析,将消费者感知服务质量分为了前台服务、客房服务与餐饮服务三个方面[44]。在餐饮方面,商家提供的服务是多方位的:合理安排餐前等位、提供安静整洁的室内环境、设置合适的座位间隔与高度等,这些属性特征都是消费者在就餐过程中所关注的[45]。因此,用户在评论内容中对商家服务维度不同属性特征的描述会让消费者进一步了解其所关注的商家服务质量,使得消费者形成更加立体、全面的主观判断,进而减少消费过程中的不确定性[19]8。此外,商家维属性的描述可以提供更多对消费者决策有利的信息,但是由于评价标准不同,简单的好与坏评价被认为是用处不大的。在评论内容中,评论者需要具体地对商家维属性进行描述,像对服务态度、环境舒适度等进行详细描述来为消费者提供参考的价值。按照上述方法描述这些维度属性特征时,有关商家服务的信息会被更全面地披露,当在线评论内容传递了越多的商家服务信息时,消费者就会加深对商家服务质量的理解[46],缓解了消费者对无形服务的不确定性。综上,本文提出如下假设。

      H2a.评论文本中描述商家服务的属性数量会积极影响餐厅在线评论有用性;

      H2b.评论文本中描述商家服务的属性平均长度会积极影响餐厅在线评论有用性。

      2. 基于情感词典提取评论文本内容的情感表达特征信息

      随着自然语言处理的进步与发展,学者们逐渐采用情感分析技术来计算评论内容的情感得分。如Wang等[47]基于餐厅在线评论的文本内容,利用词汇情感联想词典“Emolex”提取了八个情绪维度的信息,并研究不同情绪得分对于评论有用性的影响,结果发现愤怒、厌恶和恐惧等负面情绪会积极影响评论的有用性。Eslami等[19]利用结构方程模型分析了正向、中立与负向情感对有用性的影响,并建议消费者在浏览评论时更加关注负面或中立的在线评论,与先前研究证明的负面评价更具有用性的结论相一致[28]。综上,本研究认为评论内容的正向情感倾向会消极影响餐厅在线评论有用性,即在线评论内容所传递的情感越积极,餐厅在线评论有用性水平越低。因此本文提出如下假设。

      H3.正向情感倾向会消极影响餐厅在线评论有用性。

    • 本研究聚焦于餐厅背景下的在线评论,综合考虑平台的流行语言、数据全面性以及用户基数等因素后,选择大众点评网(dianping.com)的餐厅在线评论作为研究数据集。大众点评网提供了海量、多维度的数据:商家评论页面涵盖了总评分、总评论数、地址等商家信息;评论文本、图片、推荐菜等评论内容信息;评论者的ID、等级、VIP身份等评论者信息。在数据样本选择上,本研究仅采集大众点评美食分区的部分商家。

      为保证研究结论的普适性,本研究在数据样本选择方面考虑了两方面内容:(1)中国地域发展存在差异性,发展迅速的大城市包含了更全面的餐饮类型与更多数量的店铺,因此本文选择了位于北京市的餐厅进行在线评论采集,并在每个类目下按行政区选择不同的餐厅,避免重复。(2)结合菜系类型的差异与中文餐饮词库的特征,本文遵循了以八大菜系为核心,地方菜系为补充的原则对餐厅评论数据进行采集。图3展示了数据采集过程中所关注的变量,数据获取工作在2020年3月22—28日完成,数据集涵盖了16个菜系类型(川菜、粤菜、北京菜等)、188个商家的49 921条在线评论,清洗后得到有效评论48 414条

      图 3大众点评网的餐厅在线评论数据展现形式

    • 本文结合自然语言处理(NLP)技术对评论文本进行处理,按照“去除符号→去停用词→分词→训练语料库→提取维度词→生成维度词表→提取维度属性→统计维度变量”的步骤提取了研究变量。具体来说,首先利用分词工具、分词词库(含菜品名称词汇等信息)以及停用词库(含2 750个停用词)对评论文本内容进行初步处理;其次借助自然语言处理库Gensim,基于评论文本内容建模Word2Vector对象(建模使用了Skip-Gram算法,设定词向量维数为300、窗口大小为10、最小词频数为2);再根据Word2Vector对象提取菜品品质、商家服务2个维度、13类属性的特征词,维度词表的提取结果如表2所示;最后结合维度词表分别计算了菜品品质维度和商家服务维度的属性描述数量(Attri_nums)与属性描述平均长度(Attri_avglen)。

      表 2基于Word2Vector对象的维度词表

      维度 属性 属性词 数量
      A菜品品质 A1 口味 口味,入味,味道,好吃,清爽,地道,正宗,清淡…… 22
      A2 口感 口感,软烂,香韧,紧实,弹滑,脱骨,绵柔,糯口,劲道,酥脆…… 24
      A3 观感 观感,颜色,摆盘,样貌,精致,造型,色泽…… 26
      A4 价格 价格,价钱,菜价,价位,性价比,贵,便宜,均价,人均,实惠…… 24
      A5 食材 食材,新鲜,选材,运送,即享,血色,调馅,开背,剪掉,剥壳…… 22
      A6 制作 烹饪,工艺,技法,烹制,严谨,烧制,现场,繁琐,工序,精良…… 24
      A7 营养 补品,均衡,富含,健康,滋养,保健食品,膳食,进补,润肠…… 25
      B商家服务 B1 服务 服务,热情,周到,态度,礼貌待客,领路,换盘,递水…… 31
      B2 环境 环境,装修,风格,外观设计,装饰,主色调,简约,现代感…… 30
      B3 座位 座椅,座位,扶手,靠垫,靠背,长椅,沙发,桌距,卡座,间隔…… 31
      B4 位置 位置,好找,电梯,卖场,直梯,上楼,扶梯,地铁,直达,层…… 32
      B5 排队 排队,等位,错开,排号,取号,翻台率,发号,坐满,等候…… 29
      B6 结账 结账,买单,能省,多结,转账,优惠,扫过去,支付,抵用券…… 30

      1.维度属性描述数量(Attri_nums)反映的是评论文本中含有维度属性词的个数,具体计算公式为

      $$ \mathrm{N}\mathrm{u}\mathrm{m}\mathrm{b}\mathrm{e}\mathrm{r}\mathrm{s}\_\mathrm{o}\mathrm{f}\_\mathrm{A}\mathrm{t}\mathrm{t}\mathrm{r}\mathrm{i}\mathrm{b}\mathrm{u}\mathrm{t}\mathrm{e}\left(r,a\right)=\sum _{i=1}^{n}\sum _{j=1}^{m}{c}_{j}\left({s}_{i}\right) $$ (1)

      其中, $ n $ 为评论 $ r $ 中的总句数; $ m $ 为维度 $ a $ 的属性数; $ {s}_{i} $ 为评论 $ r $ 中的第 $ i $ 句; $ {c}_{j}\left({s}_{i}\right) $ 表示句子 $ {s}_{i} $ 中含有属性 $ j $ 的属性词个数。

      2.由于评论文本在某一维度下可能包含多个属性的信息,仅衡量评论长度是不合理的,因此计算评论的维度属性描述平均长度(Attri_avglen),具体计算公式为

      $$ \mathrm{A}\mathrm{v}\mathrm{e}\mathrm{r}\mathrm{a}\mathrm{g}\mathrm{e}\mathrm{L}\mathrm{e}\mathrm{n}\mathrm{g}\mathrm{t}\mathrm{h}\_\mathrm{o}\mathrm{f}\_\mathrm{A}\mathrm{t}\mathrm{t}\mathrm{r}\mathrm{i}\mathrm{b}\mathrm{u}\mathrm{t}\mathrm{e}(r,a)=\frac{\displaystyle\sum _{i=1}^{n}l\left({s}_{i}\right)\times 1\left({s}_{i}\right)}{\mathrm{N}\mathrm{u}\mathrm{m}\mathrm{b}\mathrm{e}\mathrm{r}\mathrm{s}\_\mathrm{o}\mathrm{f}\_\mathrm{A}\mathrm{t}\mathrm{t}\mathrm{r}\mathrm{i}\mathrm{b}\mathrm{u}\mathrm{t}\mathrm{e}\left(r\right)} $$ (2)

      其中, $ n $ 为评论 $ r $ 中的总句数; $ {s}_{i} $ 为评论 $ r $ 中的第 $ i $ 句; $ l\left({s}_{i}\right) $ 为第 $ i $ 句的句长; $ 1\left({s}_{i}\right) $ 是虚拟变量,指示评论第 $ i $ 句中是否含有维度属性(含有维度属性的取值为1,反之为0)。

      为进一步提取评论文本内容的情感维度信息,结合知网HowNet与BosonNLP两个情感词典对评论的情感表达倾向进行打分,通过分析评论语句结构的方式对积极情感词汇、消极情感词汇、否定词汇以及程度词汇进行识别,并赋予程度副词相应的权重来计算评论内容的情感倾向得分(Sentiment_score),程度副词词典如表3所示。对于其余变量,按如下方法对数据进行预处理:(1)评论者ID匿名性(ID_anonymity)。将未匿名的评论者记为1,反之记为0。(2)评论者VIP信息(VIP_membership)。如果评论者是VIP,则显示橙色标识,此处记为2;如果评论者VIP过期,则显示灰色标识,此处记为1;如果评论者不是VIP,则不显示标识,此处记为0。(3)评论发表后经过天数的自然对数(ln elapsed_days),使用数据获取最后一天的日期减去评论发表的日期,得到评论发表后的经过天数再对其取自然对数[48]

      表 3程度副词词典

      程度 个数 权重 词汇
      极其|extreme/最|most 69 4 百分之百,倍加,备至,不得了,不堪,不可开交,不亦乐乎,不折不扣……
      很|very 42 3 不过,不少,不胜,惨,沉,沉沉,出奇,大为……
      较|more 37 2 大不了,多,更,更加,更进一步,更为,还,还要……
      稍|-ish 29 1 点点滴滴,多多少少,怪,好生,还,或多或少,略,略加……
      欠|insufficiently 12 0.5 半点,不大,不丁点儿,不甚,不怎么,聊,没怎么,轻度……
    • 已有文献在探究在线评论有用性时,通常以在线评论的点赞数或点赞比例作为有用性的衡量指标[28]。虽然Mudambi和Schuff[3]8更加建议采用点赞比例作为衡量指标,但由于在线数据集的限制,后续研究主要以评论的点赞数作为因变量研究在线评论有用性影响因素[23][26],因此本研究沿用了以点赞数作为有用性衡量指标的做法。经统计发现:因变量r_praise的分布右偏,97.46%的评论点赞数为0~32,如图4所示,点赞数最大值为7 343。因此,本研究主要关注点赞数小于33的评论(有效样本量为47 186)以控制极端值产生的影响[5]

      图 4因变量数值分布

      在进行回归分析前,观察了研究所涉及变量的数值分布,其描述性统计如表4所示。对因变量r_praise观察后发现餐厅在线评论的点赞数的均值为2.340 0,标准差为4.267 8,表示因变量的离散程度较大。从评论内容来看,通过横向对比在线评论两个维度的属性特征后发现:菜品品质维度的属性描述数量Dishes_attri_nums的均值2.445 6,高于商家服务维度的属性描述数量Service_attri_nums的均值1.483 1,这意味着用户在餐厅在线评论中倾向于更多地描述与菜品质量有关的内容;此外,菜品品质维度的属性描述平均长度Dishes_attri_avglen的均值12.114 2,高于商家服务维度的属性描述平均长度Service_attri_avglen的均值7.669 8,说明用户在撰写评论时会用较多的语言描述菜品品质维度的特征信息,而不会用等同的篇幅去描述商家服务维度的特征信息;从评论内容所反映出的情感倾向得分Sentiment_score来看,其平均值为2.712 8,反映了多数在线评论的情感倾向是积极正面的。

      表 4研究变量的描述性统计与多重共线性检验

      研究变量 样本量 平均值 标准差  最小值 最大值   VIF Tolerance
      *r_praise 47 186 2.340 016 4.267 794 0 32
      Dishes_attri_nums 47 186 2.445 577 2.442 683 0 43 1.44 0.694 3
      Dishes_attri_avglen 47 186 7.137 108 6.251 386 0 247 1.18 0.845 1
      Service_attri_nums 47 186 1.483 025 1.728 192 0 22 1.37 0.731 1
      Service_attri_avglen 47 186 5.770 987 6.685 196 0 191 1.37 0.729 3
      Sentiment_score 47 186 2.712 833 3.799 603 −29 54 1.35 0.740 5
      ID_anonymity 47 186 0.963 294 0.188 041 0 1 1.03 0.974 8
      Rank 47 186 4.925 931 1.648 863 0 8 1.86 0.538 5
      VIP_info 47 186 0.879 604 0.801 305 0 2 1.93 0.516 9
      Rate 47 186 4.289 270 0.968 376 0.5 5 1.11 0.897 6
      Recommendations 47 186 0.991 544 1.796 548 0 20 1.09 0.916 8
      Pictures 47 186 3.247 277 3.503 034 0 31 1.46 0.686 5
      ln_elapsed_days 47 186 5.366 836 0.947 305 0 8.280 711 1.16 0.864 3

      此外,本研究还检查了研究变量的方差膨胀系数(Variance Inflation Factor,VIF)。通过Stata 16.0得到了多重共线性检验结果,如表4所示。结果表明,全部解释变量的VIF值均在1~5,容忍度(Tolerance)均大于0.1,验证了研究所涉及变量之间不存在多重共线性问题,不会对估计结果产生影响。

    • 在选择回归模型时,本文充分考虑了数据集特征以及现有研究中所采用的实证研究方法。首先,研究数据集充分考虑了没有获得有用性点赞的在线评论样本,部分缓解了样本选择偏差问题[49]。因此,因变量的取值范围存在界限:有37.91%的评论没有获得点赞,且97.46%的在线评论点赞量为0~32。其次,大众点评的评论生态中没有指明阅读评论的人数,而实际场景中的消费者会有选择地对在线评论做出点赞行为,故忽略了一部分浏览了在线评论但没有做出有用性投票行为的消费者意见,导致实证分析过程中存在潜在选择问题,如果采用普通最小二乘估计就会存在较大偏误[3][7]

      综合先前研究经验与本文数据集特征,本文采用Tobit回归作为主研究方法,并使用负二项回归来验证Tobit回归的稳健性,原因如下:(1)Tobit模型适用于本文数据中被解释变量的分布受限情况,投票数非负且取整,并且有绝大部分变量在某一取值区间,这种数据分布特征适合采用截取回归模型。此外,由于点评详情页没有提供评论的阅读人数,而仅显示了认可评论的点赞数,而Tobit模型可以解决上述数据样本中的固有选择偏差问题。(2)负二项回归模型同样适用的原因在于:投票数只可以取非负整数。通过分析本文描述统计结果,发现因变量的分布过于分散(标准差远大于平均值)。使用负二项回归模型,不仅可以解决因变量中大量0值的影响效果,还可以较好地处理离散的数据,形成好的拟合效果。

      确定回归方法后,在回归分析中采用了包含47 186条在线评论的数据集对有用性影响因素进行探究,首先构建了四个Tobit回归模型,并使用Lower Limit以0为左截取值的单边截取,通过逐步加入自变量的方式对前文所提出的研究假设进行检验。具体地说:模型1加入了评论情感倾向得分Sentiment_score以验证假设H3;模型2在模型1的基础上加入了菜品品质维度的属性描述数量(Dishes_attri_nums)和菜品品质维度的属性描述平均长度(Dishes_attri_avglen)以验证假设H1a和H1b;模型3在模型1的基础上加入了商家服务维度的属性描述数量(Service_attri_nums)和商家服务维度的属性描述平均长度(Service_attri_avglen)以验证假设H2a和H2b;模型4则包含了全部研究变量,式(3)展示了完整的Tobit回归模型(模型4)。在模型5~模型8中,对应使用了负二项回归的方法对Tobit回归结果进行了稳健性检验。两次回归分析的结果可如表4所示。

      $$\begin{aligned} \mathrm{r}\_\mathrm{p}\mathrm{r}\mathrm{a}\mathrm{i}\mathrm{s}\mathrm{e}=&{\beta }_{0}+{\beta }_{1}\times \mathrm{D}\mathrm{i}\mathrm{s}\mathrm{h}\mathrm{e}\mathrm{s}\_\mathrm{a}\mathrm{t}\mathrm{t}\mathrm{r}\mathrm{i}\_\mathrm{n}\mathrm{u}\mathrm{m}\mathrm{s}+{\beta }_{2}\times \mathrm{D}\mathrm{i}\mathrm{s}\mathrm{h}\mathrm{e}\mathrm{s}\_\mathrm{a}\mathrm{t}\mathrm{t}\mathrm{r}\mathrm{i}\_\mathrm{a}\mathrm{v}\mathrm{g}\mathrm{l}\mathrm{e}\mathrm{n}+{\beta }_{3}\times \mathrm{S}\mathrm{e}\mathrm{r}\mathrm{v}\mathrm{i}\mathrm{c}\mathrm{e}\_\mathrm{a}\mathrm{t}\mathrm{t}\mathrm{r}\mathrm{i}\_\mathrm{n}\mathrm{u}\mathrm{m}\mathrm{s}+{\beta }_{4}\times\\ & \mathrm{S}\mathrm{e}\mathrm{r}\mathrm{v}\mathrm{i}\mathrm{c}\mathrm{e}\_\mathrm{a}\mathrm{t}\mathrm{t}\mathrm{r}\mathrm{i}\_\mathrm{a}\mathrm{v}\mathrm{g}\mathrm{l}\mathrm{e}\mathrm{n}+{\beta }_{5}\times \mathrm{S}\mathrm{e}\mathrm{n}\mathrm{t}\mathrm{i}\mathrm{m}\mathrm{e}\mathrm{n}\mathrm{t}\_\mathrm{s}\mathrm{c}\mathrm{o}\mathrm{r}\mathrm{e}+{\beta }_{6}\times \mathrm{I}\mathrm{D}\_\mathrm{a}\mathrm{n}\mathrm{o}\mathrm{n}\mathrm{y}\mathrm{m}\mathrm{i}\mathrm{t}\mathrm{y}+{\beta }_{7}\times \mathrm{R}\mathrm{a}\mathrm{n}\mathrm{k}+{\beta }_{8}\times\\ & \mathrm{V}\mathrm{I}\mathrm{P}\_\mathrm{i}\mathrm{n}\mathrm{f}\mathrm{o}+{\beta }_{9}\times \mathrm{R}\mathrm{a}\mathrm{t}\mathrm{e}+{\beta }_{10}\times \mathrm{R}\mathrm{e}\mathrm{c}\mathrm{o}\mathrm{m}\mathrm{m}\mathrm{e}\mathrm{n}\mathrm{d}\mathrm{s}+{\beta }_{11}\times \mathrm{P}\mathrm{i}\mathrm{c}\mathrm{t}\mathrm{u}\mathrm{r}\mathrm{e}\mathrm{s}+\times \mathrm{l}\mathrm{n}\mathrm{ }\mathrm{e}\mathrm{l}\mathrm{a}\mathrm{p}\mathrm{s}\mathrm{e}\mathrm{d}\_\mathrm{d}\mathrm{a}\mathrm{y}\mathrm{s}+\varepsilon \end{aligned}$$ (3)

      表4可见,模型2结果分别说明了菜品品质维度的属性描述数量和菜品品质维度的属性描述平均长度显著影响了餐厅在线评论有用性( ${\beta }_{1}=0.054\;8,p < 0.01$ ; ${\beta }_{2}=0.015\;3, p < 0.01$ ),即对于餐厅在线评论内容,含有更多的菜品品质相关的介绍(如:口味、观感、食材等),并使用更多的词语和句子来描述菜品品质维度的属性特征的评论会被认为是更具帮助性的。研究模型3的系数估计结果显示: ${\beta }_{3}=0.163\;0, p < 0.01$ ; ${\beta }_{4}=0.020\;4,p < 0.01$ ,说明商家服务维度的属性描述数量和商家服务维度的属性描述平均长度显著影响了餐厅在线评论有用性,即在线评论中商家服务维度的属性特征信息越丰富,评论者描述商家服务质量的词语和句子越多、描述越详细,评论有用性水平越高。综上所述,研究假设H1a、H1b、H2a和H2b成立。

      从模型1的系数估计结果中不难看出,评论的情感倾向得分越高,在线评论的有用性也随之增加( ${\beta }_{5}=0.078\;8,p < 0.01)$ ,即在线评论内容传达的情感越正向、积极,评论的有用性水平也越高。该实证结果与现有研究结果有所差异,研究假设H3不成立。虽然这一结果与研究预期有一定差别,但本文认为该结果依然存在合理性:首先,已有研究在不同背景下并未获得一致的结果;其次,消极倾向的在线评论可能受到推荐算法的谨慎处理,从而获得更少的曝光机会;值得注意的一点是,正向情感倾向传达了评论者的满意体验与积极心态,潜在消费者可能受到评论中正向情绪词汇的强烈影响,不仅使评论内容的真实性显著提升,还积极影响了评论阅读者的内在情绪,进而提升了评论的有用性。

      模型4考虑了本文所提出的全部变量,得到了一致的回归结果,其中Dishes_attri_nums、Service_attri_nums、Service_attri_avglen与Sentiment_score四个变量回归系数估计结果的显著性水平没有变化,进一步支持了假设H1a、H2a、H2b、H3的稳健性。虽然菜品品质维度属性描述平均长度Dishes_attri_avglen的系数同样显著,也验证了假设H1b的稳健性,但该项的显著性水平有所降低 ${\beta }_{2}=0.009\;2,p < 0.05$ 。在检查相关系数矩阵后,研究发现Dishes_attri_avglen与Service_attri_avglen的相关系数较高(0.319 3),研究推测可能是由于Dishes_attri_avglen与Service_attri_avglen两个变量均受到评论长度的影响,评论长度越长,菜品品质维度和商家服务维度属性平均长度可能越大,因此本文认为是变量间的相关性导致了显著性水平的波动。

      在检验Tobit回归结果的稳健性时,本文进而采用负二项回归的方法开展了实证研究(结果如表5的模型5~模型8所示),得到了基本一致的结论,从而验证了实证分析结果的稳健性,有助于加深对餐厅在线评论内容中有关菜品品质、商家服务以及情感倾向三方面信息的理解。

      表 5餐厅在线评论有用性的回归结果

      变量 Tobit回归 负二项回归
      *r_praise 模型1 模型2 模型3 模型4 模型5 模型6 模型7 模型8
      Dishes_attri_nums 0.054 8*** 0.044 7*** 0.009 0*** 0.006 2**
      Dishes_attri_avglen 0.015 3*** 0.009 2** 0.004 3*** 0.003 0***
      Service_attri_nums 0.163 0*** 0.161 0*** 0.036 2*** 0.036 4***
      Service_attri_avglen 0.0204 0*** 0.017 7*** 0.005 4*** 0.004 5***
      Sentiment_score 0.078 8*** 0.064 4*** 0.063 5*** 0.052 7*** 0.0176*** 0.015 0*** 0.014 1*** 0.012 4***
      ID_anonymity 2.688 0*** 2.676 0*** 2.704 0*** 2.695 0*** 0.988 0*** 0.986 0*** 0.993 0*** 0.991 0***
      Rank 1.105 0*** 1.099 0*** 1.104 0*** 1.100 0*** 0.321 0*** 0.320 0*** 0.321 0*** 0.321 0***
      VIP_info 0.281 0*** 0.269 0*** 0.260 0*** 0.252 0*** 0.076 8*** 0.074 5*** 0.072 0*** 0.070 6***
      Rate 0.258 0*** 0.264 0*** 0.303 0*** 0.307 0*** 0.093 5*** 0.095 3*** 0.106 0*** 0.107 0***
      Recommendations 0.176 0*** 0.169 0*** 0.169 0*** 0.164 0*** 0.041 0*** 0.039 6*** 0.039 3*** 0.038 4***
      Pictures 0.338 0*** 0.326 0*** 0.313 0*** 0.305 0*** 0.081 8*** 0.079 3*** 0.075 6*** 0.074 2***
      ln_elapsed_days −0.357 0*** −0.352 0*** −0.348 0*** −0.345 0*** −0.135 0*** −0.134 0*** −0.133 0*** −0.132 0***
      _cons −8.468 0*** −8.632 0*** −8.938 0*** −9.029 0*** −2.116 0*** −2.159 0*** −2.240 0*** −2.264 0***
      var(e.r_praise) 28.080 0*** 28.06 0*** 27.970 0*** 27.960 0***
      lnalpha 0.159 0*** 0.157 0*** 0.152 0*** 0.151 0***
      Pseudo R2 0.054 9 0.055 1 0.055 7 0.055 8 0.078 7 0.078 9 0.079 6 0.079 7
      AIC 200 793.2 200 759.9 200 626.4 200 610.8 172 090.2 172 059.3 171 915.2 171 903.4
      BIC 200 880.8 200 865.1 200 731.5 200 733.5 172 177.8 172 164.4 172 020.4 172 026.0
      N 47 186 47 186 47 186 47 186 47 186 47 186 47 186 47 186
        注:* 表示p<0.1; **表示p<0.05; ***表示p<0.01。
    • 为了更加方便、高效地对在线评论的有用性进行分类识别,本研究提出了餐厅中文在线评论有用性的分类阈值,并据此来判断评论是否有用:如果评论得到的有用性投票(点赞)数高于分类阈值,则认为该评论是有用的;反之则认为评论是无用的。从某种程度来说,分类阈值决定了分类器的性能。

      为了确定有用性分类阈值,从实验数据中随机选取50条在线评论,仅显示在线评论文本内容,请两名本科学生对评论的有用性进行评估,并记录两人的标记结果。进而使用Kappa系数来检验评估结果的一致性,结果表明 $ k=0.725 $ ,处于0.6~0.8的范围,证明人工分类评估结果的一致性较高。本文设置了在线评论有用性的分类阈值,将在线评论划分为有用评价和无用评价。为进一步确定中文餐厅背景下的在线评论有用性分类最佳阈值,将上述人工分类评估结果与阈值分类结果进行比较分析,并以ROC曲线下面积AUC为衡量指标。图5展示了不同分类阈值下的AUC结果,该值越高则表明阈值的分类效果越好。实验结果表明,将餐厅在线评论有用性分类阈值设置为2可以得到最优的分类性能。

      图 5不同阈值的分类性能

    • 在前文的研究中,探究了餐厅背景下在线评论有用性的影响因素,提出了有用性分类阈值。为了更好地预测餐厅在线评论有用性并检验上述有用性分类阈值的性能,本部分结合该阈值与支持向量机算法对餐厅在线评论的有用性进行预测。本文主要基于如下考虑而没有使用全部实验数据用于预测模型的构建:潜在消费者对评论的浏览、点赞量会受到在线评论发表时间的影响,若选用近期(3个月以内)的数据用于分类预测,部分评论还未经消费者浏览并决定是否点赞,会导致模型预测结果存在较大偏差。

      大众点评网在对餐厅在线评论进行排序时看重评论发表的时间,即评论发表时间在排序中占比重较大,因此发表时间越近的评论排序越靠前。考虑到该数据集的采集时间,为了建立更加符合实际情况的分类预测模型,选取上述实验数据中评论日期在2019年10—12月期间的在线评论对有用性进行预测,因此这部分数据会更少地展示在餐厅在线评论的前几页,即在线评论的浏览量与点赞数几近“饱和”。

      在使用支持向量机构建预测模型时,本文将有用性识别结果处理为二分变量“有用”与“无用”,并以评论的点赞数作为在线评论有用性衡量指标,通过设定阈值对餐厅在线评论进行有用性分类:将点赞数大于阈值的在线评论记为“1”,将点赞数小于阈值的在线评论记为“–1”。此外,研究训练集规模为总评论数的70%,测试集规模为总评论数的30%,使用五折交叉验证来测试算法的准确性。在变量设计上,沿用上文研究中提到的在线评论内容中菜品品质维度、商家服务维度的属性描述数量与平均长度,情感倾向得分等变量,同样分为四个模型来探究变量对在线评论有用性预测性能的影响。

      1. 核函数的选择

      核函数的本质是一种在空间中完成映射后,用于计算内积的算法,核函数的选择直接影响分类预测模型的性能。本文选用了三种核函数进行拟合并横向比较拟合准确率,结果如表6所示:Linear核函数和RBF核函数的拟合精度较高,准确率均大于70%,其中Linear的准确率为72.92%,有着最优的拟合效果,但后者的时间复杂度较低。综合考虑,选择以RBF核函数来构建模型。

      表 6核函数拟合结果

      核函数 Linear RBF Sigmoid
      准确率 0.729 241 88 0.704 933 81 0.583 874 85

      2. 参数调优

      本研究使用了RBF核函数来构建分类模型,需要关注核参数 $ \mathrm{G}\mathrm{a}\mathrm{m}\mathrm{m}\mathrm{a} $ 与惩罚参数 $ C $ 。研究首先通过网格搜索法将惩罚参数 $ C $ 设定在1~1 000,取值1,10,100,1 000;核参数 $ \mathrm{G}\mathrm{a}\mathrm{m}\mathrm{m}\mathrm{a} $ 在[0.002,0.01]区间,以0.002为步长,在[0.000 2,0.001]区间0.000 2为步长,以组合形式逐个探究各参数所对应的模型拟合度。同时使用AUC(ROC曲线下方的面积)作为模型评价指标,参数调优结果如表7所示。根据参数调优结果,本文将惩罚参数 $ C $ 设定为1 000,核参数 $ \mathrm{G}\mathrm{a}\mathrm{m}\mathrm{m}\mathrm{a} $ 设定为0.000 2,这一参数组合可以在不同分类阈值下均得到较高的AUC值,对应了模型较高的整体性能(见表7加粗显示部分)。

      表 7支持向量机参数调优结果

      参数  
      C 1 10 100 100 0
      Gamma 0.002 0.001 0.000 4 0.000 2
      AUC 0.799 916 08 0.806 182 04 0.808 1740 5 0.808 723 79
      Accuracy 0.726 353 79 0.731 648 62 0.734 055 35 0.737 424 79
        注:加粗数字表示支持向量机所采用的最优参数。

      3.模型性能对比与解释

      图6展示了前文提出的模型1~模型4在餐厅在线评论有用性预测中的性能表现,选择了模型的准确率作为衡量指标,其中模型1的准确率为73.36%,模型2的准确率为73.65%,模型3的准确率为73.55%,模型4的准确率为73.74%。观察模型性能表现结果可知:模型2、模型3、模型4相比模型1均有性能提升,但提升幅度较小。上述结果说明菜品品质维度、商家服务维度的属性描述数量与平均长度对于预测餐厅在线评论有用性存在一定的帮助作用,但是对于预测性能的提升程度有限。

      图 6预测模型的性能表现

    • 本文分析了餐厅背景下的在线评论有用性影响因素,提出了相应假设,并通过Tobit回归与负二项回归进行了实证检验。结果表明:在线评论内容中菜品品质维度的属性描述数量与平均长度、商家服务维度的属性描述数量与平均长度和情感倾向得分这5个变量均显著正向影响在线评论有用性,验证了餐厅在线评论文本内容中涉及的菜品品质特征与商家服务特征为用户提供了具有重要参考价值的关键信息,提升了评论有用性水平。此外,提出了中文餐厅的在线评论有用性阈值为2,即点赞数大于2的在线评论被认为是有用的,该阈值的提出有助于提高评论有用性识别效率,且评论内容中菜品品质维度属性描述数量、商家服务维度属性描述数量与平均长度对在线评论有用性识别具有一定的提升作用,但效果有限。

      本文基于信息采纳模型(IAM)开展了相关研究,从评论文本内容提取菜品品质与商家服务两个具体维度的在线评论信息,细化了信息质量的衡量方法。在实践方面,基于餐厅在线评论背景中不同的立场,分别给出如下建议:(1)对于餐厅消费点评线上服务平台,管理人员应该关注本研究所提出的变量,用以辅助判断在线评论的有用性;基于与本文研究相类似的分类阈值构建一个或者优化现有的在线评论有用性排序模型,优先展示有用的评论,为消费者提供更多信息进而提升平台竞争力。(2)对进驻平台的商家,需要努力提升餐厅整体水平,还可以根据餐厅风格塑造具有特色的服务、环境等,给就餐顾客留下深刻的印象。(3)对于消费者,可以关注评论内容中提及菜品品质维度、商家服务维度的信息量大小与评论情感倾向等因素,从而对评论的有用性形成综合判断,提高信息获取效率。

      本文在研究餐厅在线评论有用性方面虽然取得了一些成果,但仍然存在不足,如:研究数据来源较为单一,菜品品质、商家服务维度词表存在一定的局限性等。未来研究中可以着重思考解决以下问题:(1)针对不同类型的餐厅特点构建领域限定词库,将研究扩展至其他类型餐厅。(2)进一步发掘体验型产品的维度属性特征信息,并尝试构建更全面的维度属性标准以更接近在线评论的真实语义。(3)实际场景中对于评论有用性的判定并非简单的二分问题,可以考虑采用李克特量表细化评论有用性评价标准。

参考文献 (49)

目录

    /

      返回文章
      返回
        Baidu
        map