前言:想要写出一篇令人眼前一亮的文章吗?我们特意为您整理了5篇商品评论范文,相信会为您的写作带来帮助,发现更多的写作思路和灵感。
【关键词】网络购物;顾客满意度;评价
1.引言
随着电子商务发展的日益成熟,关于网上购物顾客满意度的评价逐渐成为衡量产品质量和服务水平的一个重要途经。无论是产品生产企业、电子商务运营商还是物流企业,都希望了解到顾客购物的真实感受,从而有的放矢地改善其生产方式及服务,以增强其市场竞争力。
笔者认为顾客网购体验与其所购买的产品本身的属性是密不可分的,要想全面、深入地反映其心理评价,商品评论是最能体现这一要求的。通过对网购顾客的评论文本的标注和挖掘,构建网购顾客满意度指标体系,分析各指标在顾客关注程度和使用方面的一些特点,以更加全面、更加具体地反映顾客购物的心理体验。
2.基于商品评论的顾客满意度指标体系构建
2.1 研究对象的选取
本文选取部分手机产品作为研究对象,所构建的满意度指标体系既涵盖适用于通用领域的属性,也有针对手机产品的具体特征。
2.2 数据来源及处理
2.2.1 数据来源
本文数据来源于京东商城网站,选取部分手机类商品,收集其中的商品评论语句。京东商城的每一条评论信息均包含优点、缺点和心得三部分,全部作为本文的数据收集对象。本文数据收集的起点是2013年1月31日,向前截取满足一定数量的评论语句。使用C#语言编写爬虫软件,共抓取评论数据60,600条,既包含部分销量高的商品,又包含部分销量居中的商品,以避免优点和缺点描述的不平衡。
2.2.2 数据处理
本文通过采用部分数据对网购顾客的评论文本的标注和挖掘,抽取出相应的指称关键词和描述关键词,将其提炼为网购顾客满意度指标体系。利用中文信息处理相关技术,针对大量数据对各指标进行词频统计,验证网购顾客满意度指标体系的准确性,及分析各指标在顾客关注程度和使用方面的一些特点。通过分析顾客对各指标的关注程度,预测产品将来的技术攻关方向和竞争要素,以使企业准确定位顾客关注焦点,推出深受顾客满意的产品,进而增强企业的竞争能力。本文数据来源中有600条采用人工分析,抽取出相关的特征及描述,构建顾客满意度指标体系,另60,000条采用中文信息处理工具进行统计,将统计结果用于对指标体系的量化分析。具体所选的产品及评论条数见表1。
2.3 网购顾客满意度指标体系的构建
2.3.1 商品评论特征抽取
笔者对600条手机商品评论进行了人工标注,标注内容包括指称关键词和描述关键词,从这些关键词中提炼出评价指标。提炼的原则如下:
(1)剔除关于表示商品型号和商品品牌的名词,如“N70”,“诺基亚”。
(2)剔除一些常见的口语化的名词,如“机子”,“东西”。
(3)剔除一些常见的人称名词,如“朋友”,“老人”。
(4)合并同义词和表示同一类所指对象的词语。
据此得出所得评价指标及其描述词,受篇幅所限,这里仅列出部分,见表2。
图1 网购顾客满意度指标层级体系
从手机商品评论抽取结果中可以发现,指称词、描述词集合与评价指标并不是一一对应的,存在一些词语对应多个指标的情况,这是因为有些语义内容并不是由词一级语言单位表达的,而是由短语或句子整体表示的,需要结合上下文信息才能确定这些词语的所指。
2.3.2 指标体系的生成
笔者基于手机商品评论抽取结果的评价指标,通过整理、归纳,构建网购顾客满意度指标层级体系。第一层为顾客网购满意度;第二层分为网站满意度、产品满意度、物流满意度、售后服务满意度,同时,借鉴Lee(2001)[1]的研究成果,增加了交易安全满意度指标;第三层及以下是对这些指标的细分类,共19个指标,其中有17项是对各类商品通用的,另外两项产品性能和产品外观,其下层分类指标是仅针对手机类商品的,见图1。
2.4 商品评论词频分析
本文对自动抓取的京东商城诺基亚(NOKIA)
N1280 GSM手机(黑)和华为U8860两类手机的6万条评论进行词频统计,对本文给出的顾客满意度指标体系进行检验和量化分析。词频分析采用山西大学开发的中文分词工具FC2000[2],共获得24.4万词。首先对词表进行预处理,去掉语料中的句子“暂时没有缺点”,因为该句是京东网用户评论撰写页面关于商品缺点部分给出的默认评价,相当多的用户直接使用该句作为缺点评价的内容,导致其频率过高,而又不含有价值;其次,根据停用词表[3],去掉高频词中出现的停用词;再去掉高频词中的动词,如“帮”,“说”,“算”,“看”等;去掉程度副词,如“很”,“挺”,“非常”等;去掉常见的人称名词,如“朋友”,“老人”等;最后,截取词频超过100次的词汇,共235个。将这些高频词与图4中的指标进行匹配,对于一个词对应多个指标的情况,如“满意”对应总体满意度、网站满意度和产品满意度三个指标,暂将其次数平均分配给各指标;对于一个指标对应多个词的情况,取每个词次数的和,统计结果见表3。
从表3中可以看出,本文给出的网购顾客满意度指标体系54个指标中有43个指标有相应高频词与之对应,占指标总数的80%,证明这些指标是顾客经常评论的内容,的确是顾客关心的问题。11个没有相应词汇的指标分别是页面布局、页面反应速度、网站信息质量、产品价格、物流满意度、配送方式、交易安全满意度(及下属3个指标)和个性化服务。其中,产品价格(二级指标)和物流满意度(一级指标)是上层指标,其下位指标对应有具体的词汇,且词频较高,因此实际上用户评论是涵盖这方面信息的;网站信息质量和配送方式两个指标属于低频词汇对应的指标,在表3高频词汇中没有出现;而个性化服务指标在顾客评论中不是用词表述的,是用短语或句子表达的,如“还附赠了一次性的贴纸章,用来给保修卡盖章的”,因此就词汇层面的分析来说看不到这方面信息;页面布局、页面反应速度及交易安全满意度(及下属3个指标)指标在顾客评论高频词中没有出现,从一定程度上说明这些方面对于当前电子商务的技术和服务发展水平来说,已经能够满足用户需求,不需要过多探讨。
图2 三级以上指标词频排序图
从图2中可见,词频超过1万次的指标为顾客总体满意度、产品满意度、定价、产品信誉度、手感、(手机)实用性,说明了顾客在网购过程中最关注的仍然是产品本身的性能、质量和价格因素。词频在5000到1万之间的两个指标为易操作性和产品外观,说明用户对手机的这两方面性能关注度较高。值得注意的是,表3中有两个四级指标词频超过9000次,即音效和待机时间。说明对于手机类产品来说,音效是首要引起用户关注的问题之一,而待机时间短恰是当前智能机普遍存在的缺陷,这两个指标的高频出现,也给手机制造商以一定的启示。三级指标中排在后三位的是真伪、硬件配置和重量。用户对于商品的真伪关注度比较低,说明目前网购顾客对京东商城这样的大型B2C购物平台的信赖程度较高。用户对硬件配置和重量关注度低,说明对于当前的手机类产品来说,硬件方面已经不是主要的技术攻关方向和竞争要素,而与外观设计、特色服务等有关的指标则更重要一些。
3.结语
本文通过对网购顾客的评论文本的标注和挖掘,构建了网购顾客满意度指标体系,并通过词频统计,分析了各指标在顾客关注程度和使用方面的一些特点。对比目前存在的一些网购顾客满意度指标体系,本文提出的指标体系层级和指标数量多,使得体系的语义深度大大加强,在反映顾客购物的心理体验方面更加全面和具体。由于本文在满意度指标体系的构建方法上主要基于商品评论的关键词抽取,使得每一个指标有确定词汇集合与之对应,该成果可以为商品评论文本挖掘方面的研究提供基础资源,利用词表进行特征、观点抽取和情感倾向方面的研究,这也是本文下一步研究的方向。
参考文献:
[1]prehensive Model of Internet Consumer Satisfaction[J].HongKong:City University of Hong Kong,2001:207-210.
[2]刘开瑛.中文文本自动分词和标注[M].北京:商务印书馆,2000:23-45.
具体步骤为:
打开拼多多商家页面,在窗口左侧会看到有很多的按钮,可根据需要点击相应的按钮进行相关的操作;在左侧找到并点击:商品管理,评价管理,会打开右侧的页面;在右侧输入商品Id,并点击右侧的“查询”即可查看到此商品的评价内容;评价内容显示的时间默认是“近7天评分”,如果想要查看到此商品所有的评价内容,这时可以点击下方左侧的下拉列表选择里面的“全部评分”按钮,查看此产品的所有评分明细。
(来源:文章屋网 )
合同的效力是法律对合同的价值评判。合同是当事人合意的体现,除因标的目的自始客观不能、无从确定、违反法律强行规定,违反公序良俗及其他法律特别规定外,均为有效。前位买卖合同只要系双方真实意思表示,不违背《合同法》52条的禁止性规定,其效力自不待言。在后位买卖合同中,出卖人一物数卖之举虽有悖于诚信守约的善良风俗,但只要出卖人与后位买受人未有恶意串通损害第三人利益的行为,该房屋买卖合同并非当然无效。不能以是否做到实际履行为标准否认后位买卖合同的效力。房屋所有权的转移亦不是房屋买卖合同生效要件的观点也广为学界和实务界认可。基于先后买卖契约而生之多重债权,依传统之债法观念,不因先后而异其效力。[2]就此意义而言,出卖人—房数卖的行为不能当然否认前后买卖合同的效力。《解释》第8条也规定:商品房买卖合同订立后,出卖人又将该房屋出卖给第三人,导致商品房买卖合同目的不能实现的,无法取得房屋的先买受人可以请求解除前位买卖合同及要求出卖方支付惩罚性违约金,而不能当然否定后位买卖合同的效力。由此可推断《解释》认可后位买卖合同效力的意旨。
在出卖人已将房屋所有权移转至前买受人后,又将房屋出卖第三人的,出卖人的行为是一种出卖他人之物的无权处分行为,对无权处分行为的效力,学界通说及《合同法》第51条均认为应采效力待定说,合同并不当然无效。置换一个角度考虑,出卖人出卖他人之物的行为在后买受人不知情的情况下,也是一种欺诈行为,依《合同法》第31条规定,后买受人享有撤销该合同的权利。《解释》第9条也规定:在出卖人已将房屋卖于他人并已履行的,后买受人可以请求撤销买卖合同,并主张惩罚性赔偿金。
二、商品房多重买卖中的物权变动及利益衡平
房屋买卖以转移房屋所有权为合同目的,同一合同标的难以在多个债权人之间合理分配,是多重买卖合同的特色所在,亦是诸多买受人权利冲突的集中体现。准确界定商品房多重买卖中的物权变动,是保护各方权益的前提条件。
(一)房屋所有权已先行转移于前买受人时的物权变动
出卖人若已将房屋所有权移转于前位买受人并办理所有权登记后,又将该房屋卖于他人,先买受人取得房屋所有权当无疑义。不动产以登记为权利公示公信方法,后买受人可从权属登记中发现出卖人非真权利人,从而放弃交易。若其仍愿意与出卖人继续交易,则应视为接受了权利不能实现的风险,自然无法取得房屋所有权。为惩戒出卖人的恶意欺诈,依《解释》第9条三项规定,后买受人就出卖人的一物数卖行为可主张不超过已购房款一倍以内的惩罚性赔偿金。
(二)出卖人径行将房屋移转于后位买受人时的物权变动及法律评价
1.物权行为理论之辩析
欲清楚解析物权变动的内涵,必先厘清物权行为的概念。物权行为是指要发生物权变动,须独立于债权契约之外,以直接发生物权变动为目的设立新的法律行为。债权行为仅是物权行为的原因行为,两者截然分开,各自独立,物权行为并不因原因行为无效而无效,即使原因行为无效,仍可发生所有权变动的效果,此即为物权行为的独立性、无因性。[3]浏览域外法典,关于物权变动大致有四种立法模式。其一,债权意思主义模式,以法国为例,不承认独立于债权行为的物权行为概念,买卖合同成立时物之所有权即行移转。其二,登记对抗主义,如日本立法模式,买卖合同一经成立,物之所有权即行移转,但非经登记不能对抗第三人。其三,登记要件主义,又为区分原则。典型代表为瑞士,即认可物权行为与债权行为的区别,但又不承认物权行为的独立性和无因性。单纯的合同行为不会发生物权变动的效果,还应履行登记等公示行为,方有物权变动之效。其四,物权意思主义,以德国为例,我国台湾民法亦采此说。该学说由德国历史法学派创始人萨维尼所创,主张物权行为的独立性和无因性,即使买卖合同无效或被撤销,所有权依然发生转移。依该说,在商品房多重买卖中即便出卖人损害先买受人利益再次出卖房屋,但若出卖人与后买受人履行了物权变动手续,后买受人仍可当然取得物之所有权。
2.我国物权变动之立法选择
我国民法学界及实务界对物权变动模式的选择亦是众说纷云。主流观点是不接受法国的债权意思主义模式和德国的物权行为独立性、无因性理论,而应沿用我国惯以用之的公示要件主义瑞士模式,同时坚持区分原则,注意合同效力和所有权转移的分离和差异。物权行为的独立性、无因性堪称严谨慎密的逻辑演练体系,固然具有维护绝对交易安全的价值取向,对后位买卖人提供了最完备的权利保障,但因其过于技术性、抽象性,且恶意买卖人亦可一视同仁地获得物之所有权,实与诚实信用的善良风俗背道而驰,公众的道德观、价值观难以认同。物权无因性理论一定程度上是为法律生活形式之安定而牺牲了法律生活实质之社会正当性,无异于削足适履。[4]事实上物权公示公信原则及善意取得制度同样可起到维护交易安全之职,盲目崇尚物权独立性、无因性原则实无必要。我国《物权法》草案,在区分原因行为与物权行为的同时,也否认了物权行为的独立性、无因性。[5]《解释》第8、9条的规定非常明确地表明了商品房买卖合同中,对于出卖人再处分具有限制或拘束的思想。可以说,司法解释在此根本没有涉及物权交易行为的独立,更不用说无因性原则在法律设置和法律交易上的正当性。因此,该规定应是对物权交易抽象原则即无因原则的间接否定。[6]3.《解释》中的物权变动原则及对出卖人、先买受人、后买卖人之利益调整
关键词:在线评论;有用性;商品品牌;实证研究;调节效应
中图分类号:F713.36 文献标识码:A 文章编号:1001-8409(2013)05-0046-05
An Empirical Study on Influence Factors of
Online Reviews’ Helpfulness in E-commerce
LIAO Cheng-lin1,CAI Chun-jiang1,LI Yi2
(1.School of Economics and Business Administration,Chongqing University,Chongqing 400044;
2.School of Economics and Business,Chongqing University of Posts and Telecommunications,Chongqing 400044)
Abstract:This paper,based on an empirical study on 445 valid samples of Amazon,discusses the affecting factors of online reviews’ helpfulness and the mechanism between them.The results indicate that review rating and reviewer ranking have significant negative correlation to reviews’ helpfulness,it review depth and purchasing experience has significant positive correlation to online reviews’ helpfulness.The brand has a moderating effect on theimpact thatreviewer ranking and purchasing experience onreviews’ helpfulness,the impact that reviewer ranking on reviews’ helpfulness in the middle and lowend brand is more significant,and the impact thatpurchasing experience on reviews’ helpfulness in the premium brand is more significant.
Key words:online review;helpfulness;brand;empirical study;moderating effect
1 引言
在线评论作为口碑传播的一种新形式,是消费者在网络上,以文本形式为主对商品的评价,这些评价包括对商品的肯定、不满或个人对特定产品服务的购买和使用感受。网络用户可以通过在线社区或评论网站免费阅读和分享这些评论[1]。在线评论是获取商品信息的重要来源之一,是对商品说明、专家评论和系统自动生成的个性化推荐建议的补充。CNNIC针对在线商品评论对网络消费者购买行为的调查结果显示,43.3% 的消费者表示在线商品评论是购买决策前最重要的信息来源之一[2]。
Ghose和Ipeirotis等针对搜索型商品,研究评论的主客观倾向及主客观混杂度对在线评论有用性的影响[3]。Mudambi等人在借鉴信息经济学理论的基础上,将在线评论有用性定义为其他评论者的,有助于消费者购买决策的在线商品评价。并通过对两类6种商品的研究发现,评论深度、评论极端性和商品类型都对在线评论有用性产生影响[4]。尽管目前在评论有用性影响因素研究方面已取得一些进展,但大多比较分散,且主要从评论信息内容、商品类型等角度来分析,而消费者在搜集商品信息时,不同品牌之间侧重点有所不同,评论者的某些属性也会影响其评论的认可度,然而少有学者把这两方面作为研究对象。
本文将商品品牌引入到在线评论有用性影响因素的研究框架之中,结合评论信息属性和评论者属性等因素,通过亚马逊商城445个有效样本的实证分析,研究了我国电子商务环境下,商品品牌是否对在线评论有用性具有影响作用,以及如何影响评论的有用性。
2 理论背景与研究假设
2.1 商品品牌
Philip Kotler将商品品牌定义为一种名称、术语、标记、符号或图案,或是他们的相互组合,用以识别企业提供给某个或某群消费者的产品或服务,并使之与竞争对手的产品或服务相区别[5]。商品品牌之所以重要,是因为消费者对于品牌的选择与购买直接决定了企业的营业收入,进而对企业的发展产生重大影响[6]。王等通过实证研究,发现品牌效应对消费者行为有显著影响,一个能给消费者带来深刻印象的品牌总能赢得消费者特别的注意力,一个优秀的品牌会得到消费者的认可,在消费者做出购买决策时会首先选择自己喜爱的品牌[7]。那么商品品牌是否对商品评论有用性产生影响?因此本文将商品品牌作为影响评论有用性的主要因素之一。
2.2 评论信息属性
2.2.1 评论等级
Krosnick等认为在线评论等级表示消费者对产品和服务的综合态度,一般有5个等级,即1星级到5星级,一般情况下将1星级和2星级视为对商品的消极评论或差评,4星级和5星级为好评,3星级最能反映评论的客观性[8]。在国外电子商务环境下,Pavlou和Dimoka等通过实证研究,发现eBay中商品的好评和差评比中评的影响作用更大[9]。Forman等发现在对书籍的评论中,中评的有用性比好评和差评低[10]。鉴于此,本文认为评论等级是影响评论有用性的一个重要因素。在国内电子商务环境下,消费者在信息搜寻过程中认为对商品的好评一般带有购买者的主观情感倾向,中评比较客观,而差评往往会揭示商品的缺点或不足,为获得商品的真实信息,消费者会更多地浏览评论者对该商品的中评和差评。在此基础上提出假设:
H1:评论等级与在线评论有用性显著负相关,对评论的接受者而言,中评和差评往往具有更高的有用性。
2.2.2 评论深度
彭岚等从减少消费者决策风险出发,在感知诊断性概念基础上定义了评论有用性概念,构建了一个评论有用性影响因素模型。提出评论长度、评论等级、使用互联网经验等是影响评论有用性的重要因素[11]。Mudambi认为信息深入性能够增加消费者的信心以促进整个决策过程。篇幅较长的评论经常包含更多商品本身,怎样使用以及在何种情况下使用等信息。评论字数的多少在某种程度上能够减少商品质量、性能等属性的不确定[3]。消费者的品牌形象认知对其品牌选择行为有重要影响[12],高端品牌常常给人一种信赖感,消费者不会怀疑该品牌商品的质量、性能等;而中低端品牌没能成功塑造品牌形象,在购买其商品时,消费者需要搜集更多相关信息来减少对品牌的担忧,因此提出假设:
H2:商品品牌对评论深度对在线评论有用性的影响具有显著调节作用,在中低端品牌中,评论深度对评论有用性影响更为显著。
2.3 评论者属性
2.3.1 评论者排名
J B Fogg等认为,名声可信度是指信息来源具有社会地位或专家形象[13]。郭国庆等将评论者资信度引入在线评论可信度研究,发现评论者资信度越高,在线商品评论的有用性或可信度越高[14]。在虚拟社区中,排名靠前的必定是那些积极参与讨论的成员,在群体中具有较大的号召力,发表的商品评论会得到更多的关注,能为消费者做出购买决策提供有力的支持。尤其在购买中低端品牌商品时,发表评论的评论者排名越靠前,消费者认为该评论的可信度越高,因此提出假设:
H3:商品品牌对评论者排名对在线评论有用性的影响具有显著调节作用,在中低端品牌中,评论者排名对评论有用性影响更为显著。
2.3.2 购买经验
购买经验指评论者在做出评价以前是否已经购买过该商品。王平等将购买经验作为一个主要研究因素,结合商品类型的差异,构建消费者在线评论有用性影响因素模型,发现评论者购买经验是评论有用性的一个重要影响因素[15]。亚马逊在线商城页面上已购买商品的评论者会以红色字体显示“购买过此商品”,但不能保证未显示购买该商品的评论者是否在其他商城有购买行为。消费者在选择商品时,经常会受到他人对商品的认识和使用经验的影响,这些意见和看法有时会直接影响消费者的购买决策。由于高端品牌更加注重消费者体验及其购买价格昂贵,消费者在做出购买决策前通常会向具有购买或使用经验的消费者征求意见,因此他们发表的商品评论更具说服力。
H4:商品品牌对评论者购买经验对评论有用性的影响具有显著调节作用,在高端品牌中,购买经验对评论有用性影响更为显著。
基于以上文献,本文构建了商品品牌与评论信息属性、评论者属性、评论有用性之间影响机制的概念模型,如图1所示。该模型表明:(1)评论等级、评论深度、评论者排名及购买经验对在线评论有用性具有显著影响;(2)商品品牌可能对评论等级、评论深度、评论者排名及购买经验对在线评论有用性的影响具有调节作用。
3 实证分析
3.1 数据收集
数据来源于亚马逊商城商品页面中的用户商品评论,选择了高端和中低端品牌的3类商品,包括MP3播放器、手机、数码相机。选择这3类商品主要是考虑到与其他商品相比拥有大量的商品评论,同时高端和中低端品牌易于区分。
商品的评论必须包含以下5个方面的数据:(1)发评者空间排名;(2)发评者是否已购买该产品;(3)评论文本内容;(4)评论有用票数;(5)评论总投票数。对上述商品,共收集了发表时间截止到2011年10月31日的总投票数不少于1的480条在线评论,筛选出提问等其他不符合评论条件的35条,得到有效评论445条。
3.2 变量设计
本文将评论有用性作为因变量,并用评论有用票数与总投票数的比值来度量评论有用性,由于在选取商品评论时总投票数不少于1,因此,该值是一个0~1的连续值(不包含0)。
自变量有评论等级、评论深度、评论者排名和购买经验。本文将评论等级视为从1~5的连续变量;评论深度用评论文本的字数加以测量,该指标是一个取值大于0的连续型变量;亚马逊在线评价系统自动按照评论者对商品的评论以及评论有用性等因素对其进行排名,取值是大于1的连续数值,取值越大,排名越靠后。考虑到评论者等级太低,消费者对其评论的采纳率也相对较低,对研究的贡献很少,因此,将评论者等级锁定在1~100000以内。将购买经验定义为1个二值变量,“0”表示未购买,“1”表示已经购买。
为了探讨不同商品品牌中评论有用性影响效应的差异,引入商品品牌作为模型中的调节变量,并将其定义为1个二值变量,“0”表示中低端品牌,“1”表示高端品牌。
3.3 数据分析
为检验评论等级、评论深度、评论者排名和购买经验是否对评论有用性具有显著影响,本文首先对上述因素进行多元线性回归,各因素都达到了较高的显著性水平(p
由表3可知,各指标对评论有用性存在显著的影响。由交互效应的分析发现,商品品牌对评论者排名和购买经验对评论有用性的影响有着显著的调节作用。为了进一步探讨不同品牌具体的影响效应,分别对高端和中低端商品进行多元线性回归分析,结果见表4、表5。
4 结果讨论
从实证结果来看,本文提出的假设H1、H3、H4都得到支持,H2未得到检验。
(1)假设H1得到支持,由表3可知,评论等级的系数为负,说明评论等级越高其有用性越小。评论等级是评论者根据商品介绍或自身的使用体验给出的综合评价,在消费者购买商品之前会多方面搜集信息,评论等级越高,很可能说明购买者没有深入了解商品,无法得知其优缺点,而中评和差评一般是购买者结合自身使用经验给出的评论,因此具有更高的价值。
(2)假设H2未得到验证。评论篇幅越长,涉及到对商品的介绍和评价越多,浏览该评论的消费者也会获得更多有用信息,因此,评论深度对消费者的购买决策起到了正向的指导作用。无论在高端或中低端品牌中,评论深度都对评论有用性有显著正向影响(sig
(3)假设H3得到支持。评论者排名可以体现评论者的权威性,排名靠前意味着具有良好的专业知识、丰富的经验和更深刻的认识,积极活跃地参与群体讨论、信息和知识共享,发表的商品评论具有较高的参考价值,能够对评论有用性产生显著的正向影响作用。特别是在中低端商品中,消费者在做出购买决策之前,会努力寻求排名靠前的评论者的评论。
(4)假设H4得到支持。有购买经验的消费者的评论往往具有更高的有用性,在使用商品之后,消费者能更好地了解商品的性能、质量,并结合自身体验,总结出商品的优缺点等。从表3和表4的比较可知,购买经验对高端商品评论有用性的影响显著于中低端商品,是因为高端商品更加注重消费者体验及其购买价格昂贵,因此有购买经验的评论者的评论对消费者更具有参考意义。
根据实证结果对概念模型进行修正,修正后的模型如图2所示。
5 结语
本文借助于实证研究方法,探讨了我国电子商务环境下在线商品评论有用性的影响因素以及各因素之间的作用机制。结果表明,评论信息属性和评论者属性都对评论有用性具有显著影响。其中,评论等级和评论者排名与评论有用性显著负相关,评论深度和购买经验与评论有用性显著正相关。商品品牌对评论者排名和购买经验对评论有用性的影响具有显著调节作用。本文的研究结果为国内电子商务市场实践提供了以下几方面的启示:
(1)重视消费者关于商品的中评和差评。研究表明,消费者在搜集商品相关信息时,会更加注重评论者给予的中评和差评。因此商家应该根据这类评论,找到消费者给予消极评论的原因,并不断改进商品或改善服务等。
(2)规范消费者评论。评论网站应该引导消费者对商品做出规范的评论,如应该尽可能地描述商品的特性、功能等属性,或结合自身的使用体验阐述商品的优缺点等,给潜在的消费者提供真实可靠的信息。
(3)对不同品牌的商品评论有所侧重。本文研究表明,商品品牌对评论者排名和购买经验对评论有用性的影响具有调节作用,评论网站或商家可以根据商品品牌的市场定位,将消费者最关注的评论以不同的方式呈现,这样可以减少消费者的搜索成本,同时增强其购买欲望。
(4)提高网上商城或企业的应急处理能力。研究表明,在线商品评论会影响消费者购买行为,如果出现排名靠前且有购买经验的评论者,利用其自身优势在商品页面虚假信息的情况,为避免给商家和潜在消费者造成重大损失,需要网上商城和企业时时关注信息更新,并建立一套有效的应急管理方案,积极采取补救措施。
当然,本研究还存在不足。首先,用评论的字数来度量其深度不够精确,因为有些评论虽然篇幅很长,但是包含的有用信息不多,对消费者而言价值有限。其次,用评论者排名来度量评论者属性不够全面,可将评论者的学历、年龄、网络购物时间等作为研究因素。为此,本文的后续研究将引入文本挖掘方法,用文本的特征等属性来度量其深度,同时区分商品类别,比如分为搜索型商品和体验型商品,从而更全面更深入地研究影响评论有用性的因素。
参考文献:
[1]Godes D,D Mayzlin,Using Online Conversation to Study Word-of-mouth Communication[J].Marketing Science,2004,23(4):545-560.
[2]中国互联网信息中心(CNNIC).2009年中国网络购物市场研究报告[R],2009,(11):38- 42.
[3]Ghose A,P Ipeirotis,A Sundararajan.The Dimensions of Reputation in Electronic Markets[J].Working Paper,New York University,2005,(12):02.
[4]Susan M,Mudambi,David Schuff.What Makes a Helpful Online Review? A Study of Customer Reviews on [J].MIS Quarterly,2010,1(34):185-200.
[5]菲利普.科特勒,凯文.莱恩.凯勒.营销管理[M],上海人民出版社,2009,11.
[6]Kevin Lane Keller,Donald R Lehmann.Brands and Branding:Research Findings and Future Priorities [J],Marketing Science,2006,25(6):740-759.
[7]王,周学春.象征型品牌的效应——从意义到忠诚[J],管理科学,2011,24(4):41-53.
[8]Krosnick J A,Boninger D S,Chuang Y C,Berent M K,Camot C G.“Attitude Strength:One Construct or Many Related Constructs?” [J],Journal of Personality and Social Psychology,1993,65(6):1132-1151.
[9]Pavlou P,Liang H,Xue Y.Uncertainty and Mitigating Uncertainty in Online Exchange Relationships:A Principal-Agent Perspective [J],MIS Quarterly,2007,31(1):105-131.
[10]Forman C,Ghose A,Wiesenfeld B.Examining the Relationship Between Reviews and Sales:The Role of Reviewer Identity Disclosure in Electronic Markets [J],Information Systems Research,2008,19(3):291-313.
[11]彭岚,周启海,等.消费者在线评论有用性影响因素模型研究[J],计算机科学,2011,8(38):205-207.
[12]关辉,董大海.品牌形象对消费者行为倾向影响的实证研究[J],中国流通经济,2007,7:42-45.
[13]B J Fogg,Hsiang Tseng.The Elements of Computer Credibility [J],Proceedings of the SIGCHI Conference on Human Factors in Computing Systems,1999,80-87.
[14]郭国庆,陈凯,等.消费者在线评论可信度的影响因素研究[J],当代经济管理,2010,10(32):17-23.
关键词:产品评论;SVM;搭配识别;情感分析
中图分类号:TP393 文献标识码:A 文章编号:2095-1302(2016)11-00-04
0 引 言
随着Web技术和电子商务的发展,越来越多的人在各大电商上对自己买过的产品发表评论,这些信息绝大部分代表着者的观点或主观情感。商家如果能够得到用户的这些反馈,将有助于商家的下一步生产和销售决策。而其他准备购买该商品的顾客也可以根据这些反馈来更好地帮助自己决定该商品是否值得购买。因此对这些情感信息进行有效的自动分析并构建相应系统成了当今的热门研究问题之一。
产品评论的挖掘分析主要是基于句子级别的情感分析,其主要任务有识别并获取产品的特征或属性,定位用户的主观性评论,抽取评论搭配,判别用户评论的褒贬[1]。本文构造的系统以属性词词典,情感词词典以及程度词词典和否定词词典为基础,通过SVM分类法对属性词和程度词的搭配进行识别,进而分析评论的褒贬。
1 相关研究
Probst等[2]利用监督学习技术抽取属性词―评论词关系对。Yohan等[3]基于LDA模型提出SLDA模型。实验表明,该类方法在抽取产品特征中有一定的效果。栗春亮等[4]利用百度百科和分词后相邻的词语同现比例来识别专业领域内的生词,在中文产品评论语料中设计词性组合模板来得到候选属性词集,然后利用一定的规则对其过滤。Qiu[5]等通过研究评价词和评价对象间的关系模式,提出用一种双向传播算法进行抽取。本文对产品属性词的抽取主要借鉴文献[4]中提到的方法,得到1 500个属性词,作为属性词词典。情感词典的构建方式主要有人工和基于词典两种。目前主要使用的词典有董振东和董强编撰的HOWNET情感词典和台湾大学编撰的NTU情感词典。Hassan等[6]使用马尔科夫随机游走模型计算词语的情感权值。柳位平等[7]在中文词语相似度计算方法的基础上提出了一种中文情感词语的情感权值计算方法,并以HOWNET情感词语集为基准,构建了中文基础情感词典。阳爱民等[8]选用若干个情感种子词,利用搜索引擎返回共现数,通过改进的PMI(Pointwise Mutual Information,PMI)算法计算情感词的情感权值。李寿山等[9]借助机器翻译系统,结合双语言资源的约束信息,利用标签传播算法(LP)计算词语的情感信息。本文主要根据文献[8]提出的方法,构建一个在产品评论分析中使用的情感词典,部分词如图1所示。程度词和否定词词典使用王文华等[10]提出的相应词典。
词集 极性 情感词
P_set 正向 著名,好,积极,和谐,青春,成熟,善良,文明,出色,舒服,纯真,得体,美丽,创造力,宽容,昌盛,感激,优秀,美好,灿烂,诚实,给力,帅呆,霸气,淳朴,漂亮,美妙,辉煌
N_set 负向 罪恶,诅咒,暴殄天物,郁闷,傻逼,变态,惨不忍睹,痛苦,垃圾,失败,委屈,毛病,扭曲,诡异,畸形,悲惨,崩溃,弱爆,狠毒,假冒,水货,粗暴
对属性词和情感词的搭配识别可以看成是一个分类问题,常用到的分类算法包括朴素贝叶斯分类器(Naive Bayesian Classifier)、基于支持向量机(Support Vector Machine,SVM)的分类器、k-最近邻法(k-Nearest Neighbor,kNN)、决策树(decision tree)分类法、最大熵模型(Maximum Entropy, ME)等,本文使用SVM作为搭配识别的分类器,搭配规则使用文献[10]中提到的8条规则。
2 情感分析系统的需求分析和设计目标
2.1 需求分析
产品评论情感分析系统用来对电子商务网站上的产品评论进行搜集分析。
(1)该系统首先对某个站点进行页面抓取、内容提取,得到用户对产品的大量评论信息;
(2)进行分词、关键信息抽取;
(3)对这些评论信息进行分析,挖掘出用户对产品各种属性的情感倾向以及对整个产品乃至商家的褒贬倾向;
(4)将结果进行展示,从而有效辅助希望购买产品的用户进行合理的消费判断,同时也能够帮助产品生产商做下一步生产和销售决策。
根据这些需求,可以对本系统做出如下需求分析:
(1)能够抓取产品评论页面并能对页面中的评论内容进行提取。
(2)能够从评论文本中抽取情感信息。
(3)能够有效搭配识别分类。
(4)能够准确进行属性情感极性分析和文本情感的倾向判断。
(5)预留开发接口,能方便的对搭配识别分类算法进行更改。
(6)能够将结果以用户易于理解的方式展示出来。
由此可以得出图2所示的产品评论情感分析系统的工作流程。
2.2 设计目标
通过需求分析,可以将系统功能划分为网页抓取及页面内容提取模块、情感信息提取模块、情感分析模块。
(1)网页抓取及页面内容提取模块实现网页抓取及页面文本提取的功能。
(2)情感信息提取模块负责从抓取到的页面或者用户自定义的文本中抽取出关键情感信息。
(3)情感分析模块对情感信息提取模块抽取出的关键情感信息进行情感分析,得出结论。
对中间信息以及最后的结论信息进行存储,并通过用户容易理解的方式进行结果展示。一个优秀的软件系统首先要实现系统需要的各个功能模块,其次要达到系统的性能指标,最后还要为用户提供高可靠性的服务。所以,系统设计时应当考虑到如下几个方面:
(1)功能性。本系统该实现需求分析中提出的各项功能。
(2)有效性。能够对产品评论进行有效的情感分析。由于使用现有语料进行的封闭性测试比直接采集互联网信息所得的结果低一些,因此系统对产品评论文本进行情感分析后的准确率要比算法设计过程中的测试结果高。
(3)易用性。系统应该操作方便,使用简单,展示的结果容易理解。
(4)可维护性。系统应该能够方便的对内置情感分析算法进行替换、维护,以便将来对算法进行改进。
(5)健壮性。系统应该运行稳定,出现意外后退出能重新启动。
3 情感分析系统的设计与实现
根据上节对系统进行的需求分析和目标设计,本节对整个系统的功能进行了划分,得出了图3所示的系统功能模块图。
图3将产品评论情感分析系统划分成评论信息获取模块、信息预处理模块、情感分析模块。
3.1 页面抓取
页面抓取模块主要用一个网络爬虫来完成。使用Apache的HTTP客户端开源项目HttpClient,HttpClient提供HTTP的访问主要通过GetMethod类和PostMethod类来实现,它们分别对应HTTPGet请求与HttpPost请求。具体抓取操作流程如图4所示。
3.2 页面内容提取
页面内容提取的方法很多,有基于统计的、基于规则的、机器学习的,还有基于DOM树的。基于DOM树的方法将页面中的内容和结果看成是一棵树。Java有一个非常实用的开源工具包HtmlParser,主要靠Node、AbstractNode和Tag等数据结构来构造HTML的树形结构,包括RemarkNode和TextNode。单个页面内容提取的流程图如图5所示。
在不同的网站中,页面内容的HTML标签不同,因此需要对不同网站设计不同的提取模板。在这里用正则表达式来区分不同的网站,首先将同一个页面提取模板的一组URL构造成一个或多个正则表达式,然后判断网页的URL与正则表达式是否匹配,进而选择页面提取模板。
3.3 分词模块
中科院计算所开发的ICTCLAS(Institute of Computing Technology,Chinese Lexical Analysis System)分词系统是目前世界上较好的中文分词系统,本文使用其Java版本ICTCLAS4J。使用MyLexicon类描述分词模块,该模块的成员如图6所示。
addDictionary(fileName)方法使用ICTCLAS4J提供的ICTCLAS50类的ICTCLAS_ImportUserDictFile(usrdirb, n)方法,该方法返回导入用户词语个数,第一个参数为用户字典路径,第二个参数为用户字典的编码类型。textProcess(str)方法使用ICTCLAS50类的ICTCLAS_ParagraphProcess()方法分词。对得到的字符串按照空格分开,读取存放属性词典和情感词典的资源文件,对分割好的的每一个词与资源文件中的词语进行对比,提取出属性词和情感词,构成属性词集attrset和情感词集sentset。
3.4 分析预处理
分析预处理模块工作过程如下:
(1)在分词的基础上形成属性词集合和情感词集合;
(2)将两个集合作笛卡尔乘积得到形如若干三元组;
(3)根据8条搭配分析规则,形成原始模板;
(4)得到带有原始模板的扩展三元组。
用Preprocess类来描述分析预处理模块,该模块的成员如图7所示。
属性词集合、情感词集合、三元组、原始模板都用数组来描述,getTriple()、getPattern()为私有方法,该类只对外提供getNewtriple()方法。
3.5 搭配识别模块
这里使用林智仁等开发的libsvm软件包,在系统中,将该子模块封装成Classifier类,主要提供模型的训练和对新文本进行搭配识别的分类功能。该类的成员如图8所示。
libsvm的数据格式为: : :……
使用SVM分类器对文本进行分类,若返回值为1表示搭配,则将newtriple保存,用于下一步的情感分析判断;若返回值为-1则表示不搭配。precise(datapath, percent)函数用来对算法的准确度进行测试,包含datapath和percent两个参数。datapath表示训练数据所在路径,percent表示训练数据占总数据的比例,默认的percent取0.5,即随机取一半的数据作为训练,另一半数据进行测试。返回值为分类的准确率。
3.6 情感分析判断
根据节文本情感倾向判断过程进行的描述,得到图9所示的情感分析判断流程。
用Analysis类来描述情感分析判断模块。该类的成员如图10所示。
judge()方法用以判断sentiment的值,大于0为正向情感,小于0为负向情感。
4 结 语
整个系统操作界面由评论提取部分、输入(导入)评论部分和情感分析部分组成。用户在输入框中输入产品评论的地址,点击“提取评论”按钮后,系统自动将产品评论页面抓取下来并将评论提取出来,保存到默认路径下的文件中。点击“保存”按钮可以手动选择路径和保存的文件名。 用户要想对提取的评论进行分析时,可以点击“导入”按钮,选取指定的评论文件,此时文件中的内容将显示在文本框中,输入评论后,点击“情感分析”按钮即可将产品评论文本情感分析的结果显示出来,如图11所示。
对系统的准确性进行测试验证,选取两款不同的手机评论进行分析。分别从京东商城网站上的手机评论页面抓取评论,从中各选出600篇评论进行人工情感倾向判断,然后与系统的分析结果进行比对,统计分析正确的正负评论与计算准确率。计算结果如表1所示。
根据以上对两款不同手机的评论进行分析统计的结果可知,准确率分别为91.2%和90.8%,满足系统设计目标的准确性要求,表明系统能够对产品评论进行有效的情感分析。
参考文献
[1]魏,向阳,陈千.中文文本情感分析综述[J].计算机应用,2011,31(12):3321-3323.
[2]Probst K, Ghai M K R, Fano A. Semi-supervised Learning of Attribute- value Pairs from Product Descriptions[A]. IEEE Press, 2007, 2838-2843.
[3]Yohan Jo, Alice Oh. Aspect and Sentiment Unification Modelfor Online Review Analysis[A]. 2011.
[4]栗春亮,朱艳辉,徐叶强.中文产品评论中属性词抽取方法研究[J].计算机工程,2011,37(12):26-28.
[5] Liu G, Bu J, Chen C, et al. Opinion Word Expansion and Target Extraction Through Double Propagation[J]. Computational Linguistics, 2011, 37(1): 9-21.
[6]Hassan A, Radev D. Identifying text polarity using random walks [C]. Proceedings of Annual Meenting of the Association for Computational Linguistics(ACL-2010), Uppsala, 2010: 395-403.
[7]柳位平,朱艳辉,栗春亮,等.中文基础情感词词典构建方法研究[J].计算机应用,2009,29(10):2875-2877.
[8]阳爱民,林江豪,周咏梅,等.中文文本情感词典构建方法[J].计算机科学与探索,2013,7(11):1033-1039.