学术活动
首页 /  科学研究 /  学术活动 /  正文

学术讲座回顾:“澳门永利yl6776会计学科教师与研究生系列Seminar”之六十七

编辑者:刘银燕 | 发布时间:2020-10-08

题 目:给机器人老板一个假笑?人工智能应用于业绩评估对员工情绪劳动的影响

报告人:陈亚盛 教授

主持人:申屠李融 助理教授


2020年929日下午,在第六十七期澳门永利yl6776会计学科教师与研究生系列Seminar”上,陈亚盛教授报告了其与学生的研究成果:《给机器人老板一个假笑?人工智能应用于业绩评估对员工情绪劳动的影响》。以下为讲座报告内容概要。


 

随着社会科技的发展,当今世界,机器正在从体力劳动方面到脑力劳动方面替代着人类。那么这意味着机器,尤其是人工智能AI,能完全替代人类呢?答案是否定的,因为人类的感情特质难以为机器所模仿。例如,人类可完成同时具备体力劳动和脑力劳动特征的情绪劳动,正是其中之一。情绪劳动,即员工(如服务业的销售人员)对情绪的管理,要求员工在工作时展现某种特定情绪(面部语言和肢体语言)以达到其所在职位工作目标的劳动形式(Hochschild,1983)。它是独立于体力和脑力劳动的新型劳动形式,也是人工智能时代人类最不容易被机器人替代的劳动形式。情绪劳动有三个要素,分别是情绪要求(emotional requirements)、情绪管理(emotional regulation)和情绪表现(emotion performance)。情绪要求是为特定工作情境而设定的情绪展现规则,如海底捞会要求员工在给顾客提供服务时要保持微笑。情绪管理即员工对自己的情绪进行控制,它有两个层面,一种是浅层动作(surface acting),也就是戴上情绪的面具,装装样子,在工作中装出所需要的情绪,而不会改变内心深处的感受。另一种则是深层动作(deep acting),也就是员工将自己完全投入于工作中所扮演的角色,努力调整内心的情绪,以适应工作岗位的要求。而情绪表现,就是员工按照情绪要求,管理和控制自身的情绪,在工作时通过面部表情与肢体行为将相应的情绪展现给需要面对的人,如眼神交流、微笑的频率和谈吐风格。举两个情绪劳动的例子,一个是销售员,在为顾客提供服务时,需面带微笑和保持热情;另一个就是保安,需要展示较为威严的表情,以给人一种距离感。


 

那么,是否可基于情绪劳动而设置相应激励系统,来提高工作的效果和效率,减少工作成本呢?

 

员工激励措施的设置有两种策略:基于结果的激励(outcome-based incentives,OBI)和基于过程的激励(behavior-based incentives,BBI)。OBI强调的是工作实现的成果,即你做了什么,它的优势在于能够保持客观且实施成本较小(Garbers & Konradt, 2014),但它无法顾及到工作过程中出现的无法控制的随机因素(Beal et al., 2003)。相比而言,BBI则关注工作的过程,即你是如何做的,它能够规避工作过程中无法控制的因素,且有利于改善员工的工作表现(Balkin et al,2000; Makri et al,2006)。OBI被采纳的较多,而BBI的采纳却存在着业绩衡量的问题:如何来衡量?用人工还是用机器?人工评价可能带有一定主观性,且存在个人偏好的影响,员工倾向于认为人工评价存在更多的不确定性,故更愿意采纳浅层动作的策略;而机器评价(即使用AI评价)可能更加客观公正,不带偏见,员工在工作中可能更倾向于采纳深层动作策略。事实上,亚马逊已经采用了人工智能来衡量员工的工作效率,并以此为基础,解雇工作效率低的员工,以从整体层面提高效率和降低成本。另一个例子就是美团外卖,用大数据和人工智能技术,不断缩短外卖小哥的送货时间,甚至作出了两年内平均每单缩短10分钟的惊人提高。然而,这种以机器评价为基础的BBI,自然也是没少受争议。面对冷冰冰的人工智能,亚马逊员工认为自己被当做了机器来对待,而美团的外卖小哥为了赶时间以达到规定标准,也出过交通事故。

 

那么,OBI、以人工评价为基础的BBI和以机器评价为基础的BBI,哪个激励系统效果会更好呢?本文设计了实验加以探索和验证。实验对象为某商场中的64个销售人员。剔除因实验过程中的意外等因素而无法使用的样本后,有效样本为59个。样本均为女性,其中超4成的人员年龄段为31-40岁,过半高中毕业。样本被分为三组,分别以三种激励系统为基础进行评分与奖励。奖励随分值的提高而增加,最高分奖励80元,最低分奖励20元。三组均被要求录一段推销某品牌榨汁机的视频,并分别被告知评分结果基于目标客户的购买意图(OBI)、AI识别的面部表情得分(基于机器评价的BBI)和人工评定的面部表情得分(基于人工评价的BBI)。文章采用了Empatica E4 Wristband这种设备衡量被试的情绪变化,受试者将它戴在手上,就像戴手表一样,但它可在实验中记录受试者的皮电反应(EDA),进而产生数据以衡量不同实验条件下被试的深层情绪。实验大致流程如下:首先,让受试者们戴上前述设备,记录基数;其次,让她们阅读试验指南和报酬方法;再次,她们用5分钟的时间熟悉榨汁机的相关信息;最后让她们录下2分钟的推销视频,并邀请5名大学生对视频带来的客户满意度及购买意图打分。实验选取的三个因变量分别为:1. 浅层表现(surface expression),用Microsoft Azure开发的面部识别API衡量开心的程度。事先每个人的基准水平,然后在视频录制中以基准来衡量面部表情得分;2. 深层感觉(deep feeling),即用EDA的数据衡量;3. 结果表现(outcome performance),即用李克特量11级表衡量的客户关系满意度。


 

实验完毕并获取相应数据后,利用方差分析(ANOVA)和均值差异显著性检验等方法,发现的结果为以人工评价为基础的BBI所得的分数是最高的。可能的原因是现阶段的AI缺乏区分真笑假笑的能力,于是当受试者进行含有主观性、直觉和情感的任务时,可能对于采用AI来判断绩效感到不自然,认为它缺乏同理心和人的感情(Mende et al, 2019)。人们对AI缺乏信任,因为人们认为AI不能有人的感觉(Gary, 2017)。那么,在接受机器的评价时,员工自然就会倾向于认为假笑也能轻易地骗过AI,也能得分。只有基于人工评价的BBI,才能够有效激发员工的内在情绪,进而提高员工的劳动绩效。

 

本文在探索业绩激励系统对情绪劳动的影响中,提供了神经生物学层面的证据。其中,BBI相较于OBI更适合用于评价情绪劳动,尤其是人类管理人员作为监督者进行人工评价时,能够更好地进行评价。员工在AI机器评价时更倾向于采纳浅层动作的策略,而在人工评价体系下能够采纳深层动作,作出更好的表现,提供令顾客更满意的情绪劳动。因此在现实业绩管理中,需审慎考虑采用AI进行情绪劳动的业绩评价。