客服中心话务预测模型应用实践

简介:

一、课题背景

客服中心运营管理主要包括话务预测与排班、应急管理、运营现场秩序管理、监控管理等内容。可见做好话务预测,是客服中心现场运营管理中的第一环节,也是最重要的一个环节。只有准确的话务预测,才能精准地进行客服专员需求测算和排班工作,从而保证服务水平,提高人员利用率,降低人力成本。话务预测可以从小时、日、月、年等多时间维度进行预测,细化调整人力资源的分布,同时年度话务预测,对下一年度人员招聘计划起到较大的指导作用。如客服中心年度人员缺口、特殊需求时间点等。总之,提高话务预测准确性,才能保证现场运营平稳、有序,其重要性凸显于运营管理的各个环节。

二、影响话务的几个因素

笔者所在的电力行业客服中心分中心服务13家省公司,服务范围大,影响话务的因素多,主要包括天气情况、业务特点、电力突发故障、电网建设差异、特殊日等。

(一)天气情况

1、恶劣天气:雷雨大风、冰雹、暴雪、强降雨等;

2、特殊季节:如在七、八、九月份的迎峰度夏、一、二月份的迎峰度冬期间,除恶劣天气的影响外,客户使用空调较多,用电负荷大,容易导致电压过低,为避免电力设备超负荷运行,保护系统会自动切断电路,导致停电。 故每天负责话务预测与排班的人员要关注次日省公司天气情况,进行异常天气信息预警,为客服部话务预测、现场排班提供有效数据支撑。

(二)业务特点:因一些省公司具有先用电后付费的业务特点,每月底至次月初,部分供电公司实施欠费停复电,期间客户查电费、缴费后复电等咨询类电话较集中。

(三)电力突发故障:电力设施作为自然体,出现故障是不可避免的,不可抗力对电力设施的破坏影响了设施的稳定运行。故障停电后 ,为了避免大面积停电现象的发生,供电公司需要停电消除故障。

(四)电网建设差异:国家电网公司战略目标中提到要建设成“电网坚强”的现代公司。为了提高电网运行能力,供电公司需要对电网设备进行月度、季度检修。季度检修在每年的春季、秋季进行,主要对电网设施的运行、维护、检修工作,涉及变电站全站停止运行,由该变电站供电的线路同步进行检修,故春季、秋季检修影响范围较广。

(五)特殊日:节假日或非工作日,例如春节、国庆、重大政治类活动等,期间供电公司进行保电优质服务,不安排计划停电检修,相对话务量较低。

剖析完影响话务的因素,在结合历史话务曲线进行预测时,对趋势波动的原因就清晰自明了。下面详细说明话务预测过程。三、话务预测数据清洗

(一)基础数据选择

1、时间周期选择。笔者所在的电力客服中心在2014年底实现了全网全业务统一集中运营,所以2014年前数据不够完善,本次进行话务预测分析时选用2015年度数据作为数据源。在年度、月度、周等维度选择中,因年度和月度的基础数据较少,本次预测使用“周”维度进行预测。

2、地域选择。因各省存在天气情况和业务特点的差异,故话务预测以单个“省”为单位进行,所有服务区域省预测量叠加即可得到分中心预测总量。本次选择的某省份是2014年6月实现了全业务集中,经过半年的磨合和沉淀,2015年的数据趋于稳定,且该省迎峰度夏话务数据特征明显,有代表性。

(二)数据清洗

话务预测的目的是为人员排班提供支撑,故数据源应为人工服务请求量,不包含自助话务量。

图一为某省2015年度周人工请求量(原始数据),图中出现了几个话务量的峰值点(如第32周左右),这些峰值点被考虑为离群值,根据影响话务的因素,经核实,第32周左右为7月底8月初,是迎峰度夏的高峰期,造成话务量突增,从图中也可以看出数据具有明显的月周期性。

20160617033427158.png

  图一:某省2015年度周人工请求量

数据清洗是对数据进行重新审查和校验的过程,目的在于纠正存在的错误,并提供数据一致性。这里需要注意几个细节问题:

1、清洗规则。因话务量受季节性因素影响较大,所以在年度数据清洗时,先计算出每月话务量均值,高于均值50%(这个比例不是绝对的)的数值利用条件格式进行筛选清洗,由其前后数据均值进行替换,进而求出每周话务量和。这样做可避免舍弃月份差异导致话务量波动的参考数据,符合话务特点。

2、统一口径。在日期转换为周时,利用weeknum函数时,这里把周一作为每周的第1天,故选定第二参数为“2”。2015年1月1日至4日为第1周(如表1:年度首周天数),2015年12月28日至12月31日为第53周,均为4天。这里折算时让该阶段的话务量除以实际天数4再乘以7,实现数据的统一口径,如下表1:统一口径数据清洗。

20160617033427266.png

四、话务预测数据模型应用实践

本次使用三种预测模型,分别为最小二乘法、移动平均法和指数平滑法。下面分别从原理、公式和不同参数试算验证准确性进行阐述。

(一)最小二乘法

原理:寻求与给定点(i=0,1,…,m)的距离平方和为最小的曲线,通过最小化误差的平方和寻找数据的最佳函数匹配,采用残差平方和最小的准则。

公式:y = a + b x

参数关系:最小二乘法是从清洗后的数据中寻求变量之间的依赖关系,由得到折线图和散点图计算出预测值与实际值产生的偏差,称之为残差,用R表示,当然偏差越小越好, 但由于其可正可负, 因此总偏差不能很好地反映了变量之间的关系, 因为此时每个偏差的绝对值可能很大,为了改进这一缺陷, 就考虑用残差的平方R2来代替。但是由于绝对值不易作解析运算, 因此, 进一步用来度量总偏差,因偏差的平方和最小可以保证每个偏差都不会很大, 于是问题归结为确定其中的常数和使残差平方为最小。

利用LINEST函数计算出直线的斜率a和截距b,添加趋势线,见图二,得出

y = 242.79x + 41614,R2 = 0.1357。

20160617033428858.png


图二:最小二乘法趋势线

通过数据分析-回归得出拟合图和残差图20160617033428169.png

  图三:散点拟合图

20160617033428241.png


图四:残差图

从图三中可以看出这些点大致散落在某直线近旁,可以认为变量之间的关系为线性一元函数。但话务量月度变化趋势较明显,比如第31至33周即7月27日至8月10日之间,迎峰度夏的高峰期,残差较大,如图四。经计算得预测准确率在±15%范围的数值占比为69.23%。

(二)移动平均法

定义:根据时间序列逐项推移,依次计算包含一定项数的平均,以此进行预测的方法。

1、一次移动平均法

公式:Ft=(At-1+ At-2+ At-3+…+ At-n)/n

式中,Ft –对下一期的预测值;

n—跨越期数;

At-1—前期实际值;

At-2、 At-3和 At-n分别表示前两期、前三期直至前n期的实际值。

可见:各元素的权重都相等。

分别取n=3、n=5、n=8计算出预测值、预测准确率、误差平方,预测准确率按照“(实际值-预测值)/实际值”计算得出三条预测准确率曲线(见图五),经计算,预测准确率在±15%范围的个数占比分别为66.00%、62.50%、46.67%,准确率都较低(见图五)。

20160617033428904.png

图五:一次移动平均法话务预测准确率

20160617033428791.png

图六:一次移动平均法话务预测准确率占比图

2、二次移动平均法

原理:一次移动平均计算完毕后,形成一个新的时间序列,对它再求二次移动平均值,做出一次移动平均数和二次移动平均数的差值,将差值加到移动平均数上,并考虑趋势变动值。特点:考虑趋势变动值,突破一次移动平均法的局限性,加大了预测范围。

公式:Ft+T =at + btT,

at= Mt’ + (Mt’- Mt’‘)=2 Mt’– Mt’‘

bt=(Mt’ –Mt’‘ )

Ft+T— t+T的预测值,

t—本期

T—本期到预测值的间隔数

Mt’ —一次移动平均数

Mt’‘ —二次移动平均数

图七为n=3 、n=4时运用二次移动平均法的计算结果,经计算,预测准确率在±15%范围的个数占比分别为61.70%、60.00%,准确率较低。

20160617033428417.png


图七:二次移动平均法话务预测准确率

3、移动平均法小结

由一次移动平均法和二次移动平均法得出的预测准确率对比图,可见,在项数n的选择上,n越大对预测的平滑影响越大,滞后于实际数据的偏差也越大,n太小不能有效消除偶然因素的影响。移动平均法预测在该次数据试算中预测准确率表现不佳。

(三)指数平滑法

原理:因时间序列的态势具有稳定性或规则性,所以可被合理地顺势推延。最近的过去态势,在某种程度上会在未来持续,所以将较大的权数放在最近的资料上。

特点:指数平滑法兼容了移动平均所长,不舍弃过去的数据,其包含的信息量是全部的历史数据,但是仅给予逐渐减弱的影响程度,即随着数据的远离,赋予逐渐收敛为零的权数。

1、一次指数平滑法

原理:任一期的指数平滑值都是上期实际值与当期指数平滑值的加权平均。

公式:St+1= αXt+(1-α)St

a–平滑常数,其取值范围为[0,1];

下图为α=0.3 、α=0.5、α=0.8时运用一次指数平滑法的试算,见图十。其中S1用X1代替,故序号1中α取任意值,该点的预测准确率均为0.00%,不计入试算点的占比中。由图可见,α取不同值时,预测准确率差异不大,计算得预测准确率在±15%范围的个数占比分别为66.67%、70.59%、76.47%,准确率相对前两种方法有改善。

20160617033429479.png


图八:一次指数平滑法话务预测准确率

2、二次指数平滑法

公式:Ft+T =at + btT,

at= Mt’ + (Mt’- Mt’‘)=2 Mt’– Mt’‘

bt=(Mt’ –Mt’‘ )

运用二次指数平滑法,分别取α=0.3 、α=0.5、α=0.8时计算,结果见图十一。其中S1仍用X1代替,该点的预测准确率均为0.00%,不计入试算点的占比中。由图可见,相对一次指数平滑法,α取不同值时,二次指数平滑法预测准确率三者差异较大,经计算,预测准确率在±15%范围的数值占比分别为61.54%、78.85%、88.46%,准确率整体较高。

20160617033429685.png

  图九:二次指数平滑法话务预测准确率

五、结论三种预测公式在不同参数情况下的预测准确率对比,如表3。

20160617033429375.png

  表3:一次指数平滑法话务预测准确率

由表3可见,三个话务预测模型在本次数据试算中,相对来说指数平滑法的预测准确率较高,对比一次和二次指数平滑法,二次指数平滑法预测率更高一些,在α=0.8时,预测准确率在±15%范围的数值占比能达到88.46%的较好水平,拟合度较高,见图十。

20160617033429196.png

  图十:指数平滑法预测准确率对比

需要特别说明的是,不同行业适用不同的预测模型,根据预测维度的不同预测模型的准确率也可能有不同,每种模型式有它的适用范围,不能一概而论地认定某种预测模型好用或者更准确,各种公式需要我们不停地去试算、验证、分析,才能更深层次地挖掘出各种公式的精髓,找出适合自己现场运营特点的最优预测公式。在此感谢周逸松老师的指导,为笔者对话务预测进一步研究奠定了基础,同时希望更多现场运营人员对话务预测这块“敲门砖”倾力研究和探讨。


本文转自d1net(转载)

相关文章
|
24天前
|
弹性计算 安全 前端开发
除了 Mattermost,这些开源 IM 应用也值得一试
在数字化时代,即时通讯(IM)已成为日常生活和工作的重要部分,开源IM应用因其透明度、可定制性和社区支持受到关注。
|
1月前
|
机器学习/深度学习 自然语言处理
基于深度学习的自然语言处理技术在智能客服系统中的应用
【2月更文挑战第21天】随着人工智能技术的不断发展,自然语言处理(NLP)技术在各个领域得到了广泛应用。本文主要探讨了基于深度学习的自然语言处理技术在智能客服系统中的应用。首先介绍了深度学习和自然语言处理的基本概念,然后分析了智能客服系统的工作原理和技术要求,接着详细阐述了基于深度学习的自然语言处理技术在智能客服系统中的具体应用,包括语义理解、情感分析和问答系统等。最后对基于深度学习的自然语言处理技术在智能客服系统中的优势和挑战进行了总结。
42 1
|
8月前
|
负载均衡 网络协议 安全
TCP 长连接层的设计和在 IM 项目的实战应用
TCP 长连接层的设计和在 IM 项目的实战应用
|
存储 缓存 移动开发
im 应用多点登录和消息漫游架构
im 应用多点登录和消息漫游架构
im 应用多点登录和消息漫游架构
|
XML JSON 编解码
IM通讯协议专题学习(八):金蝶随手记团队的Protobuf应用实践(原理篇)
本文将基于随手记团队的Protobuf应用实践,分享了Protobuf的技术原理、上手实战等(本篇要分享的是技术原理),希望对你有用。
160 0
IM通讯协议专题学习(八):金蝶随手记团队的Protobuf应用实践(原理篇)
|
消息中间件 负载均衡 安全
钉钉 IM 的 RocketMQ 应用实践 | 学习笔记
快速学习钉钉 IM 的 RocketMQ 应用实践
209 0
钉钉 IM 的 RocketMQ 应用实践 | 学习笔记
|
人工智能 自然语言处理 搜索推荐
AI客服替代优势尽显 需求匹配与普及应用尚待时日
以对话式AI技术为核心的新一代智能客服逐步走向成熟,为客服中心解决客户数量大(呼叫量高峰)、范围广,以及人工服务效率不高等诸多痛点,为提升营销服务质效,实现业务成果的最大化提供了新思路。
104 0
AI客服替代优势尽显 需求匹配与普及应用尚待时日
|
消息中间件 负载均衡 安全
钉钉 IM 的 RocketMQ 应用实践
最近几年,钉钉迅速成为一款国民级应用。IM作为钉钉最核心的功能,每天需要支持海量企业用户的沟通,同时还通过 PaaS 形式为淘宝、高德等 App 提供基础的即时通讯能力,是日均千亿级消息量的 IM 平台。
钉钉 IM 的 RocketMQ 应用实践
|
JSON 缓存 安全
开源IM项目OpenIM发布消息推送api,支持应用与IM互通深度融合
开源IM项目OpenIM发布消息推送api,支持应用与IM互通深度融合
1422 0
开源IM项目OpenIM发布消息推送api,支持应用与IM互通深度融合
|
算法
探索图论在IM集群环境下的应用
我在工作中遇到了IM集群环境下消息路由问题,当集群数小时可以用内存共享的方案,当集群结点变多时,共享的数据同步会成为系统的瓶颈,为此我从网络中TCP报文的路由原理得到灵感,想了一个不用共享内存的方案,而且理论上支持大规模的集群。
620 0

热门文章

最新文章