您好,欢迎访问三七文档
当前位置:首页 > IT计算机/网络 > 数据库 > 基于大数据的运营商投诉与故障关联分析解决方案自述
解决方案Solution学校:沈阳理工大学队员:左甜甜徐春雨张雨薇于渤指导教师:赵运弢解决方案2应用数据挖掘类的工具分析数据,在此基础上建立基于故障的投诉预测模型,并以部分投诉数据对模型进行了验证。企业通过模型可以预测客户因故障投诉的可能性,并利用数据分析结果优化网络、提升客户服务。本作品以沈阳移动运营商提供的2014年9月投诉工单与故障数据作为研究对象。3建模过程1对数据的初步理解1.故障发生与各个特征的关系2.对投诉原因的初步分析2主要因素的提取用OLAP分析方法提取影响顾客因故障投诉的主要因素3关键因素的提取用回归分析算法来确定每个特征值和目标值之间的相关关系4建立基于故障的投诉预测模型运用BP神经网络技术建立基于故障的投诉预测模型41.对数据的初步理解故障发生与日期关系折线图5故障发生与区域关系散点图A:基础通信.互联网业务B:基础通信.话音基本业务C:基础通信.消费类业务D:基础通信.语音增值业务E:其他F:自有业务客户投诉与日期关系散点图客户投诉原因饼状图2.主要因素的提取6采用OLAP分析进行主要因素的提取。为了表现更加直观,符合用户使用的习惯,本作品把最终分析的结果用EXCEL表格的形式输出(即OLAP旋转透视表)。为了表述方便,本作品把因故障投诉客户用1来表示,非故障投诉客户用0来表示。对于“投诉场景”这一因素的OLAP分析EXCEL展示如表所示:78根据OLAP分析方法得出的主要因素有:时间段(time.csv)、区域(area.csv)、投诉场景(scene.csv)、客户品牌(brand.csv)、客户级别(level.csv)。将序号、主要因素以及投诉原因用数字代替后的值提取到新的csv文件“main_factors.csv”中,部分数据如下:序号时间段区域投诉原因场景品牌级别样本1投诉时间:7:32浑南新区其他全球通VIP五星金因故障投诉173134613.关键因素的提取91.对主要因素应用线性回归算法来分析每个因素(特征值)和目标值之间的相关关系,从而判断其是否为关键因素。五个关键因素与目标值之间的关系如右图所示:2.用方差来评价回归模型,方差越接近0,说明预测结果越准确。函数如下linear_model.LinearRegression().score(xi_test,y_test)时间段区域投诉场景客户品牌客户级别10根据OLAP分析方法得出的关键因素有:时间段(time.csv)、区域(area.csv)、投诉场景(scene.csv)、客户品牌(brand.csv)、客户级别(level.csv)。将序号、关键因素以及投诉原因用数字代替后的值提取到新的csv文件“key_factors.csv”中,部分数据如下:序号时间段区域投诉原因场景品牌级别样本1投诉时间:7:32浑南新区其他全球通VIP五星金因故障投诉173134614.基于故障的投诉预测模型11基于BP神经网络的客户投诉值计算模型:输入层节点数为关键因素的个数5输出层节点数为2,分别是因故障投诉值,非故障投诉值隐藏层数为1,隐藏层节点经测试确定为8因故障投诉值关键因素1关键因素2关键因素3关键因素4关键因素5𝑊ij(1)(1)𝑊ij(2)非故障投诉值样本1投诉时间:7:32浑南新区其他全球通VIP五星金因故障投诉173134614.1基于故障的投诉预测模型验证12经过基于BP神经网络的预测模型后的预测结果截图:数据量和维度:训练集与测试集数据分布:预测模型表现情况:4.2基于故障的投诉预测模型结论分析及建议13模型的预测准确率经调参为93%,初步效果良好,如果数据更丰富,提供的可能因素更多,数据量更大,那么得到的效果会更好。1.减少投诉处理成本2.改进企业产品3.提升客户满意度4.优化网络的资源配置谢谢观赏!
本文标题:基于大数据的运营商投诉与故障关联分析解决方案自述
链接地址:https://www.777doc.com/doc-5550182 .html