【大数据】基于国网商旅大数据融合背景的用户画像构建(下)
- 管理员
-
36 次阅读
-
0 次下载
-
2020-11-11 11:54:46
文档简介:
基于国网商旅大数据融合背景的用户画像构建(下)2020-03-30数据采用国网商旅2018年全年用户数据[11],包括业务审批、差旅控制、票务预订、酒店评价等信息。计算数据表中字段与用户敏感度之间的基尼指数,结合用户数据完整性因素,最终确定差旅管理、预算控制、报销流程3类信息的业务类型编码、单位编码、预定方式、结算方式等字段用于特征提取[12]。选用F1-score作为结果评价指标,F1-score是分类问题的一个衡量指标,是精确率(precision)和召回率(recall)的调和平均数,只有精确率和召回率两者都取较高数值时F1-score才能得到较高得分。首先计算精确率,精确率为被分类器判定为正例的正样本的比重;召回率指被预测为正例的占总的正例的比重:其中,TP为预测答案正确,FP为错将其他类预测为本类,FN为本类标签预测为其他类标签。然后计算每个类别下的F1-score,计算方式如下:最后计算各个类别下的F1-score平均值,得到最终评测结果,计算方式如下:4.2对比实验在训练特征等条件相同的情况下对梯度提升回归树模型(gradientboostingdecisiontree
评论
发表评论