您好,欢迎访问长三角智库平台

上传文档

当前位置:首页 > 长三角智库 > 新基建 > 大数据中心

【大数据】基于国网商旅大数据融合背景的用户画像构建(下)

  • 管理员
  • 36 次阅读
  • 0 次下载
  • 2020-11-11 11:54:46

还剩... 页未读,继续阅读

免费阅读已结束,点击付费阅读剩下 ...

¥ 1 元,已有36人购买

付费阅读

阅读已结束,您可以下载文档离线阅读

¥ 1 元,已有0人下载

付费下载
文档简介:

基于国网商旅大数据融合背景的用户画像构建(下)2020-03-30数据采用国网商旅2018年全年用户数据[11],包括业务审批、差旅控制、票务预订、酒店评价等信息。计算数据表中字段与用户敏感度之间的基尼指数,结合用户数据完整性因素,最终确定差旅管理、预算控制、报销流程3类信息的业务类型编码、单位编码、预定方式、结算方式等字段用于特征提取[12]。选用F1-score作为结果评价指标,F1-score是分类问题的一个衡量指标,是精确率(precision)和召回率(recall)的调和平均数,只有精确率和召回率两者都取较高数值时F1-score才能得到较高得分。首先计算精确率,精确率为被分类器判定为正例的正样本的比重;召回率指被预测为正例的占总的正例的比重:其中,TP为预测答案正确,FP为错将其他类预测为本类,FN为本类标签预测为其他类标签。然后计算每个类别下的F1-score,计算方式如下:最后计算各个类别下的F1-score平均值,得到最终评测结果,计算方式如下:4.2对比实验在训练特征等条件相同的情况下对梯度提升回归树模型(gradientboostingdecisiontree

管理员
管理员
  • 60287

    文档
  • 22.4

    金币
Ta的主页 发私信

60287篇文档

评论

发表评论
< /5 > 付费下载 ¥ 1 元
Copyright © 长三角智库平台 All Rights Reserved. 沪ICP备20011950号-1
×
保存成功