首页 > 其他 > 详细

kaggle比赛实践M5-数据集介绍

时间:2020-04-26 16:41:26      阅读:139      评论:0      收藏:0      [点我收藏+]

M5比赛

M5竞赛是M竞赛中最新的一次,将于2020年3月2日至6月30日举行。它与前四届竞赛有五个重要方面的差异,其中一些是M4竞赛的讨论者提出的。

  • 它使用沃尔玛慷慨提供的分层销售数据,从商品级别开始,再汇总到美国三个地理区域(加利福尼亚州,德克萨斯州和威斯康星州)的部门,产品类别和商店。
  • 除时间序列数据外,它还包括影响价格的解释变量,例如价格,促销,星期几和特殊事件(例如超级碗,情人节和东正教复活节),这些变量用于提高预测准确性。
  • 正在通过要求参与者提供有关四个指示性预测间隔和中位数的信息来评估不确定性的分布。
  • 在超过42,840个时间序列中,大多数显示间歇性(零销售,包括零销售)。
  • 代替具有单个竞争来估计点预测和不确定性分布,将有两个2个使用平行的轨道相同的数据集,所述第一要求28天向前指向的预测和所述第二28天提前为中位数和四个预测概率预报间隔(50%,67%,95%和99%)。
  • 第一次,它着重于显示间歇性的序列,即偶发的需求,包括零。

目标

M5竞赛的目标与前四个相似:即针对需要预测并进行不确定性估计的不同类型的情况,确定最合适的方法。其最终目的是推进预测理论并提高商业和非营利组织的利用率。它的另一个目标是将ML和DL方法的准确性/不确定性与标准统计方法的准确性/不确定性进行比较,并评估可能的改进与使用各种方法的额外复杂性和更高的成本。

期望与方法内容

鉴于前四届M竞赛的成功,吸引了众多参与者,并且做出了巨大贡献,从根本上改变了预测领域,针对快速发展的数据科学的M5竞赛有望取得相似甚至更高的成就。

社区,可以轻松访问M5数据集。它将使用Kaggle平台运行,预计参与者人数将达到数千。

kaggle比赛实践M5-数据集介绍

原文:https://www.cnblogs.com/wqbin/p/12780549.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!