对于线上和线下的零售行业,销量预计都是一项至关重要的义务,它可以帮助企业更好的预备库存以及在各个仓库之间分配商品。特别是在大型购物节期间,强劲的促销活动将极大地促进消费。然而,可供参考的历史数据却非常稀缺。如何同时对城市的分歧地区和分歧时候段的销量举行预计,是一个非常具有挑战的问题。
在2020年12月收录的AAAI 2021(CCF-A类)上,京东城市被收录了一篇名为《Robust Spatio-Temporal Purchase Prediction via Deep Meta Learning》的论文。该论文研究了如何通过深度元进修,结合城市中的各项信息以及历史的销量数据,对未来,特别是大型购物节期间,城市中各个地区分歧时候段的销量举行预计。
一、背景
购物中心和商店的空间漫衍、人口的漫衍属性以及分歧的日期典型(例如,工作日,周末或购物节)等因素,将会导致分歧的购物方式,如图1所示。
由于来自某个一定地区以及一定时候范围内的数据过于稀缺,我们无法仅使用某个范围的数据去训练一个高精度的预计模型。同时,城市中分歧地区的人口密度和漫衍特性高度异质,并且随着时候的推移地区特性也会发生变化,对这样复杂的时空采购形式举行建模是一个非常困难的义务。
为了准确地拿获地区的空间特性,它需要考虑一组综合的空间特性,例如兴趣点(POI)漫衍,地区的人口统计特性等。如何通过跨时空建模进修提升单个地区在一定时候段的预计精度是我们的主要义务。
图1 空间漫衍
作者将该预计义务分为主要三个部分:
1)利用时空元进修推理,对分歧的时空地区生成对应的时空暗示;
2)进修分歧时空地区间的同享信息,同时结合地区一定的时空暗示,得到更加可靠的预计销量;
3)通过时空瓜代训练使得模型在空间以及时候层面都能够得到更加完善的进修。
图2 摊销网络
二、时空暗示生成
我们开发了一个摊销网络(如图2 Amortization Network 所示),以对目标地区和日期典型的时空暗示的近似后验漫衍举行建模,该模型需要同时考虑销量特性和相关空间特性的影响。
从图3(a)中我们可以看到,以北京为例,分歧城区的销量漫衍有着明显的区别。
要完全拿获分歧地区预计义务的采购数据的时候特性,还需要考虑历史销量数据之间的线性和非线性时候相关性,例如采购订单和购物车记录中所隐藏的周期形式。
图3(b)中我们能够看到明显的以周为周期的销量形式变化。为了对这种复杂而动态的时候序列形式举行建模,我们使用了线性变换模块来获得销量的大致基数,并使用一个特殊的跳跃LSTM层来拿获销量变化的非线性时候形式。接着,通过特性融合模块将提取的时候特性与静态特性相结合,以进一步支持构建更具有代表性的销量时空暗示。
图3 销量形式变化
三、时空销量预计
通过上一步,我们已经得到了一定时空地区的销量暗示。接下来我们将介绍一种利用同享统计结构的生成模型,来进修分歧时空预计义务间所同享信息。对于义务一定的预计,它大大提高了进修效率和预计准确性。该生成模型的结构可以参考上节所属的摊销网络结构的解码器(图2 Generative Model 所示)。
它使用两个分歧的输出来生成最终的销量。第一个输出侧重于通过对最近一段时候的输出销量,利用特性提取和融合技术来挖掘当前的采购暗示,该特性描述了近期的销量形式的变化。第二个输出是从摊销网络中采样的一定于某个时空预计义务的时空特性暗示。它拿获了目标义务的宏观时空形式。最后,生成模型使用完全连接的网络将两个输出合并,对目标时刻的销量订单举行预计。
四、时空瓜代训练
分歧的时空义务仅与来自一定地区和时候范围的有限数据相关联,无法完全描述一定地区的采购行为。受多视图进修的启发,我们构建了两种视图(空间视图和时候视图)来描述数据的分歧观点。两个视图相互补充,以增强进修到的信息并获得更准确的时空数据暗示。空间观点倾向于进修分歧地区的采购形式,而时候观点倾向于挖掘分歧时候段典型的时候变化形式。
训练期间在分歧视图之间举行切换可以在分歧地区或日期典型之间进修到分歧的时空信息。同时,在瓜代训练期间还能够整合分歧时空义务同享的生成模型,并提高了预计准确性。完整的训练过程如算法1所示。
算法1
五、实验
我们使用来自京东的海量高质量在线销量数据集来评估我们的模型。JD数据集包含时候跨度从2015年至2019年的采购订单,购物车数据(作为动态时候序列特性)和包括北京18个行政区块的地区特性(例如POI和人口统计资料数据)作为静态特性。
为了验证模型的有效性以及鲁棒性,作者对分歧时候区间(周内,周末,购物节等)的销量举行预计评估。同时还对模型中的分歧组件举行消融分析,对分歧组件的有效性举行评估,结果如表1所示。
表1 分歧组件的有效性表1中我们可以看到,对于平日较为平缓和购物节的爆发性预计设置中,STMP均优于所有基线方法。在MSE方面,STMP均比最佳基准提高了至少30%。在爆发性销量预计场景中,STMP仍比基准降低约30%至60%。这些结果表明,当实际采购形式与平时截然分歧时,我们的方法是有效且可靠的。
为了进一步研究STMP各个模型组成部分的影响,我们还在表1中比较了STMP及其变体的性能。可以观察到,STMP-VI在总体和周末情景中表现良好,这些情景具有相对稳定的采购形式,但在购物节上的表现要比STMP差。这是因为STMP-VI使用点估计而不是一定于义务的时空暗示的漫衍描述,当数据有限或形式高度不确定时,这会出现问题。
此外,与STMP或其他变体相比,STMP-SKIP的准确性较差,但仍优于其他基准。这证明需要考虑采购时候序列中的多个周期性形式。这也反映在图4(b)中,我们可以在采购时候序列数据中看到清晰的周期性形式。这些证明对数据中的多个周期性属性举行建模在提高模型性能方面起着重要作用。
图4为了探究模型在分歧地区以及时候段的效果,作者挑选了四个具有代表性的地区(覆盖分歧销量范围,详细地理位置请参见图4(a))将STMP与基线方法在整个2019年的销量数据上做可视化,如图4所示。在大多数地区,基线无法很好地预计购物节期间采购时候序列的突发性,例如中旬促销和11.11的采购高峰。他们倾向于给出保守的结果,并且只专注于提高整体准确性。但是,STMP利用分歧地区和日期典型的时空暗示来支持多义务少拍进修,以促进对一定地区和日期典型的更好预计。可以观察到,只有STMP能够准确地预计爆发式的销量(所有图6中的峰值)。
图5同时作者对于购物节历史数据的可参考情况举行了进一步的探究,在购物节销量数据非常稀缺的情况下,每增加一次购物节可见数据,精度会有一定的提升。然而即使在购物节可参考数据只有一次(持续大约一周)的情况下,STMP也具有较高的准确率,这表明了模型的鲁棒性。
表2最后,作者对时空瓜代训练方式在三个大型购物节上也做了比较。在时候训练中,合并操作将来自同一天典型的实例成批集成,而不考虑空间知识。同时,在空间训练中,模型将来自同一地区的一批实例集成在一起,而无需考虑时候信息。
从表2中我们可以看到,即使不完整的T训练和S训练也比表1列出的基线提供更高的准确性。但是,与完整的时空瓜代训练相比,缺乏时空上的联合元知识仍然会导致较低的准确性。这表明分歧的训练形式会跨地区和时候典型进修分歧的转换。从时空方面的补充训练可以有效地提高预计的准确性。
Powered by Froala Editor