实际上,直接做出租车(网约车)需求量预测的文章并不多,但这个问题可以归结为交通流预测。后续的基线对比也可以和交通流预测方面的基线进行对比。
从特征角度、模型角度、技术角度来进行总结。
特征角度
当不考虑模型结构,而是采用最简单的高维特征来预测出租车的需求量的话,
出租车需求量预测所需要的特征如下:[1]
基本特征
时间特征(Temporal Features)
- Month
- Day of month
- Day of week
- Hour
- Holiday
- Historical UOTD
平日,周末和全天的标准化每小时出租车需求分布图,可以看出需求在工作日和周末之间具有不同的时间模式。(工作日有两个高峰,分别代表早晨高峰和傍晚高峰。 在周末,晚上只有一个高峰。)
空间特征(Spatial Features)
- District
- POI name
- POI category
- Distance distribution
气象特征(Meteorological Features)
- Weather condition
- Temperature
- Wind
- Humidity
- Air quality
活动特征(Event Features)【影响打车者的动机】
- Discount pricing strategy
- Even-odd license plate plan
- Version of the App
组合特征
- 线性模型无法描述输入特征之间的相关性
- 将多样化的组合特征输入模型有助于从多尺度和多方面表征不同因素之间的相互作用,这是提高模型的预测能力的关键。
时时组合特征(Temporal-Temporal Combinational Features)
- 将一天中的小时和星期几作为一个组合功能
时空组合特征(Temporal-Spatial Combinational Features)
- POI类别和“小时”的组合将捕获出租车需求的这种时空依赖性
居住类POI和基础设施类POI的平均每小时标准化出租车需求图
气象空间组合特征(Meteorological-Spatial Combinational Features)
- 结合气象和空间特征的理由是,气象信息对出租车需求的影响因功能不同的POI而异。
- 雨天和非雨天娱乐场所和机场的平均每小时标准化出租车需求图【降雨对机场的影响不明显。娱乐场所的需求对降雨敏感】
其他组合功能(Other Combinational Features)
- 将POI,小时和天气组合为时空气象特征
相关的特征大概有100多种功能,这些功能包括2亿个维度。
总的特征表如下:
出租车需求预测
根据预测模型是否需要出租车轨迹,分为基于轨迹的预测和无轨迹的预测。
- 基于轨迹的预测:
缺点:轨迹信息并不总是与UOTD信息相关联。
- 基于无轨迹的预测:
论文的总结:
论文[1]提出了LinUOTD,一种用于预测大型在线出租车平台的单位原始出租车需求(UOTD)的统一方法。LinUOTD是具有超过2亿维特征的线性回归模型。 并且设计了一个时空正则化方案,一个分布式学习框架和一个基于散列的令牌化方法,以在大规模数据集上实现有效,并行和可扩展的特征学习。
参考文献:
- The Simpler The Better: A Unified Approach to Predicting Original Taxi Demands based on Large-Scale Online Platforms