大数据的收集作为传统资源密集型人工数据收集方法的替代方案,在过去十年中变得更加可行。此类数据的可用
性,加上更复杂的预测统计技术,促使人们更加关注这些数据的应用,尤其是在交通分析方面。在交通文献中,人们越
来越重视将通常收集的公共交通数据来源开发成更强大的分析工具。人们普遍认为,将大数据应用于交通问题将产生以
前通过传统交通数据集无法获得的新见解。然而,关于大数据的构成、大数据收集和应用的伦理含义以及如何最好地利
用新兴数据集,存在许多歧义。探索大数据的现有文献没有提供清晰一致的定义。虽然大数据的收集量不断增加,其在
研究和实践中的应用也在不断扩大,但应用于此类数据的分析方法之间存在显着差异。本文总结了最近关于大数据来源
的文献及其在解决公共交通问题时常用的方法。我们评估主要的大数据源、最常研究的主题和采用的方法。文献表明智
能卡和自动化数据是研究人员最常用于进行公共交通分析的两个大数据源。审查的研究表明,大数据已在很大程度上用
于了解公交用户的出行行为和评估公共交通服务质量。文献中报道的技术在很大程度上反映了那些用于较小数据集的技
术。通常与大数据相关的更高级统计方法的应用仅限于少数研究。为了充分发挥大数据的价值,需要采用新的分析方法。