公路工程建设成本指数波动性预测探究

公路工程建设成本指数波动性预测探究

摘要:公路建设成本指数(HCCI)是反映公路建设行业价格走势的综合指标,本研究通过长短期记忆网络(LSTM)来模拟和预测公路建设成本指数(HCCI)的变化。结果表明,所建立的LSTM模型在长期、中期和短期三种预测情景下预测的结果均贴近实际情况。研究提出了一种新的人工智能算法在成本指数预测中的应用,该算法比目前流行的时间序列模型提供更准确的预测,特别是高度波动的成本指数。

关键词:公路建设成本指数;长短期记忆网络;人工智能;预测

公路建设成本指数(HCCI)是一种综合价格指数,反映了一段时间内该行业价格的平均变化。它是由公路建设项目中主要行项目的价格信息(即材料、劳动力、设备)组成的无单位指标[1-2]。HCCI的作用主要有4个:(1)作为成本通货膨胀的参考因素;(2)作为一般建筑市场价格指标;(3)作为建设单位和施工单位进行工程成本计算的依据;(4)比较各省市之间的市场状况。HCCI的一个主要问题是,随着时间的推移,HCCI表现出显著的变化,这主要是由复杂的交互效应造成的,如市场因素和工程项目特定因素。这种变化阻碍了用户把握市场趋势的能力,从而对公路工程建设单位和施工单位等业主在正确预算和成本估算方面带来了不便[3]。为了解决这一问题,本研究集中在预测HCCI并用定量模型解释其变化。目前预测HCCI的两种常用定量方法:(1)时间序列分析;(2)统计学习方法(即回归和其他更复杂的机器学习算法)[4-5]。时间序列建模仍然是这一研究领域中最常用的定量方法之一。以往的研究除了无法预测趋势变化和变化外,还在指数的建模和预测过程中暴露出3大问题:一是对某些模型中要预测的数据有不同的要求,例如平稳时间序列模型的假设和回归方法中的高斯分布误差,建模假设限制了模型在不同数据源情况下的应用[6];二是现有研究中的许多模型只适用于低波动性数据[7]。当研究人员完全专注于分析误差指标以评估模型,对低错误率感到满意时,很少有人考虑两个重要问题:数据(或问题)是否需要复杂的算法,以及该算法是否对预测数据有重要贡献;三是一个好的预测模型应该能够对不同的时间范围进行未来的预测。本研究包括3个主要步骤:数据收集、模型开发和模型验证,研究程序图如图1所示。本研究的主要目的是探索一种适用于高波动性数据的方法,对长期预测(8年)、中期预测(2年)和短期预测(1年)3种不同的预测情景进行模拟,在预测HCCI指数上具有较高的精度和有效的实现,提出了一种关于公路工程建设成本指数的先进的人工智能算法,为公路工程建设成本计算提供依据。

1长短期记忆网络

长短期记忆网络(LSTM,LongShort-TermMemory)是一种时间循环神经网络,LSTM适合于处理和预测时间序列中间隔和延迟非常长的重要事件[8-10]。先进的深度学习算法LSTM以其强大的结构和不同时间范围的滚动预测过程成功地克服了这些挑战。更具体地说,LSTM提供了一种序列到序列(seq2seq)体系结构。LSTM在短时记忆和长时记忆中都有显著的表现,它是一种特殊的递归神经网络,它比普通神经网络具有更复杂的单元结构。

2LSTM预测模型

LSTM建模有3个步骤:数据预处理、超参数调整、预测和预测评估。LSTM不需要数据具有平稳性等要求,但建议将数据归一化或标准化作为预处理的一部分,以加快收敛速度。在本研究中,通过最小-最大标度标准化可以快速收集小范围内的所有数据,这有助于产生一个更规则的数据搜索空间,从而加速权值的收敛。第二步是确定模型中超参数的设置,研究中考虑了六个超参数:神经元数目、批量大小、时间步长、时期、调整系数、丢失率,模型超参数设置见表1。第三步是seq2seq体系结构的LSTM模型预测功能的实现。通过将数据输入LSTM模型,预估出预测周期内的HCCI指数。

3模型输出结果验证

本研究通过采集江苏省1998-2016年实际工程建设成本指数为LSTM模型提供真实数据基础,分别预测长期、中期和短期结果,并与真实数据曲线进行对比,观察LSTM模型预测的准确性,并使用平均误差百分比作为误差度量。

3.1长期预测结果。长期预测通过将1998-2008年间的HCCI指数输入LSTM模型,预测出2008-2016年的HCCI指数,模型输出结果见图2。从图2可以看出,LSTM模型的预测的结果大致能够捕获到数据的未来趋势,但未能发现2016年附近的下降趋势。LSTM在2008年附近预测的下降趋势做得很好,从而使得LSTM的整体预测平行向下移动,更加贴近实际水平。就准确度而言,结果并不乐观,LSTM长期预测结果仅表达出大致的上升趋势。在实际情况中,该模型不需要预测如此长的周期,中、短期预测结果更具实用性。

3.2中期预测结果。LSTM模型中期预测缩小了时间范围,增加了模型预测的频率。通过以下方式依次对两年的指数进行预测:(1)输入1998-2008年的HCCI数据,预测2008-2010年的HCCI指数;(2)输入1998-2010年的HCCI数据,预测2010-2012年的指数;(3)输入1998-2012年的HCCI数据,预测2012-2014年的HCCI指数;(4)输入1998-2014年的HCCI数据,预测2014-2016年的HCCI指数。由于输入的HCCI数据趋势突变,导致对2008-2010年HCCI指数预测产生较大困难,但从图3可以看出,LSTM模型仍表现出良好的能力来察觉这种变化。其他三种预测周期的结果较为贴近实际HCCI数据变化,二者之间的平均绝对百分比误差见表2。从表2可以发现,当数据较为平稳时,LSTM模型预测的HCCI指数的准确性在6.38%~11.39%。

3.3短期预测结果。LSTM模型短期预测结果通过设置输出时间为一年,分别输入1998-2015年的真实HCCI数据,从而得到输入年份的后续一年的HCCI指数的预测数据,预测结果见图4。由图4可以看出,LSTM模型预测的结果与HCCI指数的实际情况吻合程度较高,只有在数据波动较大的年份(2008-2009、2015-2016)才会出现较小的偏差。短期预测结果的平均百分比误差见表3,从表3可以看出,在数据波动性较小的情况下,误差可以控制在5.521%~8.71%。相比较于长期、中期预测结果,短期预测结果已经能够做到较高程度的贴近实际HCCI指数变化曲线。

4结语

本研究通过LSTM模型预测HCCI指数在长期、中期和短期三种场景下的变化趋势,可以发现,随着预测周期的逐渐缩短,LSTM模型的预测精度显著提高。公路工程成本指数的微小改进对于工程预算估算的准确性有着极大的提高,更准确的HCCI指数有助于避免工程造价的低估和高估问题。低估会导致成本超支、投资决策中出现财务问题、项目延期或取消;高估会导致公共资金预算分配效率低下。通过LSTM模型加强对HCCI指数的预测,提高工程成本的估算和预算的准确性至关重要。本研究中所提出的LSTM方法的独特性使其能够有效地满足公路建设行业成本估算师的实际需求,该方法能够同时满足高预测精度和低开发工作量的双重目标。

作者:库都孜·库娜吉 黄文妤 单位:新疆交投科技有限责任公司 新疆公路桥梁试验检测中心有限责任公司