基于算力网络架构下用户移动性探讨

基于算力网络架构下用户移动性探讨

摘要:本文基于常用的用户移动性分析算法,在新一代算力网络架构下分析用户智能终端的位置数据得到用户移动偏好应用(移动热点、移动位置预测等),充分利用算力网络,提高计算效率,平衡计算资源。同时,本文还分析了不同移动偏好的用户在用户移动偏好应用中的适配度。

关键词:移动性分析;算力网络;位置信息

1引言

在生活、工作、学习等各方面,人们都会有较规律的活动路径,有倾向性地访问某些热点区域。对于人们这些活动轨迹规律性的研究也成了移动互联网背景下较为热点的研究方向,这些研究很好地促进了基于位置的服务。通过移动互联网设备,研究者可以方便地搜集到人们的活动信息,包括基于地图应用的位置信息、基于通话上网的报文数据、基于APP应用的位置信息。位置预测就是一种基于位置信息来判断用户移动偏好的重要应用,可以帮助移动互联网应用有预见地为用户提供服务。本文中,我们通过移动轨迹分析方法来预测人们的移动轨迹,挖掘人们的移动偏好和关系信息。然而,业界的位置分析方法通常需要对大量数据进行分析,特别是当研究对象是一个群体时,这样的计算大多是消耗比较大的计算资源,需要一个全新的算力资源架构用于此类分析。因此,我们搭建了一套算力网络来支持分析方法的高效运行,实现算力资源的共享;引用经典的移动轨迹分析方法来实现人们移动路径的分析和预测,在预测准确率、算法时间复杂度和空间复杂度方面有良好表现;分析了不同类别路径对轨迹预测结果的影响,研究发现越是活动轨迹规律的人群,其移动预测越为准确;基于移动互联网的位置信息数据,数据量规模涵盖人们生活中所能感知搜集的各种类别数据,研究结果具有一定的代表性。

2算力网络介绍

现如今,全球数字经济正在呈现蓬勃发展的态势,这不仅得益于贸易全球化,也是新一代信息技术与行业机理融合效应日益显著的结果。随着5G、大数据、区块链、物联网等技术的快速推广应用,经济社会向数字化转型升级的趋势不可阻挡。这些新一代信息技术正是数字经济持续发展的重要引擎,算力网络正是在这一时代背景下技术融合的一个产物。根据IDC《2021—2022中国人工智能计算力发展评估报告》显示,算力已经成为数字经济时代的核心生产力,是拉动数字经济向前发展的新动能。算力网络描述如图1所示。中国通信学会的《算力网络前沿报告(2020)》指出,算力网络需要网络和计算高度协同,将计算资源和计算能力嵌入到网络中,实现云、网、边、端、业的高度协同,提高计算资源利用率。从这一理念可以看到,算力网络所倡导的是将网络、泛在算力和人工智能相结合,是在云网拉通和协同基础上的下一个融合阶段。这里的泛在算力资源根据计算芯片类型可分为GPU、CPU、ASIC、NPU、TPU、FPGA等。根据SynergyResearchGroup的数据显示,截至2020年上半年,全球已建成超大型数据中心541个,与2015年相比增长1倍。而算力网络中的网络指连接这些计算资源的一切网络资源,如光纤、工业内外网、移网网元等,目前以5G为典型代表。近年来,国家也相继了一系列加快算力网络建设的政策建议,包括加强物联网和工业互联网等新型基础设施建设的“新基建”,在信息基础设施建设方面,提出构建以数据中心、智能计算中心为代表的算力基础设施(如“东数西算”工程),以及大力倡导加快5G商用步伐。

3相关工作

近年来,越来越多的基于位置的服务使用移动互联网数据。在智能手机、Pad等移动终端中,虽然有很多算法应用,而这些移动终端的运算能力有限,影响了应用性能、准确率和实效性。鉴于此,我们提出基于算力网络来研究用户的移动行为,统一编排和调度多样的算力资源,包括云边端算力或异构算力,以实现算力的协调调度和高效利用。算力网络架构如图2所示。在移动性预测算法方面,现在常用的算法包括马尔科夫算法、无损压缩算法等,以及这些算法的变形改进算法,通过分析用户历史移动轨迹数据,从中提取移动模式,再根据用户当前的移动模式来进行预测。通过研究发现,很多移动预测类算法存在一定的局限性,导致预测准确率的降低和时间复杂度的升高。这些局限主要体现在以下3个问题。(1)未考虑时间因素。对于位置预测,大多数算法没有采用参考时间信息。但是我们认为时间因素,对于用户的位置预测具有很重要的参考价值,因为人们习惯在不同时间段表现不同的移动模式。(2)很多情况下,位置不可预测。对于很多预测算法,当位置点在用户移动轨迹中未出现情况时,不会考虑在用户未来的位置预测中。(3)高算力资源消耗。很多预测算法需要考虑用户大量的历史数据,又因为没有做好数据预处理或者算法本身复杂度较高,需要消耗大量的算力资源,算法无法在移动设备上长期高效运行。为了解决这些问题,本文提出基于算力网络架构下的用户移动性预测方法,综合考虑时间因素和算力资源的高效利用,使得用户移动模式提取、预测等分析更为高效快捷,并在一定程度上提高算法准确率。

4算法描述

本文重点论述在算力网络架构下的用户移动性行为预测,基于构建简易的算力共享网络,并参考已有研究,选择参考时间信息的马尔科夫算法来预测用户位置。我们在用户移动轨迹进行构建的过程中利用时间进行标注和分段,每一段表示一个小时,而用户在这期间所停留时间最长的位置为此时间段的代表位置,这样就可以得到用户参考时间的路径信息。图3为一个用户在上午7点至下午1点的路径信息,该用户的路径标识可表述为:L=AACBBCA。参考时间信息的马尔科夫算法可以理解为,通过对用户过去的移动路径进行分析,提取出所有的移动模式(有限路径串,如AA、AB、BC、CA、AD是路径AABCAAD的二阶模式,AAB、ABC、BCA、CAA、AAD为该路径的三阶模式)。通过算法计算用户下一个位置与之前驻留位置组成的模式在路径中出现的次数,来预测用户出现在下一个位置的概率。本文采用三阶参考时间信息的马尔科夫算法:L为用户过去的移动路径,如L=AABCAAD;n为路径点计数,则n=7;L3表示路径L的第3个点,显然L3=B;P(Ln+1=A)表示用户在下一个位置点为A的概率;sum(N(Ln-1,Ln,A))表示,当预测下一个位置Ln+1=A时,路径末尾的三阶模式Ln-1,Ln,A在原路径中出现的次数,显然路径末尾的三阶模式为ADA,在路径L中出现0次;sum(N(Ln,A))表示,当预测下一个位置Ln+1=A时,路径末尾的二阶模式Ln,A在原路径中出现的次数,显然路径末尾的二阶模式为DA,在路径L中出现0次;sum(N(A))表示,当预测下一个位置Ln+1=A时,路径末尾的一阶模式A在原路径中出现的次数,显然路径末尾的一阶模式为A,在路径L中出现4次。采用三阶参考时间信息的马尔科夫算法公式如图4中的公式(1)所示。当L=AABCAAD时,P(Ln+1=A)等于0.19,所以用户在下一个位置点为A的概率是0.19,主要考虑时间因素及多阶模式因素,位置D在路径中仅出现一次,其下一个位置的预测概率较小。同理,当L=BABCABCABACAB时,n=13,P(Ln+1=C)=0.38。考虑时间因素的预测算法克服了原始算法的两点不足,一是考虑时间参量,二是对没有在用户历史轨迹中出现的位置点或移动模式进行预测。经过实验分析,发现该算法的预测准确率要比没引入时间参量的算法高。

5仿真结果

本节仿真对比了参考时间的马尔科夫算法与原始马尔科夫算法的预测准确度,测量两种算法的性能。仿真测试在简易算力网络架构下进行,对大量用户的移动位置进行逐个路径构建和位置预测,最后评估预测准确度。仿真结果如图5所示。从图5可以看到,考虑时间因素后算法预测准确度有显著提升。除此之外,我们还探索了不同算法的预测准确率与用户的移动轨迹规则程度之间的关系,最终得出相似结论:准确率与用户轨迹规则度成正比关系,其中规则度的度量使用相似度算法(如余弦相似度算法等)。

6结论

通过结合新一代信息通信技术,改善人们生活质量和产品体验,已经成为业界的一种重要应用方法。本文通过对用户移动互联网数据进行分析,提取位置信息,验证了不同预测算法的准确度,同时首次提出通过算力网络系统来均衡算力资源,避免计算资源浪费和应用时间复杂度过高。通过引入时间因素,提高了预测算法精度,在一定程度上克服了常规预测算法的局限性。在研究路径规则程度对算法预测的影响上,也发现越是规则的路径,其预测效果越好,这与事实逻辑相符。在未来的工作中,期望进一步挖掘算力网络架构的应用,包括AI计算、工业控制、智能机器人控制等领域。

作者:王洪彤 单位:中央广播电视塔