用好POI数据助力工人文化宫规范化管理

用好POI数据助力工人文化宫规范化管理

随着现代地理信息技术的快速发展和智慧城市建设步伐的加快,基于互联网电子地图和位置服务模式的创新,POI数据得到了广泛的应用。在当下大数据、智能化的背景下,通过对POI数据的借鉴、创新和应用,可以丰富工会统计的技术手段和方式,提高工会资产管理和资源配置的效率与精准度,推动工人文化宫规范化建设管理再上新台阶。本文在POI数据与工会统计数据分析对比的基础上,对POI数据与工会统计数据精准对接,提高工人文化宫数据的完整性、准确性和及时性,优化数据资源利用,充分释放数据要素价值等方面进行研究分析,希望能为工会资产管理工作提供一些借鉴和帮助。

一、POI数据的研究背景

加强工人文化宫规范化建设管理,离不开翔实的统计数据支持。《中国工运事业和工会工作“十四五”发展规划》提出,“十四五”期间,全国将建设100家标准化工人文化宫,推动经济较发达、职工人数多的县(县级市)实现工人文化宫建设全覆盖。目前,工会系统每年都会对工人文化宫进行数据统计调查,以此来有效支撑工会相关工作走深走实。从资产建设、管理和使用角度上看,工人文化宫最重要的统计数据是地理位置数据、使用面积数据和服务频次数据。地理位置数据可用于空间分布的优化,使用面积数据和服务频次数据可用于功能布局的优化和调整。目前,工会统计数据中的地理位置数据以行政区划为主,数据精度可具体到县一级,实际应用中主要作为省、市、县三级分类汇总使用。与之相比较,研究人员对公共文化设施的地理位置信息主要使用POI数据进行研究分析,地理位置数据精度可具体到经纬度,在实际应用中主要用于公共文化设施分布特征及可达性的研究。

二、POI数据的抓取

POI数据,起源于地理测绘产品中点类地图要素的数据,在地理信息系统中可以抽象成点进行管理和计算。POI是“pointofinterest”的英文缩写,中文翻译为“兴趣点”,泛指互联网电子地图中的点类数据,包含名称、地址、坐标、类别等四类属性。国内主要POI数据来源是各大地图厂商,例如高德地图、百度地图等。本文采用的POI数据是从高德地图开放平台获取的,获取时间为2021年9月。首先,在高德地图开放平台(https://lbs.amap.com/)注册账号,并创建Key应用,获取对应的Key值。其次,使用Python等编程软件编写数据抓取程序,利用Key值连接高德地图的数据。高德地图POI数据所采用的编码表(更新于2021年8月10日),针对每个数据分为大中小三个类别,并提供对应的搜索代码,其中公共文化设施主要属于科教文化服务大类别(如下表)。通过搜索抓取全国31个省(自治区、直辖市)分类代码为“140800”的POI数据,再经过去重、剔除不相关信息等初步处理后,共计获得POI数据19359条,其中包含文化馆(站)12810条、文化宫1111条、青少年宫5438条(高德地图编码表中没有文化馆和青少年宫的单独分类,这两类都包含在文化宫类别中)。通过下面POI数据示例可以看到,每个POI数据都记录了公共文化设施的经纬度、名称、地址、代码、分类等,并配置了高德地图内部的识别ID。

三、POI数据的研究方法

在研究人员对公共文化设施分布特征的研究中,处理POI数据的方法主要有标准差椭圆分析法、核密度分析法等。

(一)标准差椭圆分析法

标准差椭圆分析法,是空间统计方法中能够精准地揭示经济空间分布多方面特征的方法。标准差椭圆分析法以中心、长轴、短轴、方位角为基本参数,空间分布椭圆以地理要素的空间分布均衡中心为中心,方位角表示其分布的主趋势方向,长轴和短轴方向分别反应地理要素在二维平面空间的主次趋势方向,长轴与短轴的长度反映地理要素在主次趋势方向上的离散程度。该椭圆可以检验点要素分布的空间形态变化,可从全局的、空间的角度定量解释地理要素空间分布的中心性、展布性、方向性、空间形态等特征。在实际运用中,利用标准差椭圆的方法,引入不同时期公共文化设施数据和人口数据,对市级范围内公共文化设施分布特征和人口分布特征进行对比分析,可以判断出:一是公共文化设施整体布局结构的变动趋势;二是公共文化设施整体分布是否均衡,以及相对于人口能否有效覆盖;三是公共文化设施的整体分布方向与人口分布方向是否一致。

(二)核密度分析法

核密度分析法基于数据密度函数聚类算法,随着与设施点距离的增加,被赋予的权重逐渐降低,最终生成连续的密度表面,可以直观的反映出设备点的空间集聚特征。在实际运用中,对不同时期的公共文化设施核密度分析,可以判断出:一是公共文化设施的分布格局,是否有集聚效果;二是不同区域公共文化设施的集聚效果,以及区域中心的位置;三是不同时期公共文化设施规模集聚的变动趋势。

四、使用POI数据的思考

在加强工人文化宫规范化建设管理过程中,当需要引入标准差椭圆分析法、核密度分析法等科学研究方法对区域公共文化设施分布情况进行分析时,就要求我们的数据要么“POI数据化”,要么直接引入POI数据。但是POI数据与工会统计数据有诸多的差异。一是格式上的差异。工会统计数据是复合型数据,属性包含地理位置数据、使用面积数据、资金情况数据和服务频次数据等,有部分数据是主观描述性文字,而POI数据主要是地理位置类数据,数据采用固定格式,是标准化数据。二是统计上的差异。2021年上半年的工会统计数据与POI数据数量并不一致,其原因主要在于工会统计数据对应的是有编制的工人文化宫数据,而POI数据对应的是现实存在的工人文化宫数据。两者的差异在于,有的工人文化宫有编制但是没有实体的场馆。因此,在工会资产建设、管理和使用过程中,特别是在工人文化宫统计数据工作的环节中,可以创新使用POI数据,工会统计数据中的地理位置数据也可以采用相似的数据格式,从而提高工会统计数据的标准化和位置精准度。同时,通过该标准化数据格式,可以利用编程程序快速筛查判断工人文化宫在县域的覆盖情况,掌握现有工人文化宫的分布数据,避免重复建设、盲目建设等情况的出现,为工会资产的规范化建设管理提供重要数据支撑,推动工会资产高效利用和保值增值。

作者:孙浩然 单位:全国总工会资产监督管理部