2021交通运输公共数据开放报告

一、全国交运数林概貌

2016年,《交通运输部办公厅关于推进交通运输行业数据资源开放共 享的实施意见》中明确提出“建立健全行业数据资源开放共享体制机制” 以及“完善行业数据资源开放共享技术体系、建立互联互通的行业数据 资 源开放共享平台”等目标。随后,交通运输部门又相继出台了《数字交 通 发展规划纲要》《推进综合交通运输大数据发展行动纲要(2020-2025 年)》等文件,均提到了要构建和完善数据资源开放机制。

2021年12月,交通运输部最新发布的《“数字交通”十四五发展规 划》针对“行业成体系、成规模的公共数据较少,数据开放与社会期望还 存在差距”的现状,提出“研究制定交通运输公共数据开放和有效流动的 制度规范,推动条件成熟的公共数据资源依法依规开放和政企共同开发利 用”。

目前,国家交通运输部官网数据开放栏目与交通运输部综合交通出行大数据开放云平台都已开放了交通运输领域的数据集。其中, 无条件开放的数据集 47 个,数据容量近 6 千万,数据内容主要涉及国内 部分省市的交通线路站点、客运站班次、线路、货运车辆、运输与维修经 营业务等。此外,还开放了来自航空公司、OpenITS 联盟的研究数据。同 时,出行云平台还开放了 124 个有条件开放的数据集,内容主要涉及国内 部分省市的运输车、出租车、公交车的定位数据,轨道、公交、出租车的 线路、站点站台与票价数据,公路高速路路线与收费数据,百度地图路况 数据以及高校实验室提供的交通类科研数据。

截至2021年4月,我国已有174个省级和城市的地方政府上线了数据开 放平台,其中省级平台18个(含省和自治区,不含直辖市),城市平台156 个(含直辖市、副省级和地级行政区),共开放了187178个有效数据集。 有11 个省级和83个城市平台开放了交通运输领域数据。与其他条线部门相比,交通运输部门(含轨道交通、公交公司)开放的数 据集总数为8985个,仅次于民政、统计、农业农村和教育等部门;交通运 输部门开放的数据容量达到2.78 亿,在各部门居于首位,其次是住房和城 乡建设、市场监管、文化旅游等部门。

在准备度方面,北京市、台州市等 7 个城市制定了专门针对交通运输 领域数据开放的法规政策,对数据开放、全生命周期安全管理等方面作出 了详细的规定。其他地方在有关“数据资源管理”“公共数据”的法规政 策中,在涉及开放范围、利用促进的内容中提及了“交通运输”领域,但 未具体展开。

在数据数量和质量等方面,各地开放的交通运输领域数据集在总量与 容量上存在显著的地区间差距;开放的交通运输类数据仍以静态数据为主, 尚未有地方在数据开放平台上提供实时动态数据。少部分地方的数据存在 碎片化与低容量等数据质量问题,数据更新及时性仍有待提高。各地开放 的数据在标准规范上也不一致,相比省本级平台,城市平台开放的数据中 可机读格式比例较高;各地开放的数据范围也不够全面,数据丰富程度不足。

在数据利用方面,少数地方在交通运输领域已开展了诸如开放数据创 新利用比赛、项目案例试点等利用促进活动,在公共交通、停车导航等应用 场景产出了部分有效成果。但各地的利用促进活动类型仍较为单一,有效成 果数量较少,且主要由企业开发利用,个人、社会组织、高校等其他社会 主体参与利用的程度不足,交通运输领域的开放数据利用尚处于起步阶段。

二、 交运数林指标体系

开放数林指数邀请国内外政界、学术界、产业界七十余位专家共同参与, 组成 " 中国开放数林指数 " 评估专家委员会,以体现跨界、多学科、第三方 的专业视角。专家委员会基于数据开放的基本理念和原则,借鉴国际数据 开放评估指标体系的经验,立足我国政府数据开放的政策要求与地方实践, 构建起一个系统、科学、可操作的地方政府数据开放评估指标体系,并为 每项指标分配了权重。

基于开放数林指标体系,结合交通运输领域特点,报告重点从准备度、 数据层和利用层三个维度及下属多级指标对交通运输领域开放的公共数据 开展评估:

准备度是 " 数根 ",是数据开放的基础,包括数据开放要求、数据利用 要求、安全管理要求、保障机制等四个一级指标。 数据层是 " 数叶 ",是数据开放的核心,包括数据数量、数据质量、数 据规范、开放范围等四个一级指标。 利用层是 " 数果 ",是数据开放的成效,包括利用促进、利用多样性、 有效成果数量、成果质量等四个一级指标。

三、 交运数林指数

2021交通运输领域开放数林省域指数。浙江省的综合表现 最优,进入A+等级;山东省也表现优异,进入A等级,其次是广东省、四川 省等省域。在单项维度上,浙江省在数据层和利用层上表现最优,进入 A+ 等级。

2021交通运输领域开放数林城市指数(前二十)。深圳市 和丽水市的综合表现最优,进入A+等级;青岛市、宁波市、金华市也表现 优异,进入A等级,其次是台州市、贵阳市、绍兴市、烟台市、上海市、武 汉市等城市。在单项维度上,舟山市、丽水市和青岛市分别在准备度、数 据层和利用层上表现最优,进入 A+ 等级。

省域交通运输领域开放数林指数空间分布,颜色越深代表 指数综合等级越高。数据开放水平较高的省域主要集中在东南部沿海地区 的浙江、山东等省域以及位于西部的贵州、四川等省域,成为全国交通运 输领域的优质“数木”。

四、 地方交运数林标杆

( 一 ) 准备度

截至 2021 年 5 月,在全国地级以上城市中,有 7 个城市出台了专门 性的法规政策,主要集中在浙江省内。

在职责分工上,绍兴市、温州市和丽水市明确了城市交通管理部门是 城市交通数据资源开放的责任主体,并对财政、规划、住建、公安等部门 的职责分工作出了明确规定。

在开放目录与清单上,7 个地方的法规政策均将交通运输领域的数据开 放目录以附件的形式呈现在文件中。

在开放数据需求的征询与回应上,绍兴市、丽水市等地对交通运输领 域数据开放的申请和需求回应作出了具体要求。例如,丽水市规定了“符 合城市交通数据资源开放共享条件和资质的机构可向数据资源提供方提出 开放申请,说明开放范围、开放用途、申请数据项内容和数据安全保障措 施等,并以书面形式提交资源提供方审核。资源提供方应当在收到书面申 请后 10 个工作日内,提出是否同意开放的意见及理由”。(报告来源:未来智库)

(二)数据层

1. 数据数量

截至 2021 年 5 月,各地共开放了 8985 个交通运输领域的有效数据集, 数据总容量达到 2.78 亿。数据集总量统计的是平台上可通过下载或 API 接 口获取的有效数据集总数。数据容量是指将一个地方平台中可下载的、结 构化的、各个时间批次发布的数据集的字段数(列数)乘以条数(行数) 后得出的数量,体现的是平台上开放的可下载数据集的数据量和颗粒度。

数 据容量更能体现一个地方的数据开放总量,单个数据集平均容量也更能反 映一个地方开放数据集的平均水平。例如,浙江省有效数据集数量虽然相 对较少,但数据容量与单个数据集平均容量均远高于其他省域。丽水市开 放的有效数据集总数和数据容量虽然并不靠前,但单个数据集平均容量最 高,达到 143 万。

2. 优质数据集

2.1 高容量数据集

报告将各地开放的交通运输领域数据集中容量最高的前 1% 作为高容 量数据集,并统计了其在各地区的分布。省域开放的交通运输领域数据中, 高容量数据集最多的省域,浙江省开放的高容量数据集最多, 达到 33 个,远超其它省域,其次是山东省、广东省和四川省。城市开放的 交通运输领域数据集中高容量数据集数量最多的是金华市,其次是威海市、 绍兴市、宁波市等地。

宁波市开放的道路运输车辆信息中,详细提供了车辆的车牌号、车辆 类型、颜色、车架号、注册时间、车辆有效期、运输证号等关键字段。

浙江省开放的“中华人民共和国道路运输经营许可证数据”,详细提 供全省范围内具有从业资格的车辆基本信息、运输证、许可证、业户名称 等方面的详细数据。

2.2 优质 API

API 接口适用于提供实时动态的高容量数据,以促进高价值数据的开放 与利用。优质 API 接口需要满足接口可调用、至少每日更新、数据集容量 高等标准。目前,浙江省和深圳市平台提供了多个交通运输领域数据的优 质 API 接口。

3. 常见数据集

报告对高容量数据集的名称进行文本分析后发现,出现次数最高的关 键词有运输、道路、车辆、证、船舶、从业人员、客运、站点等。报告还 列出了各地交通运输领域开放的 10 类常见数据集

(三)利用层

1. 利用促进活动

报告分析了各地政府为促进交通运输领域开放数据的社会化利用而组 织的各类活动,包括开放数据创新利用比赛和引导赋能活动等类型。开放 数据创新利用比赛是指地方政府为促进交通运输领域的开放数据利用而组 织的各类比赛,或在综合型数据开放比赛中设置了交通主题赛道。引导赋 能活动是指地方政府在交通运输领域组织的各种常态化、专业性的数据利 用促进活动,例如交通运输领域数据开放专题研讨会、交通运输领域开放 数据利用试点项目等。

在数据创新利用比赛方面,北京市与厦门市举办了交通运输领域的专 业比赛。浙江省、四川省、山东省、广东省,以及上海市、天津市、深圳市、 杭州市、宁波市等城市在数据开放大赛中设置了交通运输领域的分赛道。

2021 北京智慧交通开放创新大赛设置了路口流量预测、 干道信号灯协调控制、共享单车出行里程计算、出行方式识别、拥堵特征 时空演化等 7 个赛道,以推动交通数据的社会化利用。

2021 深圳全球开放数据创新应用大赛设置了数字交通分赛道,吸引参赛者围绕城市群、交通规划、公共交通一体化协同、城 市交通综合调度等方向提出解决方案。

在引导赋能活动方面,各地在交通运输领域开展的专业性促进活动数 量较少,目前主要有利用试点项目和专题研讨会两种形式。

上海市在交通运输领域开展应用试点合作项目,例如上研智联自动驾 驶试点项目利用临港新片区汇聚的企业自动驾驶数据和政府部门的道路设 施、 客流等数据,为企业训练自动驾驶算法提供数据支撑。

厦门市依托 2020 数字中国创新大赛和厦门大数据安全开放创新应用大 赛·交通专题,举办了智绘交通·数创未来交通专题研讨会。 该研讨会旨在进一步探索创新合作模式,共同促进赛事成果向实践应用转 化,构建数据开放利用的生态圈。

2. 成果质量

报告对各地政府数据开放平台上展现的交通运输领域利用成果进行了 筛选和分析,并列举了部分优质成果如下 : 高德地图(停车场板块)利用浙江省数据开放平台开放的停车场数据 满足用户的出行停车需求,为市民提供停车指引,可根据用户的出行特点 制定停车方案并展示停车场的实时动态信息。

“宜行青岛”是一款提供停车充电查询服务的应用。 通过该应用,用户可以在线寻找附近停车场的空闲车位,以解决停车位难 找的问题。用户还能查找周边的充电桩信息,以及充电桩的剩余车位数、 价格等情况。

杭州市的“车来了”应用通过调用市区公交线路和站点分布数据,为 用户提供公交位置实时查询服务。

烟台市的“e 车易行”是一款共享汽车出行应用,通 过利用政府开放的充电桩数据,鼓励用户将共享汽车停放在充电桩区域。

3. 利用多样性

在利用者多样性方面,企业是交通运输领域开放数据的主要利用者, 当前全部有效服务应用均来自企业。高校团队主要通过参与开放数据创新 利用比赛的形式利用开放数据。 在利用成果形式多样性方面,青岛市的有效成果形式最为丰富,涵盖 服务应用、创新方案、研究成果三种类型。

五、 交运数据开放国外案例

1. 准备度

美国在《开放政府数据法案》中明确了交通数据开放应以现代、开放 和电子格式产生、传输和发布,且应符合法案规定的数据标准。

美国《驾驶员隐私保护法》明确了驾驶员数据的披露条件和要求,为 数据开发利用者设定了清晰的框架和边界。

2. 数据层

(1) 美国政府开放数据平台的交通数据

Data.gov 是美国政府开放数据平台 , 于 2009 年 5 月 21 日上线。目前, 美国交通部(U.S.Department of Transportation)在 Data.gov(美国政 府开放数据平台)上开放了来自联邦航空管理局、交通统计局、联邦公路 管理局等机构提供的共 998 个数据集,数据标签包含运输统计、智能交通、 车联网、飞机制造、高速公路、过境货物、机场、空军等 50 余类,内容丰富, 并以 XML、CSV、JSON、RDF 等可机读、非专属格式开放。

(2) 纽约开放实时动态的交通数据

在纽约政府数据开放平台上,纽约交通部门开放了实时交通数据。纽约市交通 局(NYCDOT)的交通管理中心(TMC)运行着一张全市交通速度监测地 图, 展示了在纽约市交通局五个行政区内(主要是主干道和高速公路)设置 的传感器反馈的车辆平均速度信息。特别之处是,这些数据向社会提供 API 接口,用户可按照操作方法调用到 Json 格式的源数据,甚至包括GeoJson 这类结合地理空间格式的数据,极大方便了用户结合地理空间使用该类数 据进行分析利用。

(3) 巴黎平台开放来自企业的交通类公共数据

自行车车速表数据是法国一家企业开放的交通类公共数据,是以小时 计的高质量数据集。用户可通过巴黎市政府数据开放平台上提供的链接跳转到该公司网站上调 用相关数据接口。

3. 利用层

(1)伦敦:公众利用道路交通与汽车充电桩数据优化公共服务

在伦敦,科研团队基于政府开放的道路交通与电动汽车基础设施交付 计划数据对充电点需求进行了预测。该团队发现,到 2025 年,整个伦敦可 能需要 2,300 到 4,100 个快速充电点和 33,700 到 47,500 个慢 / 快充电点。 公众通过交通状况与汽车充电桩的在线仪表盘向政府反馈意见,辅助相关 部门确定电动汽车充电需求较多的地点。

(2) 美国 : 企业利用开放数据降低交通事故风险

在美国,律商联讯风险信息公司借助交管部门的交通事故数据,以及 保险公司的交通事故理赔数据,分析道路交通事故的发生频率和严重程度, 并可帮助交管部门识别和评估不同路段、车辆、驾驶人和运营公司的风险 程度,从而使用不同的监管手段来主动降低风险。(报告来源:未来智库)

六、 交运数林建言

1. 准备度

在数据开放要求方面,建议各地在制定有关交通运输领域数据的法规 政策时对数据开放目录与清单、开放数据质量、开放方式、开放数据需求 征询与回应作出具体要求。 在数据利用要求方面,建议各地在相关法规政策中对交通运输领域数 据开放的利用促进活动、示范应用作出要求。 在保障机制方面,建议各地在相关法规政策中对交通领域数据开放工 作的人员与资金保障作出要求。

2. 数据层

在数据数量方面,建议各地持续开放更多交通运输领域数据集,重点 提升数据容量,开放更多高容量数据集,提高单个数据集的容量,特别是 以 API 接口形式开放的动态的、高容量的数据。 在数据质量方面,建议各地开放更多实时动态的交通运输领域数据, 而不只是开放静态的数据集,甚至是颗粒度很低的统计数据。建议清理高 缺失、碎片化、极低容量的数据集,并确保开放数据集的动态更新。

在数据规范方面,建议推进交通运输领域数据的分级分类开放,并配 备相应的、差异化的开放授权协议。提高可机读、非专属与 RDF 格式的数 据比例,降低申请和调用 API 接口的难度;为开放数据集提供丰富的元数 据说明。 在开放范围方面, 建议参照报告中的“常见数据集”清单开放各地已 普遍开放的交通运输领域数据,参照国内外优秀案例,扩大交通运输领域 数据的开放范围。

3. 利用层

在数据比赛方面,举办专业性的交通运输领域开放数据利用比赛,或 在举办综合性开放数据创新利用大赛时为交通主题设置分赛道。 在引导赋能方面,组织专门针对交通运输领域的引导赋能活动,例如 开展主题沙龙、数据供需对接会、利用案例试点等活动,促进交通运输领 域数据的开放与利用。 在利用多样性方面,鼓励和引导高校、社会组织、个人等多元社会主 体参与交通行运输领域开放数据的利用,构建价值共创生态。

七、交运数林指数评估方法

1. 评估范围

根据公开报道,以及使用“数据+开放”“数据+公开”“公共+ 数据”“政务+数据”“政府+数据”“地名+数据”“地名+政府数 据”“地名+开放数据”等关键词进行搜索,发现了截至2021年4月我国已 上线的相关国家部委和地方政府数据开放平台,并从中筛选出符合以下条 件的平台:

(1)平台由行政级别为地级以上的政府建设和运营(不包括港澳台)。

(2)开放形式为开设专门、统一的数据开放平台,由地方条线部门单 独建设的开放数据平台不在评估范围内。

(3)平台上确实开放了电子格式、可通过下载或接口形式获取、结构 化的交通运输领域数据集。

2. 数据采集与分析方法

准备度评估主要对交通运输领域公共数据开放的法律法规与政策文件、 标准规范等资料进行了描述性统计分析和文本分析。搜索方法主要包括以 下两种 : 一是在搜索引擎以关键词检索相关法律法规、政策文件、标准规 文本 ; 二是在相关国家部委和地方政府门户网站、政府数据开放平台、行业 信息标准规范平台、地方标准信息服务平台以及相关法律法规数据库,通 过人工观察和关键词检索采集数据。数据采集截止时间为 2021 年 5 月。

数据层评估主要通过机器自动抓取和处理相关国家部委和各地政府数 据开放平台上开放的数据,结合人工观察采集相关信息,然后对数据进行 了描述性统计分析和文本分析。数据采集截止时间为 2021 年 5 月,采集范 围为国家部委和各地政府数据开放平台上交通出行、交通运输等主题下各 政府部门和企事业单位开放的相关数据,其中政府部门主要包括交通运输、 公安、自然资源等,企事业单位主要包括公交公司、空港、轨道集团等。对“动 态更新”这一指标的评测时段为 2021 年 1 月至 2021 年 5 月。

利用层评估主要对相关国家部委和各地政府数据开放平台上展示的利 用成果进行了人工观察和测试,对 2019 年以来相关国家部委和各地开展的 开放数据创新利用比赛信息进行了网络检索,并对采集到的数据进行了描 述性统计分析。数据采集截止时间为 2021 年 5 月。

3. 指数计算方法

指数出品方基于各地在各项评估指标上的实际表现从低到高按照 0-5 分共 6 档分值进行评分,其中 5 分为最高分,相应数据缺失或完全不符合 标准则分值为 0。对于连续型统计数值类数据则使用极差归一法将各地统计 数据结果换算为 0-5 分之间的数值作为该项得分。 各地平台在准备度、数据层、利用层三个维度上的指数总分等于每个 单项指标的分值乘以相应权重所得到的加权总和。


(本文仅供参考,不代表我们的任何投资建议。如需使用相关信息,请参阅报告原文。)

相关报告