【摘要】数据作为自动驾驶技术应用及产业发展的基点与支点,其收集、使用和管理的各环节关系着自动驾驶的健康发展。目前,自动驾驶场景下数据治理面临的主要问题表现为安全与联通的平衡。通过对自动驾驶数据特征与治理现状的评析,可从平衡数据权益分配,建立健全算法记录留存、公开与备案,规范数据共享等方面健全自动驾驶下数据治理规范化、法治化架构,保障和推动自动驾驶技术及产业的健康发展。
【关键词】自动驾驶 数据安全 数据联通 法治化
【中图分类号】D92 【文献标识码】A
数据是自动驾驶的重要基础
自动驾驶不仅是技术飞速发展的产物,更在车联网乃至于工业互联网中占据着关键地位,推动着交通智能化的又一次升级换代。自动驾驶技术及产业作为新一轮科技革命和产业变革的典型代表,成为各大研究机构、互联网巨头公司的重要竞争方向。自动驾驶涉及的问题广泛且深入,随着自动驾驶和智能网联技术的不断升级与改革,其中所潜在的问题与现实的碰撞越来越尖锐化,然而无论是运行安全问题还是制度规范问题,其问题的关键点就在于数据安全与联通,只有架构可信可靠、利益平衡的数据安全与联通的原则规则、实施机制及保障制度,才能推动自动驾驶真正发挥作用,促进物联智能化的进一步整合升级。
自动驾驶汽车依靠人工智能、视觉计算、雷达、监控装置和全球定位系统协同合作,让电脑系统可以在无需人为主动操作的情况下,自动操控机动车辆行驶。自动驾驶技术实施的关键在于通过算法判断路程和行驶速度,从而精准输出车辆控制措施,将数字控制下的自动驾驶汽车合理地安置于公共交通秩序中。而算法运行的基础是海量的行驶数据收集和运用,以大规模、高质量的数据为算法模型提供决策参考。数据作为自动驾驶技术及行为展开的起点,其收集和使用的过程关系着自动驾驶技术在应用中的安全与发展。
从数据计算及机器自动决策的维度看,自动驾驶的过程就是机器不断收集行驶数据并进行数据分析和自我学习从而达到自动驾驶的系统工程。伴随自动驾驶技术及车辆制造技术的发展,每辆汽车将从过去的封闭转向开放,融入到联网的平台中进行实时的信息交互,此时每辆车可以认为是一个数据实时采集、计算及分享的移动终端,其与车联网的中台做好链接,调取数据的同时也回传数据,在更好地做好自身深度学习的同时,也支撑整个车联网系统的算法训练。不法分子可通过网络对车辆进行远程攻击,使车辆做出熄火、刹车、加减速、解锁等操作,也可通过截获通讯信息、攻击云端服务器,达到窃取用户信息和车辆数据的目的,严重的还会威胁驾驶员和乘客的生命安全。
同时,在自动驾驶产业链中,数据的采集、存储、处理、传输、共享等生命周期各环节潜在的安全威胁也会给自动驾驶数据防护带来全新挑战,故要实现自动驾驶产业规模化、商业化落地,必须确保数据安全。当然,也不能因为强保护而妨碍了数据必要且高效的流动和共享需求,否则车联网无法有效建立和更新发展,最终也会影响自动驾驶技术及产业的长远健康发展。然而,事实情况是现行立法尚未针对自动驾驶数据规制系统提供充足制度供给,为此应在现有数据安全与数据联通的法律基础上出台相关规范,形成自动驾驶数据安全保护与数据联通发展的相互支撑和良性互动。
自动驾驶数据的主要特征
自动驾驶的基础是海量数据的分析与应用,前提是数据收集,同时对数据共享也有着较大的需求。数据的收集有可能侵害消费者的隐私,收集是否合规、保护措施是否完善至关重要。在保障数据安全的同时,促进数据流通也十分重要。自动驾驶汽车不可能仅靠一家企业或单位支撑起其数据要求,除必要的技术外,数据的开放共享亦是自动驾驶技术及应用不断完善的必由之路。为此,有必要从自动驾驶数据的特性入手,评估其采集、使用与管理中存在的主要问题,以此为问题导向和治理进路来推动和保障自动驾驶技术运用及产业发展能够行稳致远。
自动驾驶数据具有多样性和规模性。自动驾驶系统主要依赖感知、决策和执行三大模块来实现,每个模块在工作过程中会产生一系列数据,即为自动驾驶数据。感知数据通过激光雷达、摄像头、车载互联网系统等设备对外界的环境进行感知识别产生;在融合多方面感知信息的基础上,通过智能算法学习外界场景信息,预测场景中交通参与者的轨迹规划车辆轨迹,从而产生决策与控制数据,由此实现车辆拟人化控制;测试与仿真数据能够跟踪决策规划的轨迹目标,控制车辆的油门、刹车和转向等驾驶动作,调节车辆行驶速度、位置和方向等状态,以保证汽车的安全性和稳定性。自动驾驶汽车生产企业和自动驾驶技术研发创新企业都可以通过道路测试和仿真测试积累海量数据,优化和提升车辆自动驾驶性能,同时在这一过程中也会出现数据泄露和污染等风险,严重威胁车辆安全。
自动驾驶数据具有流动性。在自动驾驶整个系统的运作过程中,需要多方数据的相互传输,在不同设备、系统、云服务器等对数据采集、分析并相互之间形成数据交互来完成整个数据系统从采集到传输、分析、使用等全过程,自动驾驶本身是无法单纯通过本机的数据即可形成自动化决策操作,由此表现出数据的流动性,其风险就存在于多方交互的采集、传输、分析及使用等多个环节之中。在数据流动的过程中,譬如,自动驾驶汽车在数据采集、传输、分析、使用时,系统数据存在被窃取、丢失或篡改破坏的可能,也面临数据流动时遭受污染,算法无法识别或识别错误会对决策的可靠性和安全性产生影响等。可见,对自动驾驶中数据流动性带来的风险及其由此产生的数据风险的聚集扩散效应应予以高度重视。
自动驾驶数据安全存在的主要隐患
私人汽车通常是被认为是隐私场所,除公交车、出租车等具有公共属性的汽车之外,多数汽车在预期中应是可以达到保护隐私的效果。但自动驾驶汽车则完全颠覆了这一点,自动驾驶汽车需要完全收集车辆内外的绝大多数数据信息,以之作为其输出行使指令的原料,故每一部自动驾驶汽车都装备着传感器、激光雷达、摄像头以及其他微型信息收集装置,这意味着自动驾驶汽车的驾驶人、乘车人的信息,包括车内行为、日常行踪、开车习惯等,都将尽数传输到汽车企业,这将会引起消费者对于隐私的担忧。
数据安全在信息和通信技术(ICT)领域已做得较为成熟,然而自动驾驶汽车数据安全产品并非把传统ICT信息安全技术直接平移到汽车端那么简单,自动驾驶汽车对数据实时性、可靠性的要求要比传统互联网高得多,且收集的数据数量、类型、隐秘程度也远远超过传统互联网,这就对完善自动驾驶汽车相关的数据安全技术提出了挑战,怎样收集数据、数据收集的程度、数据保护的手段以及数据的留存与保护,都是维护数据安全的关键点。
此外,生产经营自动驾驶汽车的车企通过算法吞噬和隐瞒自动驾驶数据,影响法律纠纷中的举证,也是数据安全的一大隐患或现实威胁。在目前涉及自动驾驶交通事故的相关案件中,一方面存在着严重信息不对称,车辆数据集中于车企及其运营一方,导致使用者处于十分不利的地位;另一方面由于技术的先进性、复杂性与算法黑箱的影响,车企及其运营者对相关证据具有相当的控制力,这也对数据的安全性和可信性造成了威胁。
自动驾驶数据联通存在的主要障碍
相较于自动驾驶下的数据安全,我国对自动驾驶的数据联通方面的规定较缺乏。实际上,自动驾驶数据互联互通的重要性不亚于数据安全,而其治理难度甚至超过数据安全问题。
首先,各车企及其运营者无法独自、全面地获得使用中的自动驾驶车辆的完整数据,自动驾驶车辆行驶的安全性和高性能不仅需要精密的算法和强大算力,更需要实时的海量数据收集。各车企及其运营者需要通过不断的测试才能收集自动驾驶算法对气候、环境、路况等的决策数据(信息)。然而,由于不同车企主要测试的区域不同,比如特斯拉主要在美国加州进行测试、百度主要在中国北京进行测试,导致其收集的数据也具有相应的地域性,一旦超出该地域,其系统则会遇到数据不足的风险,继而引发行驶安全问题。但自动驾驶汽车如果只能在限定区域行使则会使其价值大大降低,其作为交通工具的属性也被削弱。因此,除非一家车企能在全国或全世界进行完整测试,否则数据的共享与互联就是自动驾驶汽车企业必要的选择。但问题的关键恰恰在于,测试数据的稀缺性与高价值使得数据互联的难度被大大拔高,如何在保护车商私益的同时,完成数据互联体制的初步架构,是更甚于数据安全体制建设的挑战。
其次,交通管理、公安等政府部门也需要自动驾驶场景下的数据来维护道路交通安全、调查事故原因、实现执法目的,司法部门亦需要自动驾驶数据来判断事故的规则和赔偿情况。除却数据可能会因为算法黑箱而无法完整读取和有效识别,政府部门如想同步其数据,也存在技术问题、风险保障问题以及企业的私益保护方面的挑战。
最后,科研机构需要自动驾驶汽车的数据来改进相关技术、评估环境和社会影响、提出立法和政策建议。然而,科研机构由于既没有巨大的商业共享利益驱动,又无国家公权力或准公权力的支持,在获得相关自动驾驶数据上的难度可想而知。可见,由于缺乏相关的规范和支持数据联通方面的制度和机制,自动驾驶场景下数据的收集、使用和管理一定程度上仍处在各自为政的数据封锁状态,不利于自动驾驶技术系统创新和整个产业的发展。
自动驾驶数据安全与联通治理现状
我国尚未出台专门适用于自动驾驶数据治理的基础性法律,与其相关的规范散见在不同的法律法规、部门管理意见、指南之中(参见表1和表2),特别是在以工信部为自动驾驶、智能驾驶技术及产业发展的主管部门所发布的部门管理意见、建设指南中予以了综合性规定,然而,由于效力位阶不高,在实践中发挥的规范作用不够充足,且存在与遵从高位阶法律,进行细化解释适用,以及与其他部门或地方所发布的同位阶规范文件协同适用的问题。
自动驾驶技术及产业发展作为新兴领域,所涉及的领域很多,关涉的部门和法律关系也远比现行的认识复杂,故此,从长远发展看,十分有必要从国家层面统一、系统、规范地制定并施行有关自动驾驶领域数据安全与联通治理的基础性法律,以避免各部门、各地区间各自为政、规则不联通,甚至规则打架,提高治理效能本身也是推动自动驾驶技术及产业长期健康发展的应有之义和关键基础。
目前已经初步建立起了关于自动驾驶领域数据安全与联通使用的基本制度架构,然而由于上述规范性文件的制定主体、关切重点以及制定技术等方面的差异,自动驾驶技术及产业发展欲行稳致远,规范有序发展,还需要做进一步精细化应对,特别是从实践反馈中去及时修正、补充或升级相关规范文件,更好地平衡好自动驾驶领域数据安全与数据共享的关系,从而使自动驾驶的安全得以保障、技术得以发展。概言之,针对当前自动驾驶领域数据安全规范性文件位阶不高、较为分散、技术性强及操作性弱,容易导致执法司法部门难识别,形成“一刀切”的结果,过于严格限制自动驾驶领域数据流转与共享并非是最优的安排,也不利于自动驾驶技术的创新及产业的长远发展。
自动驾驶数据治理构想
平衡自动驾驶下多方主体数据权益。实践中维护自动驾驶场景下数据安全的关键在于合理厘定数据权益归属以及平衡多主体间数据权益与责任,在确保数据安全的基础上,推动自动驾驶场景下数据的开放共享,实现数据联通,提高数据使用效能。
首先,应以数据动态流转中的权益配置为基准纵向分配与数据相关的权益。数据要素唯有在高效和有序的动态流转中才能激活生产力,加速经济社会价值创造。需结合数据要素在收集、存储、加工、传输等各流转环节中数据运行机理进行数据权益链上的纵向权益分配,能够更清晰地呈现数据要素在流转过程中的价值增进,展现数据要素在不同场景下不同主体间发生权益让渡的现实及效果。《中共中央 国务院关于构建数据基础制度更好发挥数据要素作用的意见》提出建立数据资源持有权、数据加工使用权、数据产品经营权等分置的产权运行机制,可依此探索自动驾驶场景下数据的开放共享机制。
其次,应平衡隐私让渡与便利获得之间的关系,合理地分配各参与主体之间的数据权益。在适用《中华人民共和国个人信息保护法》中最小必要原则时,前提需明确该项技术所必要的信息数据,而对自动驾驶汽车技术之类的新技术、新产品和新服务,在实践中很难明确哪些信息是必要,故难以界定车企收集数据信息的范围是否过当、是否违法,在此场景下很难准确平衡用户、车企及第三方程序或软件及服务提供者的数据权益。自动驾驶汽车所收集的数据与一般数字企业所收集的数据有所不同,其收集的数据更具多归属性、强技术性、持续交互性等特征,故在数据动态流转过程中分配数据资源持有权、数据加工使用权、数据产品经营权时,也需考虑在自动驾驶场景下多主体数据权益的横向分配问题,特别是对驾驶数据持续交互性特征的关注,做好数据的解析和离散分析,妥当配置驾驶数据的权益分配。
以数据采集为例,虽然自动驾驶场景下收集数据具有广泛性,但是其目的主要是服务于驾驶需要,故应以功能作为区分基准,可将数据大致分为三类:环境与路况数据、状态与行为数据以及用户个人数据。
环境与路况数据主要包括自动驾驶汽车正常行驶所必要的、为学习型算法所提供的路面障碍、天气情况、交通状况、交通摄像头等该地域的行驶信息,此时自动驾驶车辆只扮演收集器的作用。状态与行为数据包括驾驶员的状态、车辆本身的发动机、刹车等信息,为特殊状态下的算法提供数据。用户个人数据则包括个人行程、网络、娱乐等除行驶信息以外的数据,主要用以判断用户的舒适度。
可以看到,通过对自动驾驶场景下数据功能进行类型化区分,可以较为清晰地划分各类数据权益归属边界。具体来讲,对与车辆行驶有关的数据,车商与用户在签署购买或使用协议时可以作为一般条款,然而,如涉及个人信息且与驾驶情况无关的隐私数据,则应单独征得用户同意,并且以上整个数据采集、使用及管理过程都需让用户明确知情。以此,便可较好地平衡车企、用户及其他合法的第三方的数据权益,统筹数据保护与数据共享联通的利益需要。
建立健全算法记录留存、公开与备案制度。鉴于目前多数围绕自动驾驶汽车的纠纷与争议来自于车商是否通过算法吞噬了事故发生时的数据以及算法记录是否存在缺陷,对于算法记录的留存、公开与备案工作应予跟进,至少包括以下方面:
其一,自动驾驶算法记录应当得到妥善保管,在保证算力与维护运行周期的前提下,为交通肇事的裁判提供完整的依据,不允许擅自篡改、删除相关记录数据,并设置平台向主管机关传输保存数据的义务。
其二,建立健全披露算法记录及备案制度,不仅在争议案件中需向执法司法机构及时提供相关算法记录及备案情况,还应引入公平、公正、专业化的第三方监督机构对自动驾驶算法记录进行监督。这一点《互联网信息服务算法推荐管理规定》第24条中已有提及,该条规定“具有舆论属性或者社会动员能力的算法推荐服务提供者应当在提供服务之日起十个工作日内通过互联网信息服务算法备案系统填报服务提供者的名称、服务形式、应用领域、算法类型、算法自评估报告、拟公示内容等信息,履行备案手续”。
然而,由于该条款仅提及“具有舆论属性或者社会动员能力的算法推荐服务提供者”,并未涉及自动驾驶场景下涉及驾驶功能的算法服务,故很难要求车企就其驾驶场景下的算法及记录进行主动备案,下一步还需要解决好自动驾驶算法治理的问题。
规范数据共享治理推动自动驾驶场景下数据联通。自动驾驶数据,需要通过共享和流转,才能释放其最大价值。《中共中央 国务院关于构建数据基础制度更好发挥数据要素作用的意见》为数据要素市场化的建设提供了基础性指导,同时还需要通过完善丰富法律法规文件中对于数据互联互通的规定,推动各车商最大限度地进行合作。与此同时,特别要注意的是,自动驾驶车商所收集的数据不仅致力于研发汽车,更是意在与自动驾驶配套的智慧路网,而道路交通属于基础设施的范围,如果其数据不及时与政府、监管者进行同步,在利益驱使下一些超大型平台企业有可能在社会公共基础设施领域建立起数据围墙。为此,政府需尽快推动并规范公私主体间的数据共享,在保证公共数据服务安全的基础上,推动数据要素市场化配置。
自动驾驶技术的不断发展及产业化、商业化运用,推动着智能交通的高速建设与发展,在这一过程中保障和推动自动驾驶行稳致远的关键在于自动驾驶场景下数据的安全与联通。在做好自动驾驶数据合规收集和使用的前提下,完善数据的保护与联通,才能为自动驾驶技术及产业的健康发展奠定坚实的制度基础,着实有效推动我国在车联网、物联网深度融合乃至整个社会智能交通领域的安全发展。
(作者为南开大学法学院副院长、教授、博导,南开大学竞争法研究中心主任,中国新一代人工智能发展战略研究院特约研究员)
【注:本文系教育部人文社会科学重点研究基地重大项目“全球数据竞争中人权基准的考量与促进研究”(项目编号:19JJD820009)及2023年度最高人民法院司法研究重大课题“数据权益知识产权司法保护问题研究”(课题编号:ZGFYZDKT202317-03)阶段性成果】
【参考文献】
①郑戈:《数据法治与未来交通——自动驾驶汽车数据治理刍议》,《中国法律评论》,2022年第1期。
②陈禹衡:《〈数据安全法〉下自动驾驶算法数据的分类、保全与合规》,《科技与法律(中英文)》,2022年第3期。
③叶强:《德国自动驾驶立法评析》,《国外社会科学》,2022年第2期。
责编/于洪清 美编/宋扬
声明:本文为人民论坛杂志社原创内容,任何单位或个人转载请回复本微信号获得授权,转载时务必标明来源及作者,否则追究法律责任。