数据科技是释放数据要素价值、驱动新质生产力的核心支撑。“十五五”规划建议提出,加快高水平科技自立自强,引领发展新质生产力。近期,国家数据局发布《关于加强数据科技创新的实施意见》,进一步为数据科技创新划定了“路线图”与“施工图”,标志着我国数据科技发展进入体系化布局、协同化推进的新阶段。多位专家将深入解读数据科技前沿趋势、技术突破路径与产业融合实践。
近日,国家数据局发布《关于加强数据科技创新的实施意见》(以下简称《实施意见》),对数据科技的技术攻关和高水平应用等提出了具体的要求。《实施意见》明确定义,数据科技是以发挥数据叠加倍增作用、释放数据要素价值为目标,系统性构建的数据科学、技术与工程体系。
从这个定义可以看出,数据科技是一个具有鲜明中国特色的新科技概念。其特色主要体现在三个方面:一是体现在目标导向上。数据科技旨在推动数据在社会经济发展中的深度融合与应用,充分释放数据作为新型生产要素的价值,服务于国家数字经济发展与数字化转型的战略需求;二是体现在体系架构上。数据科技并非单一技术,而是涵盖数据供给、流通、利用和安全等关键环节的技术体系。这种面向应用场景的分类方式,更有助于理解数据科技对数据产业全链条的支撑作用;三是体现在发展需求上。数据科技与现有大数据技术密切相关,同时又对其提出了新的系统性要求。为适应数据要素市场化配置与价值释放的需要,迫切需要对现有大数据技术体系进行重构与升级。
国家数据局成立以来,通过一系列政策文件与实际行动,有力推动了数据要素市场的培育与发展。然而,数据资源要真正转化为现实生产力,除了制度保障之外,也离不开数据科技的有力支撑。相关文件的出台与数据科技的进步,必将对我国数据要素市场建设与数字中国进程产生深远影响。
厘清数据科技发展的底层技术逻辑
数据科技是面向数据要素价值化这一目的而构建的数据供给、流通、利用和安全等技术,除了少数特定技术外,其多数技术能力根植于大数据、人工智能、信息安全等基础信息技术之中。
具体可从数据价值实现过程来理解二者的关系: 一是让数据“供得出”,核心在于数据汇聚与集成。需要破解数据孤岛问题,从各类异构信息系统中低成本、高可靠地提取、重组与汇聚数据,并实现数据的长期保存与就绪可用。数据需要在支持业务功能实现的同时,在源头就实现数据要素化;二是让数据“流得动”,核心在于跨域数据管理与协同。为促进数据在不同主体间的安全有序流动,需对数据流通过程进行访问控制、全程留痕、可信审计,并支持跨域的数据查询、处理分析,这对数据管理、处理和治理技术都提出了更高要求;三是让数据“用得好”,核心在于多模态大数据分析与大模型训练。当前数据分析技术已形成从传统关联分析、机器学习到深度学习、神经网络乃至大模型驱动的广谱分析体系,正朝着更深度的语义理解与更精准的决策支持演进。大模型训练需要大量的高质量的数据集,这也是使用数据的重要形态;四是让数据“保安全”,核心在于数据治理与安全合规。这涉及数据全生命周期的权限控制、加密保护、隐私计算、合规审计等技术。与传统的信息安全技术侧重点有所不同,必须从支撑数据流通与价值释放的视角,体系化构建兼顾安全与利用的数据流通安全治理方案。
由此可见,数据科技与基础信息技术,尤其是大数据技术和信息安全技术,紧密相关且深度融合。数据科技的进步,在很大程度上依赖于大数据等相关基础技术的持续突破与适配演进。
构建数据科技发展的“以数据为中心”大数据技术体系
《实施意见》在总体要求中明确了数据科技关键技术的发展目标,到2027年要在数据供给、流通、利用和安全等关键技术和设备实现阶段性突破,到2030年数据领域关键技术达到国际领先水平。这一目标艰巨而光荣,是我国数据科技工作者的历史使命与发展机遇。为了实现这一目标,《实施意见》从基础研究、技术攻关、概念验证、成果转化等技术发展的全链条进行了系统部署。
一是要加强基础研究和应用基础研究。数据要素化要求我们应该从数字孪生视角去看待数据的组织模式,以物理世界和人类社会的“对象”为核心进行组织与汇聚。传统信息系统以业务流程为中心组织数据,优化目标是提高系统的处理效率;未来则应推动数据与应用系统解耦,以数据价值释放为最终优化目标,构建独立于具体应用系统的数据资源体系。数据的价值来源于数据的“流动”,没有数据之间的汇聚、融合、分析,就不可能产生新的价值。数据的价值如何度量?数据流动的背后的规律是什么?需要什么样的数据流通基础设施?这些问题都值得深入去研究。国家数据局联合国家自然科学基金委员会曾发布数据要素专题项目来支持数据科技的基础研究,相信未来还会有更多的基础研究类项目支持数据科技领域的前沿问题研究。
二是要加强关键数据技术的攻关突破。用“以数据为中心”的学术思想,重构大数据技术体系,是攻关突破的方向。以数据为中心就是要以数据的高效可信的供给、流通和利用为中心,“跨域”是其中最为核心的挑战与主战场。这里的“跨域”具有多重含义,至少包括跨空间域、跨管辖域、跨信任域等,根源在于数据需要在不同主体间高效地共享流动,还要构建可信的环境,保障数据的权属和数据的安全。因此,未来大数据技术(管理、处理、分析、治理)必须将“跨域协同能力”作为设计的核心考量。当然,“以数据为中心”的内涵还需要我们在数据科技的持续技术攻关中不断深化。国家数据局之前曾对数据流通基础设施提出了多种可能的解决方案,包括可信数据空间、数联网等,数据科技的关键技术攻关需要针对这些数据流通基础设施形成可行的大数据技术的集成方案。
三是以场景推动数据技术的落地,形成新质生产力。国际领先水平需要体现在对新兴产业的支撑上,体现在赋能社会经济高质量发展里,体现在大国博弈的科技自立自强中。《实施意见》对科技成果转化进行了全链条布局,明确提出了要布局建设一批数据领域的概念验证、中试基地、检验检测等平台,通过“高价值、广覆盖、强牵引”的数据科技应用场景,为技术验证提供“试验田”。这正是我们科技创新的举国体制的优势所在。
国家数据局印发《实施意见》,明确提出加强数据科技创新,将极大地推动“十五五”时期我国数据事业的发展。我们应牢牢把握这一机遇,推动“以数据为中心”的大数据技术体系重构,力争在由中国引领的数据科技发展道路上取得突破、发挥关键作用。(作者杜小勇系中国人民大学教授)
(人民网记者许维娜整理)