数据空间
数据空间是一个相对较新的概念,它涉及到数据的存储、共享和流通,以及数据主权和安全性的保障。以下是对数据空间概念的详细解释:
定义与特性
数据空间可以被理解为一种互相信任的合作伙伴之间的数据关系,其中每一方都对其数据的存储和共享适用相同的高标准和规则1。它是一个虚拟的空间,旨在解决数据权属管理问题和确保数据安全交换共享2。数据空间不是集中存储数据,而是存储在数据来源处,只有在必要时才会通过语义互操作性共享数据1。
技术框架与创新
数据空间技术框架是由中山大学孙伟教授带领的团队在2013年首次提出的,它是一个面向全对象全生命周期的分布式多元标签数据存储的底层技术框架3。这个框架基于大数据分布式存储技术,为数据的存储和共享提供了一种创新的解决方案。
数据主权与交换
在数据空间中,数据提供方(Data Provider)通过IDS连接器(IDS Connector)将数据所有者(Data Owner)的数据传入数据空间,从而进行数据的交换和处理4。数据空间是具有自主权的数据在数据驱动的价值链中进行交换和处理的空间4。
主体与公共数据空间
主体数据空间是公共数据空间的一个子集,随着主体需求的不断变化,数据项会从公共数据空间纳入到主体数据空间中5。这表明数据空间可以根据不同的主体需求进行定制和调整。
转型与创新机遇
数据空间是网络空间从“计算为中心”向“数据为中心”转型的一种新形态,它蕴含着变革性的重大科技问题和创新机遇6。北京大学在数据空间领域处于领先地位,并致力于解决数据空间建设发展中的“卡脖子”问题6。
全球可信数据空间
全球可信数据空间的构建可以保护公司和组织的数据主权,支持创建全球价值7。这种数据空间的实现有助于在全球范围内构建单个行业和跨行业的数据空间。
国际数据空间 (IDS)
国际数据空间 (IDS) 是一个利用现有标准和技术,以及在数据经济中广为接受的治理模型,以促进安全可信业务生态系统中的标准化数据交换和数据链接8。它为创建智能服务场景和促进跨公司创新提供基础业务流程,同时保证数据所有者的数据主权8。
发展倡议与合作
《数据空间发展倡议(Data Spaces Development Initiative)》由北京国际数据实验室和国际数据空间协会(IDSA)联合发布,旨在推动数据空间的国际合作与发展9。
可信数据空间 (TDM)
可信数据空间 (Trusted Data Matrix, TDM) 是一种新兴的概念,它被视为数据资源共享的数字化基础设施,旨在促进不同利益攸关方在保障数据主权的前提下,进行可信、安全、透明的数据共享、交换、流通与交易10。这一概念首先在欧洲提出,并发布了相关的参考架构,为各公司提供了产品开发的指导10。
综上所述,数据空间是一个多维度、跨学科的概念,它不仅关注数据的存储和共享,还涉及到数据主权的保护、数据安全以及数据驱动的创新。随着技术的发展和国际合作的推进,数据空间有望成为未来数据管理和流通的重要平台。
数据空间技术框架是如何实现数据的分布式存储的?
数据空间技术框架实现数据的分布式存储主要通过以下几个方面:
-
多节点存储:分布式存储架构将数据存储在多台计算机或服务器上,这样可以提高数据的可靠性、可扩展性和性能。每个节点都参与数据的存储和访问,从而实现数据的高可用性。"分布式存储是一种计算机数据存储架构,它将数据存储在多台计算机或服务器上,以实现数据的高可靠性、可扩展性和性能。"11
-
数据组织与计算模型:针对特定的数据处理需求,如Apache Spark的数据组织与计算模型,结合分布式数据库如Apache HBase,设计并实现分布式空间数据存储结构与对象接口。这允许系统更有效地组织和处理大规模空间数据。"针对Apache Spark的数据组织与计算模型,结合Apache HBase分布式数据库,从分布式GIS内核的理念出发,设计并实现了分布式空间数据存储结构与对象接口。"12
-
解决集中式存储的局限性:传统的集中式存储在处理大数据时存在局限性,如存储对象的适应性、存储能力的可扩展性及高并发处理能力。分布式存储通过分散数据到多个节点,解决了这些问题。"首先分析了基于传统的集中式存储与管理模式在处理和应用大数据方面的局限性,包括存储对象的适应性、存储能力的可扩展性及高并发处理能力要求;"13
-
分布式文件系统:分布式文件系统是实现非结构化数据存储的关键技术。例如,Google File System (GFS) 是一个著名的分布式文件系统,它通过分布式架构来存储和管理大量数据。"分布式文件系统是实现非结构化数据存储的主要技术,说到分布式文件系统就不得不提GFS(全称为"Google File System")。"14
通过这些方法,数据空间技术框架能够有效地实现数据的分布式存储,提高数据处理的效率和可靠性。
数据主权在数据空间中是如何得到保障的?
数据主权在数据空间中的保障是一个多维度和多层次的过程,涉及到国家层面的法律、国际组织的管辖以及国际法律条约的制定和执行。首先,国家需要在本国范围内制定和实施相关法律,确保数据的管理和使用符合本国的法律、惯例和习俗。这包括对数据的收集、存储、处理和传输等各个环节进行规范,以保护数据安全和个人隐私权17。同时,国家还需要采取一系列方法控制本国互联网基础设施中生成或通过本国互联网基础设施生成的数据,以实现对本国数据的自主掌控17。
其次,数据主权的保障还需要依赖于国际组织的管辖和协调。各类国际组织通过制定和推广国际标准、规则和最佳实践,为数据主权的实现提供指导和支持。这些国际组织可能包括联合国、世界贸易组织、国际电信联盟等,它们在数据治理、网络安全、隐私保护等方面发挥着重要作用15。
最后,数据主权的有效实现还需要各国之间的协商和合作,通过签订和遵守相关的国际法律条约来实现。这些法律条约可以明确各国在数据治理方面的权利和义务,为数据主权的跨国界保护提供法律基础。通过这些国际法律条约,各国可以在相互尊重和平等的基础上,共同维护数据主权和数据安全15。
综上所述,数据主权在数据空间中的保障是一个涉及国家法律、国际组织管辖和国际法律条约的复杂过程。通过这些措施,可以确保数据的安全、保护个人隐私,促进数字经济的健康发展,维护国家安全和发展的核心利益1618。
主体数据空间与公共数据空间之间有何区别和联系?
主体数据空间和公共数据空间是欧盟数据空间概念中的两个重要组成部分,它们之间存在明显的区别和联系。
首先,主体数据空间通常指的是由数据持有者所控制的数据空间。根据DGA的定义,数据持有者是法人,他们不是相关特定数据的数据主体,但拥有数据的控制权和使用权20。这意味着主体数据空间主要涉及企业或组织所持有的数据,这些数据可能包括商业秘密、客户信息等,通常与企业的运营和商业活动紧密相关。
而公共数据空间则涉及到公共部门或政府机构所持有的数据。这些数据通常包括公共政策、科学研究、环境监测等领域的数据,它们对公众具有较高的透明度和可访问性。公共数据空间的目的是促进数据的共享和再利用,以支持社会的整体利益和公共价值22。
尽管主体数据空间和公共数据空间在数据的来源和性质上存在差异,但它们之间也存在联系。一方面,主体数据空间和公共数据空间都可以被视为欧盟数据空间的一部分,它们共同构成了一个统一的数据基础设施平台和空间21。在这个平台上,不同类型的数据可以相互流通和应用,从而实现数据的最大化利用。
另一方面,主体数据空间和公共数据空间之间的联系还体现在数据的共享和交换上。例如,企业可能会利用公共数据空间中的数据来改进其产品和服务,而公共部门也可能需要主体数据空间中的数据来制定更有效的政策和决策。通过这种数据的共享和交换,可以促进不同行业、不同地区、甚至不同国家之间的数据互操作性,推动欧洲单一数据市场的发展22。
总之,主体数据空间和公共数据空间在欧盟数据空间中扮演着不同的角色,但它们通过统一的数据基础设施平台相互联系,共同促进数据的有序流通和应用,为实现智能时代的网络空间架构提供支持23。
北京大学在数据空间领域解决的“卡脖子”问题具体指的是什么?
北京大学在数据空间领域解决的“卡脖子”问题,具体指的是在数字集成电路后端设计中,由于生成数据需要的大量人力和时间成本,导致大规模公开数据集较为缺乏的问题。这一问题的存在,限制了领域内AI技术的发展和应用,因为高质量的公开数据集是推动领域发展的重要支撑。为了解决这一问题,北京大学可能正在探索和开发新的技术或方法,以降低生成数据的成本,提高数据集的规模和质量,从而推动数字集成电路后端设计领域的进一步发展。25
国际数据空间 (IDS) 如何促进安全可信业务生态系统中的标准化数据交换和数据链接?
国际数据空间(IDS)是一个创新的概念,旨在通过利用现有的标准和技术,以及在数据经济中广为接受的治理模型,来促进安全可信业务生态系统中的标准化数据交换和数据链接。根据29的描述,IDS的实现主要依赖以下几个方面:
-
利用现有标准和技术:IDS框架建立在现有的技术基础之上,确保了其与现有系统的兼容性和互操作性。这为数据交换提供了一个稳定和可靠的技术平台。29
-
数据经济中的治理模型:IDS采用了在数据经济中广泛接受的治理模型,这些模型有助于确保数据交换过程中的合规性、透明度和责任性。通过这些治理模型,可以建立起各方对数据交换的信任。29
-
促进安全可信的业务生态系统:IDS的设计目标是创建一个安全可信的业务环境,其中数据交换和链接可以在信任的基础上进行。这种环境的建立有助于减少数据交换过程中的风险,提高数据的安全性和可靠性。29
-
标准化数据交换:通过标准化的数据交换流程,IDS确保了数据在不同系统和平台之间的无缝传输和接收。这种标准化有助于降低数据交换的复杂性,提高效率。29
-
数据链接:IDS支持数据链接,即在不同的数据源和应用之间建立直接的联系,使得数据可以被更有效地利用和分析。这种链接机制有助于实现数据的互联互通,促进数据的流动性和可用性。29
通过这些方法,国际数据空间(IDS)能够有效地促进安全可信业务生态系统中的标准化数据交换和数据链接,为数据的共享、流通、交换和交易提供了一个更加安全、透明和高效的环境。29
数据空间定义1 | 数据空间概念 数据空间是互相信任的合作伙伴间的数据关系,强调数据存储和共享的高标准和规则。 |
德国数据空间行动2 | 德国数据空间 探索建立可信数据市场,构建数据流通共享生态的虚拟架构。 |
中山大学数据空间技术框架3 | 中山大学数据空间 由孙伟教授团队提出,基于大数据分布式存储技术的创新成果。 |
数据提供方与数据空间4 | 数据提供方角色 数据提供方通过IDS连接器将数据传入数据空间,实现数据交换和处理。 |
主体数据空间与公共数据空间5 | 数据空间关系 主体数据空间是公共数据空间的子集,随需求变化数据项不断纳入。 |
北京大学数据空间技术研究中心6 | 数据空间转型 北京大学聚焦数据空间建设,解决“卡脖子”问题,推动数联网基础设施发展。 |
全球可信数据空间价值7 | 全球数据空间 构建行业和跨行业数据空间,保护数据主权,支持全球价值创造。 |
国际数据空间(IDS)8 | 国际数据空间 利用现有标准和技术,促进安全可信业务生态系统中的标准化数据交换。 |
数据空间国际产业论坛9 | 数据空间倡议发布 《数据空间发展倡议》由北京国际数据实验室和国际数据空间协会联合发布。 |
可信数据空间(TDM)概念10 | TDM概念 作为数据资源共享的数字化基础设施,促进数据共享、交换、流通与交易。 |
数据空间1 | 数据共享平台 数据空间是互相信任的合作伙伴间的数据共享关系,强调数据存储和共享的高标准和规则。 |
德国数据空间2 | 数据市场构建 德国数据空间旨在建立可信的数据市场和数据流通共享生态,基于标准通信结构实现数据安全流通。 |
中山大学信息技术教育部重点实验室3 | 技术框架创新 由孙伟教授带领的团队提出面向全对象全生命周期的分布式多元标签数据存储技术框架。 |
数据提供方(Data Provider)4 | 数据传输角色 负责将数据所有者的数据通过IDS连接器传入数据空间的设备或服务。 |
主体数据空间5 | 数据空间子集 主体数据空间是公共数据空间的子集,随着需求变化,数据项从公共数据空间纳入主体数据空间。 |
北京大学数据空间技术与系统研究中心6 | 科技问题研究 聚焦数据空间建设发展,解决“卡脖子”问题,开展数联网基础设施理论研究。 |
全球可信数据空间7 | 数据主权保护 构建行业和跨行业数据空间,保护公司和组织的数据主权,支持全球价值创造。 |
国际数据空间 (IDS)8 | 标准化数据交换 利用现有标准和技术,促进安全可信业务生态系统中的标准化数据交换和数据链接。 |
国际数据空间协会(IDSA)9 | 产业论坛组织 联合主办数据空间国际产业论坛,发布《数据空间发展倡议》。 |
可信数据空间 (Trusted Data Matrix, TDM)10 | 数字化基础设施 促进不同利益攸关方在保障数据主权下进行数据共享、交换、流通与交易。 |
孙伟教授3 | 数据空间技术框架领导者 孙伟教授是中山大学信息技术教育部重点实验室团队的领导者,创新成果包括数据空间技术框架。 |
北京大学数据空间技术与系统研究中心6 | 数据空间研究主力军 北京大学数据空间技术与系统研究中心,专注于数据空间建设发展,解决关键技术问题。 |
北京国际数据实验室9 | 数据空间倡议发布者 与国际数据空间协会联合主办论坛,发布《数据空间发展倡议》。 |
国际数据空间协会(IDSA)9 | 数据空间国际合作推动者 与北京国际数据实验室联合发布《数据空间发展倡议》。 |
中国信通院两化所10 | 数据空间概念推广者 推广可信数据空间概念,促进数据资源共享。 |