安全开采数据“富矿”:隐私计算基建的融合与进击

2023-12-20 16:20

本文主要是介绍安全开采数据“富矿”:隐私计算基建的融合与进击,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

b5210833fce69739e0b435b159bcdc76.png

信息的传递是人类文明的基础。从古人的结绳记事开始,到以文字作为载体,如今的数字时代,数据与我们的生产、生活深度交融。对数据的充分挖掘与分析,也让科技与产业走向了应用的深处,改变了我们的生产、生活与消费。

数据的流通价值有目共睹,拿大部分人都使用过的健康码来说,其融合了大数据行程、防疫与接种的信息,是我们疫情出行的保障。而这些数据的共享对抗疫作用显著。“健康码”、“行程码”的背后是全国范围内的大数据支撑。公共健康数据的互联互通,不仅仅只是局限在疫情中发挥效用,在未来公共卫生紧急情况下,数据可以帮助政府更好地分析预测,让政府作出更加科学的决策以保障民众的健康与安全。


在医疗领域,数据安全的共享是 “两难又两全”问题,隐私数据备受关注,容易引起多方对隐私数据的监视。不过这也恰恰给了隐私计算施展的舞台与天地。在隐私信息泄露严重,但数据处理与分析的势头渐猛的矛盾中,数据的推动使用,价值与贡献,亟需隐私计算来化解流通中的难题。

509f29f6bd1256304a7bb01ec774a440.png

指数增长的生产力

在数据激增的背景下,海量的数据背后屹立着千行百业,行业间的数据确权、竞争等情形,数据孤岛成为数据资产使用过程的最大障碍。不仅阻隔和闭塞了系统与场景的一些发展可能,对于信息的交流、整合、应用等都产生不同程度的影响。

而隐私计算成为数据价值流动过程中的唯一技术解,隐私计算能够在不暴露原始数据的情况下,实现数据的融合使用。并且隐私计算技术可以实现,精准控制数据融合使用的目的和方式,即控制数据算什么、怎么算,让数据使用监管成为可能。

隐私计算成为架起数据共享与安全的桥梁,可以让多个数据持有方的数据不仅能够正常连通协作,也可以保障数据不可见的隐秘性,完成数据的分析、计算、应用。

举例来说,我们知道在医疗领域,沉淀了许多规模化、高质量的数据,AI技术在落地的过程中,可以依赖这些优质的数据训练出效果更好的模型。但在实际的落地应用中,因为数据的隐私、确权、孤岛等问题,数据间的打通和协作阻碍重重。AI在医疗领域中理论的优势并不能完全发挥。隐私计算可以很好地解决医疗领域的数据困境问题,让数据在不可见的情形下仍能相互连通共享创造价值。

c66d8dfb816bb7537f3a75abfeb78871.png

隐私计算数据价值特性使其在数据密集的行业如金融、医疗、通信运营商、政府等领域开始落地。这些领域本身就是数据价值的高地,数据的生产与运用处于各类产业的前端。同时,这些行业对于数据的规范要求较高,对于这些领域来说,数据有效利用可以放大其背后的潜能,价值巨大。

拿金融领域来说,隐私计算主要应用于金融中的风控和营销方面。随着区块链技术的发展,隐私计算与区块链技术的结合,也可以赋能更多的金融场景,比如跨境支付、供应链金融等。在反洗钱业务中,此前由于对中小企业的经营数据掌握得不够完备,银行对中小企业的贷款非常谨慎,中小企业贷款难成为阻碍市场化发展一大恶疾,在隐私计算与区块链等技术的结合下,银行可以更好地收集到相关信息与同业机构交换参数、联合计算建模,解决了中小企业数据背调的问题。

隐私计算既能实现数据对于金融、医疗等领域科技创新的“倍增作用”,又能充分保护数据隐私,使数据在流通和融合过程中可用不可见,数据的生产力得以被充分放大,价值也随之水涨船高。

技术流派的融合

3a6d71d63687795b3573c48c3aa1f2cc.png

据国家互联网信息办公室,中国数字经济规模已达31万亿元,约占GDP三分之一。IDC数据表明,2025年全球数据量将达到175ZB,并保持指数级增长趋势。数据海量增长的背景下,数据的规范合规政策也在不断跟进。

《数据安全法》与《个人信息保护法》在去年十月左右开始陆续实施,隐私计算也成为数据安全合规应用的技术保障,成为备受期待的最优解,被资本与企业追捧。据毕马威发布的隐私计算报告预测,未来三年,隐私计算的营收服务费用可达200亿左右,而数据平台可以撬动的运营收入可达千亿级别。

在政策和市场驱动的背景下,互联网巨头、网络安全、大数据公司等初创科技企业纷纷入局,在数据价值应用的蓝海中抢占先机。大部分企业的入场时间在2018年前后,技术流派也以多方安全计算、联邦学习、可信执行环境这三种流派为主。在实际落地商用的过程中,单一路径技术的模式逐渐无法满足市场需求,三种技术路径的融合成为现下的主要趋势。目前在隐私计算赛道中,抢占赛道先位的有蚂蚁金服、华控清交、翼方健数、数牍科技、冲量在线等。

这些企业也多以金融、医疗为主要应用场景领域,金融与医疗领域是数据密集型产业,且数据蕴含的价值高,行业数据敏感,隐私计算的特性与其天生契合。金融与医疗的应用场景也不断有隐私计算落地开花结果的案例。

例如金融领域中隐私计算在银行的应用方面,可适用于联合营销、联合风控、统一授信、业务合规等,如在不暴露客户资产的情况下银行可以进行联合统计,开展客户综合管理、查询数据或提升精准营销能力等。政府方面的落地,在江浙的部分城市目前已经通过隐私计算技术,实现了政务数据和银行金融数据之间的共享,并把这些数据积极应用于反诈工作中。

d396aedb57b339beb1f228d19da4f77b.png

隐私安全计算的产品与解决方案在市场与资本中获得了强烈的反响,2021年更是被称之为“隐私计算元年”。这其中有政策利好,如数据资源正成为与人力资源、自然资源同样重要的第三类资源。数据也跟土地、劳动力、技术、资本等一样被当作生产要素写进了国家文件中。数据的应用在行业和社会层面都意义重大。

不过,在隐私计算不断落地的过程中,市场中也有另外的声音质疑:隐私计算可以保证数据的安全,那么谁来界定隐私计算系统的安全?

数据安全保护涉及的技术种类多、门槛高,各种专业术语让人晕头转向,而且因为数据不可感,只能单方面通过企业介绍来了解。这个最核心的疑虑答案,数据服务方们的共同选择是交给市场来共建行业的标准。制定隐私计算的安全标准考虑的点包含算法安全、密码安全、产品安全等多重安全风险点,互联互通的系列标准、行业场景标准及测试体系等都开始逐渐讨论与展开,隐私计算的各产业联盟共同推进技术规范与应用的落地,使其健康有序发展。

b1e7fe46d69a0c2ce6bb3d177239d583.png

有限的天花板or广阔的天地?

数据价值在分析与计算后折射的势能是不可估量的,对大数据应用或人工智能企业来说,合理边界和方式使用用户数据,已成为企业与产业的核心驱动力之一。隐私计算市场在这个态势下的起步中,有流畅的市场、政策快车道加速,也有一些路障需要跨越。

1.市场需求的表达不充分。对于金融、通信、政府等领域因为近些年互联网行业的数字化技术洗礼,接受与教育的成本低,而在工业、交通、能源等传统数据大户领域中,数字化的程度有限,推进隐私计算市场教育的成本与时间较久,市场的需求反馈准确表达有限。

2.一些行业数据的管理标准混乱,数据的开放存在障碍。例如在医疗领域中,数字化的水平参差不齐,数据的管理缺乏统一的标准,而数据的打通需要多方的协作,闭源的数据平台较多,数据方的打通协同执行程度有限。

3.隐私计算产品的标准化程度低,通用性差。隐私计算中的产品与解决方案多以定制化为主,这也意味着周期与成本的高企,规模的发展难以铺开。

在隐私计算的基建阶段,一切都在探索和尝试,需要解决的问题不少,距离设想的未来按数据交易量抽成的分润时代还较远,隐私计算和许多技术含量高的to b平台一样,是一个需要常耕深入的技术,需要玩家们做好长跑的准备,行业较为统一的共识是完全的规模化应用还得十年的时间,元年的基建时代,安心打磨技艺即可。

759ee27cfbff9603be20144ed66a5552.png

对于隐私计算的未来,市场上也有另外的声音,因为隐私计算赛道涉及敏感数据的交易、流通等,这类数据平台的建立未来会被监管列为重点关注的对象,政府或者国有企业会作为合规方来搭建,市场的隐私计算只能作为技术的供应商存在,作为生产要素的数据基础设施平台的建设,最终的控制权会被政府管制,预想的发展空间会不及理论设想,市场的天花板有限。

无论是有限的天花板理论还是无限的天地,我们可以确认的是隐私计算的独特优势都会让数据的价值发生质变。而这也意味着数据时代,促进数据生态良性发展的隐私计算会是数据发展最佳的助推器,只要锚定数据的价值,护航其跃升的隐私计算就有广阔的发展天地。至于走得多远,行的多深,市场与时间会给出答案。

7344a05b8861cfe2ecd9e08da934ed4e.gif

这篇关于安全开采数据“富矿”:隐私计算基建的融合与进击的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/516664

相关文章

Linux下利用select实现串口数据读取过程

《Linux下利用select实现串口数据读取过程》文章介绍Linux中使用select、poll或epoll实现串口数据读取,通过I/O多路复用机制在数据到达时触发读取,避免持续轮询,示例代码展示设... 目录示例代码(使用select实现)代码解释总结在 linux 系统里,我们可以借助 select、

Java JUC并发集合详解之线程安全容器完全攻略

《JavaJUC并发集合详解之线程安全容器完全攻略》Java通过java.util.concurrent(JUC)包提供了一整套线程安全的并发容器,它们不仅是简单的同步包装,更是基于精妙并发算法构建... 目录一、为什么需要JUC并发集合?二、核心并发集合分类与详解三、选型指南:如何选择合适的并发容器?在多

C#使用iText获取PDF的trailer数据的代码示例

《C#使用iText获取PDF的trailer数据的代码示例》开发程序debug的时候,看到了PDF有个trailer数据,挺有意思,于是考虑用代码把它读出来,那么就用到我们常用的iText框架了,所... 目录引言iText 核心概念C# 代码示例步骤 1: 确保已安装 iText步骤 2: C# 代码程

Pandas处理缺失数据的方式汇总

《Pandas处理缺失数据的方式汇总》许多教程中的数据与现实世界中的数据有很大不同,现实世界中的数据很少是干净且同质的,本文我们将讨论处理缺失数据的一些常规注意事项,了解Pandas如何表示缺失数据,... 目录缺失数据约定的权衡Pandas 中的缺失数据None 作为哨兵值NaN:缺失的数值数据Panda

C++中处理文本数据char与string的终极对比指南

《C++中处理文本数据char与string的终极对比指南》在C++编程中char和string是两种用于处理字符数据的类型,但它们在使用方式和功能上有显著的不同,:本文主要介绍C++中处理文本数... 目录1. 基本定义与本质2. 内存管理3. 操作与功能4. 性能特点5. 使用场景6. 相互转换核心区别

python库pydantic数据验证和设置管理库的用途

《python库pydantic数据验证和设置管理库的用途》pydantic是一个用于数据验证和设置管理的Python库,它主要利用Python类型注解来定义数据模型的结构和验证规则,本文给大家介绍p... 目录主要特点和用途:Field数值验证参数总结pydantic 是一个让你能够 confidentl

JAVA实现亿级千万级数据顺序导出的示例代码

《JAVA实现亿级千万级数据顺序导出的示例代码》本文主要介绍了JAVA实现亿级千万级数据顺序导出的示例代码,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面... 前提:主要考虑控制内存占用空间,避免出现同时导出,导致主程序OOM问题。实现思路:A.启用线程池

SpringBoot分段处理List集合多线程批量插入数据方式

《SpringBoot分段处理List集合多线程批量插入数据方式》文章介绍如何处理大数据量List批量插入数据库的优化方案:通过拆分List并分配独立线程处理,结合Spring线程池与异步方法提升效率... 目录项目场景解决方案1.实体类2.Mapper3.spring容器注入线程池bejsan对象4.创建

PHP轻松处理千万行数据的方法详解

《PHP轻松处理千万行数据的方法详解》说到处理大数据集,PHP通常不是第一个想到的语言,但如果你曾经需要处理数百万行数据而不让服务器崩溃或内存耗尽,你就会知道PHP用对了工具有多强大,下面小编就... 目录问题的本质php 中的数据流处理:为什么必不可少生成器:内存高效的迭代方式流量控制:避免系统过载一次性

C#实现千万数据秒级导入的代码

《C#实现千万数据秒级导入的代码》在实际开发中excel导入很常见,现代社会中很容易遇到大数据处理业务,所以本文我就给大家分享一下千万数据秒级导入怎么实现,文中有详细的代码示例供大家参考,需要的朋友可... 目录前言一、数据存储二、处理逻辑优化前代码处理逻辑优化后的代码总结前言在实际开发中excel导入很