Broadchain

隐私计算S2赛季:安全性与误差评测的「荒岛求生」

算力智库 2020-11-04 18:22 1547

隐私计算元年,群雄逐鹿,竞争日趋激烈。纵观行业整体发展,从自然生长到精耕细作,安全是绕不开的话题,也是技术领域细分赛道的决胜关键。 本期算力隐私数据安全专栏特邀郭嘉,探讨技术如何在项目中完成安全性证明,直至在隐私计算S2赛季完成加冕。

上周阅读到文章《隐私计算S2赛季「谁是真正的王者」》,对其中有一条提到的安全性和误差评测,尤其感兴趣。因为我从数十家客户的实际交付环节,看到审计对安全证明的必要性,同时也看到业务对联邦学习存在误差的纠结。证明一件事情正确是很困难的,那叫定理;当定理被大家都公认了,可能就是公理了。联邦学习项目又是一个综合性的复杂工程,证明安全,何其容易?取其名曰:荒岛求生。富数隐私计算平台Avatar从底层密码、算法到通信,完全自主研发,可以事无巨细地进行多维度评测。因此,本文将以富数科技的安全性评估体系为例,希望为行业带来一点小小的参考。

1、Avatar 安全评估体系

Avatar安全评估体系方案针对多方联合建模产品的安全性进行验证,涉及模块如图:


图:Avatar安全体系评估八要素

2

融合过程的安全性检测

1)安全融合原理

2)安全融合通信


3)通信事件抓包这里举例对加密数据进行私钥盲签名,发送方:HOST,事件名称:inter_to_guest_1_0 事件描述:私钥对加密数据进行盲签名 blind_sid,抓包截图:

反序列化的结果:


4)安全性分析为验证算法安全, 对”盲化 ID”和”ID 除盲”两个过程进行断点输出,输出中间临时 数据,以便方便验证算法安全,真实线上环境不会存在该输出动作。GUEST 一方中间数据断点输出两份数据, 即中间结果数据临时输出存储到本地。验证解析对比如下:1) 原始数据 ID + 随机掩码 + HOST 公钥(inter_pubkey 数据 e_data) = inter_to_host_1 数据 e_data;   

通过正向逻辑计算 reh 值与步骤4通信的反序列化数据进行对比2) inter_to_guest_1 数据 e_data 进行 ID 除盲 = DA,为 guest 方中间计算结果; 

5)准确性分析

采用线上+线下的对比测试进行验证,分析原理简单,此处略去。

3

联邦学习的误差分析

Avatar联邦学习过程精度解析

1)安全融合

运行线下验证脚本并进行截图, 得出两方数据对齐后的ID条数为39, Avatar 运行结果表明对齐ID条数统计(加表头)共计40条,即实际对齐条数39条,与线下对齐结果一致。

2)特征工程

下方为本地脚本运行截图,使用等频分箱方式,分箱后对目标变量单一取值的箱进行区间合并,通过结果对比,可知联邦计算与本地计算各指标结果相同。

3)模型训练

两任务以相同参数进行模型训练,通过结果对比可知密文计算较明文计算在保证数据安全的前提下,结果几乎无损。

 

4、Avatar监控大盘

在富数科技自研创新能力的加持下,Avatar 行业首创安全驾驶舱,让复杂的多方安全计算原理从黑盒变成白盒,让安全可视化,提高了安全的可解释性,让用户掌握更强的系统运营能力。

Avatar 支持参与各方完全直连,无需任何第三方,解决了甲乙两方安全建模找不到合适第三方的问题,让合作双方获得更加自主可信的数字空间。

Avatar“驾驶舱” - 安全性监控大盘

小结

正如文中所说,隐私计算开始进入了比较白热化的赛季,这种竞赛表现在行业客户对厂商的选型与评测,在我们经历的所有客户,或多或少存在正面交流切磋,以终为始,客户第一,一定是这个阶段最重要的。隐私计算软件作为一个安全软件的范畴,软件平台自身的安全性也相当重要。快与慢之间、精确与误差之外,只有和业务紧密结合,才可以做到可用。

 】

声明:BroadChain Finance网站和App所发布的内容,均不构成任何投资建议。

算力智库

专注区块链、人工智能、大数据等领域深度原创报道、调研报告、产业咨询研究的数字经济智库平台。用专业化的视角为您解读分析数字科技的最新热点与主题,挖掘数字经济与实体行业融合、迭代的应用价值与资本价值

64 篇 作品
13.35W 总阅读量