2024年4月24日下午1点半,计算机学院在教1-110开展了一场主题为“大数据安全与隐私增强技术”的学术讲座,学院特别邀请了华中师范大学计算机学院副教授、信息安全系主任陈嘉耕老师为大家进行授课,旨在让在座的师生对数据安全这一领域有进一步的认识和理解。计算机学院师生共计160人参加了此次讲座。

图1 陈嘉耕教授和计算机学院副院长裴浪、院长助理叶丽萍以及各系主任
在数据为王的时代,数据化和人工智能的发展极大地提高了人们的生活便利,例如个性化推荐,同时也伴随着隐私被侵犯的问题。讲座围绕大数据环境下的数据利用和隐私保护的重要性、隐私增强关键技术、实践案例等方面展开。

图2 计算机学院参加讲座的学子们
一、数据利用和隐私保护的重要性。
随着智能⼿机的普及和物联⽹等技术的进步,⼏乎所有的⽇常活动,如⽹络浏览和购买历史,都被数据化。可以使⽤的数据量也有所增加。技术的进步使积累各种数据变得更容易,并且,随着AI技术的发展,分析积累的数据变得更容易,数据利用非常重要。同时,随着一系列数据泄露的问题的出现如 2016年facebook、2021年滴滴数据泄露等信息安全事件,隐私增强技术受到了广泛的关注,世界各国都颁布了相应的隐私法规。隐私保护法规基于OECD和ISO的隐私原则,在数据完整的⽣命周期内对其进⾏必要的隐私保护措施。中国目前的隐私法规有《⽹络安全法》 、《数据安全法草案》、 《个⼈信息保护法》等。

图3 正在授课的陈嘉耕教授
二、隐私增强关键技术
隐私增强技术(PETs:Privacy EnhancingTechnologies)作为⼀种实现和加强隐私原则的技术,是实现和加强隐私保护原则的技术的总称。 最⼤限度地减少个⼈信息的使⽤,最⼤限度地提⾼数据安全性,并使个⼈信息得到隐私保护的同时实现数据共享和分析。隐私增强关键技术主要包括认证/访问控制、加密技术、数字签名、匿名化处理、隐私计算和差分隐私。这些技术能够有效防止未经授权的数据访问和信息泄露。目前实现隐私计算的核心技术有4种。
1.私密分散技术,输⼊数据通过秘密分散分布到多个共享中,计算在多个服务器上执⾏。 收集每个结果并恢复计算结果。由于每个服务器只有⼀个共享,因此不会从单个共享中泄露任何机密,从⽽防⽌数据泄露。
2.混淆电路,将要计算的函数表示为电路,把所有密⽂输⼊作为对称加密算法的密钥来加密各⻔输出的密⽂,形成加密电路。 给定输⼊的密⽂(解密密钥),可按电路顺序进⾏解码以获得电路的最终输出。由于参与者之间仅交换密⽂,因此函数计算不需要参与者知道所有输⼊,因此可以防⽌数据泄漏。
3.同态密码,通常由两名参与者组成。 使⽤公钥加密两个输⼊,并对密⽂进⾏处理以获取⽣成的密⽂。只有拥有私钥的参与者才能解密并得到结果。 参与者之间仅交换密⽂,防⽌数据泄露。
4.硬件实现: 将参与者的输⼊收集到隔离的计算环境( TEE(Trusted Execution Environment))中,在此处进⾏处理,并将结果返回给参与者。 参与者⽆法访问TEE内部,以防⽌数据泄露。 但是,TEE 容易受到侧信道攻击,并且数据可能会从 TEE 泄漏。
三、实践案例
隐私增强技术目前在金融、医疗、IT通信等领域都有应用。在金融领域主要开展⾮法汇款的检测模型的研究,应⽤于⾦融交易的诈骗检测,例如,反洗钱(AML)和给反恐怖主义提供资⾦的检测等。在医疗领域,识别脑肿瘤的AI模型、判断COVID-19患者是否需要氧⽓补充治疗的AI模型,构建能够在早期发现脑肿瘤的预测模型。在IT通信领域,用于⾼精度的智能提示(Google) ⾼精度的语⾳识别(Apple)。
四、结论
目前,隐私增强技术(PETs)相关的法律规定和隐私治理正在建设,重点在不受个⼈信息保护法规限制的企业内部数据(包括机密信息等)上应⽤PETs,推进组织间的共同问题解决/社会问题解决的努⼒。通过社会实施和法律规范的进展,将来有望出现组织间对个⼈数据应⽤PETs的案例,期待创造新的附加价值和新的服务创新。




图4 师生踊跃提问