1、大数据时代我们需要什么样的密码系统?北京工业大学北京工业大学 计算机学院计算机学院 信息安全系信息安全系提纲问 题1大大 数数 据据2挑挑 战3展展 望望42/29问 题1大 数 据2挑 战3展 望43/291.问题问题的起源:大数据问题的起源:大数据社交网社交网络络(Social Network)无无线传线传感器网感器网络络(Wireless Sensor Network)物物联联网网(The Internet of Things)云云计计算算(Cloud Computing)大数据大数据(Big Data)4/291.问题问题的所在:大数据安全问题的所在:大数据安全5/291.问题问题的重
2、要性:推广大数据走向实用问题的重要性:推广大数据走向实用大数据安全技术大数据安全技术6/291.问题问题的核心:密码理论问题的核心:密码理论安全存安全存储储安全安全计计算算安全安全传输传输安全安全审计审计密码7/291.问题讨论的话题讨论的话题大数据时代我们需要什么样的密码系统大数据时代我们需要什么样的密码系统8/291.问题讨论的角度讨论的角度SystemApplicationSecurityCryptography9/29问 题1大大 数数 据据2挑 战3展 望410/292.大数据大数据特点大数据特点(耳熟能详的耳熟能详的):4V数据量大数据量大(Twitter每天每天产生产生12TB的
3、数的数据量据量)产生速度快产生速度快(每秒有每秒有5百万的百万的交易事件产生交易事件产生)数据种类多数据种类多(包含结构化包含结构化和非结构化数和非结构化数据据)真实性和准确性真实性和准确性(单条数据价值有单条数据价值有限限)11/292.大数据大数据特点大数据特点(深层次的深层次的):?4V?12/292.大数据大数据特点大数据特点(深层次的深层次的):从:从随机随机到到全体全体预处预处理理随机样本随机样本处处理理知知识识样本空间样本空间传统处理模式传统处理模式大数据处理模式大数据处理模式知知识识样本空间样本空间13/292.大数据大数据特点大数据特点(深层次的深层次的):从:从精确精确到到
4、混杂混杂传统要求传统要求大数据要求大数据要求精确精确样本集(结构化、无噪声结构化、无噪声)算法(复杂、精确复杂、精确)知识(准确反映对应关系准确反映对应关系)混混杂杂样本集(允许非结构化和噪声允许非结构化和噪声)算法(简单,可能不准确简单,可能不准确)知识(允许不同粒度准确性允许不同粒度准确性)14/292.大数据大数据特点大数据特点(深层次的深层次的):从:从因果因果到到相关相关传统知识传统知识大数知识大数知识为为什么?什么?是什么?是什么?传统的知识追求因果性,要揭示两者之间或者现象的背后的因果关系。但有时候是非常困难的。大数据知识借助海量数据,可以揭示两者之间的相关性如何?或者根据已有数
5、据给出预测。疫情预警疫情预警价格预测价格预测推荐系统推荐系统15/29问 题1大大 数数 据据2挑挑 战3展 望416/293.挑战效率效率效效率率决决定定实实用用性性17/293.挑战效率效率RSAFHEIBE/ABEAES18/293.挑战功能功能如何保如何保证证加密后的数据能加密后的数据能够够支持支持这这些些处处理和理和业务业务流程?流程?19/293.挑战功能功能二进制流加密算法密文文本图像视频音频明文传统传统加密算法加密算法的工作模式的工作模式20/293.挑战功能功能FHEIBE/ABE传统传统加密算法的工作模式加密算法的工作模式应应用和用和业务业务流程流程21/293.挑战思维模
6、式思维模式22/293.挑战思维模式思维模式混混杂杂精确精确全体全体采采样样相关相关因果因果可行吗?可行吗?必要吗?必要吗?一样吗?一样吗?23/293.挑战思维模式思维模式单单向函数向函数OWF伪伪随机数随机数发发生器生器PRGPPT计计算算能能力力选择选择明文攻明文攻击击CPA语义语义安全安全/不可区分性不可区分性IND不可延展性不可延展性Non-Malleability伪伪随机函数随机函数PRF选择选择密文攻密文攻击击CCA24/29问 题1大大 数数 据据2挑挑 战3展展 望望425/294.展望轻量级的快速加密算法轻量级的快速加密算法安全安全效率效率26/294.展望支持密文处理的加密算法支持密文处理的加密算法数数值计值计算算数据数据库检库检索索图图像像处处理理搜索搜索27/294.展望基于知识的加密算法基于知识的加密算法数据数据获获取取数据存数据存储储数据数据检检索索数据挖掘数据挖掘知知识获识获取取把整个知识发现的任务当做是明文!把整个知识发现的任务当做是明文!28/29谢谢!北京工业大学北京工业大学 计算机学院计算机学院 信息安全系信息安全系