墨奇科技AI知识数据库讲座

Intro

从 DBMS 的发展上看,目前针对非结构化数据的 AI 知识数据库系统的欠缺。

新一代生物识别

从一个具体应用实例的角度进行介绍

AI+生物识别

行业内三条共识(要求):精准可靠主动便携保护隐私。同时也推动了相关的许多研究方向。

以墨奇的超大规模指纹库案例进行讲解,提到的挑战以及解决主要以下

基于深度学习图像搜索的方法和挑战

  • 对环境因素的敏感

解决方法

向量和图的多尺度表示和高精度搜索

从底层构建视觉信号的多尺度表达,自适应小波模型的衍生,多尺度的同时有效编码的。以及搜索友好的…

小样本自学习框架

自适应多尺度特征的小样本自学习框架(可以无需标注、小样本学习)

无接触指纹便携采集和识别

  • 曲面重建相较于平面更加复杂,提供的信息也更多,应用场景更加便携
  • 思考和自动驾驶以及其他场景三维重建技术的区别与联系?

保护隐私的可信生物识别

生物特征变得像密码一样使用生物特征,而无需存储特征

不可逆(给定变换特征,不能获取原始的生物特征,数学上是要可证明的)、可撤销、非关联

密码学+生物识别

采用简单的 Hash?hash 函数的安全性要求海啸效应,微小的变动会产生完全不同的 hash 函数,那么同一个的

里德·所罗门码(纠错码的应用!),将特征映射到有限域多项式曲线中的点,增加额外点的混淆,从而保证安全性,困难问题保证:多项式重建复杂问题。 (RS 的冗余保证了容错的粒度,理论上讲是这样)。

总结之前的工作

  • 新一代的生物识别的要素:精准可靠、主动便捷、保护隐私
  • 在政府和民用领域应用空间广阔
  • 生物识别也是非结构化数据库的一个成功应用

主讲:在公司里的研究更加贴合前沿且实际的问题或是需求,更像是从阿兰图灵以及

从结构化数据库到 AI 知识数据库

同时支持传统的结构化数据以及非结构化数据,上层提供简单的抽象

利用向量和图对于复杂数据做统一表征

在数据库中进行弹性学习

针对Data Gravity,希望直接在DB上进行实验或训练(向上提供everything in SQL 的接口)。