人脸识别技术在维护国家安全、人民生命财产安全等方面具有重要意义。
辨认型人脸识别系统的基本结构如图 1 所示

辨认型人脸特征比对是将一个输入的人脸特征与人脸数据库中的每一个人脸特征进行比较的过程,以此来确定该输入的人脸特征所对应的未知人身份。在辨认型人脸识别的应用中,人脸特征比对的数据量在不断扩大,其中 1 人多张视频人脸图像、多张不同年龄的人脸图像等一人一档的数据,更是成倍增加了人脸特征比对的数据量。
图 2 给出了辨认型人脸识别特征比对流程的示意图。
图 2 中,计算一个待识别的人脸特征与人脸特征库中每一个人脸特征的相似度,再对得到的相似度进行排序。显然,亿级人脸特征比对的相似度计算环节是最耗时的。
要实现海量人脸特征比对,则需要高算力的计算。在海量人脸特征比对领域,GPU因其高算力则得到了广泛的应用。
2019年10月,商汤公司在珠海安博会上介绍了该公司在某单位建设的1.4亿人脸识别大数据应用平台。该应用平台具有1.4亿人口特征库,300万重点人员库,做到一站式人脸轨迹服务,开放给3000余名干警使用,接入 3000 余路抓拍摄像机,实现了40台 GPU服务器组成的解析中心。这一重大应用,存在高功耗问题。
清华大学在人脸识别方面具有坚实的科研基础,其成果广泛应用于公安部门。针对亿级人脸识别的高功耗问题,清华大学于 2024年4月1日与飞诺门阵(北京)科技有限公司签订了“基于算存算一体的人脸识别技术”的开发合同,成功的实现了低功耗的亿级人脸特征比对。清华大学和飞诺门阵(北京)科技有限公司联合研制成功的“基于算存算一体计算的亿级人脸特征比对”技术于2025年12月31日通过了中国图象图形学学会组织的科技成果鉴定,取得了“国际领先”的优秀成绩。鉴定意见如下:

图 3 给出 NIPC-6 板卡的外观图。
图4给出了计算机和NIPC-6板卡一起构建的千万级人脸特征比对平台。平台中虚线框内给出了NIPC-6板卡的核心电路框图。四组行邻域存储体和FPGA 的组合实现了高效的计算。人脸特征比对耗时0.92秒完成了6000万人脸特征的比对,其功耗为39瓦。
插入计算机PCI槽的2块NIPC-6板卡,构成了由2块NIPC-6 板卡和计算机组成的轻量型亿级人脸特征比对平台(如图5所示),实现了低功耗的秒级、亿级人脸特征比对。
作为本成果的扩展,可以采用图4、图5的计算平台,实现 YOLO、Transformer 等人工智能计算。
在轻量型亿级人脸特征比对平台的基础上,再组建广域轻量型亿级人脸特征比对平台(如图6示),实现更大规模的应用。
该项计算,不仅仅用于亿级人脸特征比对,还可以扩展到亿级指纹特征比对和亿级虹膜特征比对。
清华大学 苏光大
2026 年1月1日