人脸识别的基本原理

阅读量:27次|2021-04-21

现在AI开展的如火如荼,咱们已逐渐进入智能年代。尽管人工智能偏技能类,学习和了解需求必定的技能布景和数学做支撑。但拆开看,其原理、办法、思路并不杂乱,「不明白技能」的产品司理也能了解。


人工智能牵扯许多学科,常识点错综杂乱,需求具有多学科的常识储藏。从学习途径上看,更适合做成系列,从浅入深,从根底到运用,逐渐深化。但无形中提高了学习门槛,下降了学习的爱好,导致很难坚持。


有感于此,我想以一种轻松、探究的视角,跟才华一同探索,用简略、直白的办法来学习AI。这样,尽管会有过错、遗失等,但学习难度会下降,那就在进程中完善吧,究竟「含糊的正确大于精确的过错」。


一、人脸辨认产品

咱们从人脸辨认开端,逐渐了解其技能途径的演化和原理等,今日先从最简略的原理讲起。


人脸辨认其实很早就有了,多年前就以人脸考勤的办法呈现,但因为运用作用欠好,运用者实在的体会欠安,逐渐被商场筛选。


而这一波人工智能的炽热,核算才干、模型等都是其重要推动力,但更重要的是产品可以落地,可以在实践事务场景中运用。


尤其是人脸辨认,产品在辨认精度、速度、用户友好度等多个方面都有显着提高,用户和商场的承受度显着上升。


二、图画表明

了解人脸辨认,先要从图画表明讲起。


才华都知道,核算机可以辨认和处理的是二进制,不论咱们输入的是文本、图画、声响,核算机都是用必定长度的二进制串进行存储和处理。


咱们先以黑白图片为例,看看核算机是怎样表明的。


核算机程序可以将黑白图片可以表明为灰度图画。在灰度图画中,一个像素运用8个比特位,然后可以表明256个灰度阶,表明规模是0-255。其间0代表纯黑色,255代表纯白色。


一个字节可以表明一个像素,那怎样表明一张图片呢,用矩阵进行表明。


简略来说,搅扰表格,比方可以正常的运用8行8列来表明一张8*8的灰度图片。


这样咱们就处理了图画的表明问题,树立了图画和矩阵的等价关系。图片可以转化为矩阵,通过矩阵也可以康复原始图片。


才华能算出来下面的矩阵表明什么吗?


人脸辨认的基本原理

对的,一眼就看出来了数字1,看来才华都有搞AI的天分,加油。


三、图画辨认

通过矩阵表明图画后,图画的各种处理就转化为数学问题,可以正常的运用数学的理论和办法来进行处理,而这正是核算机所拿手的。


咱们输入图片,期望核算机可以将内容辨认出来,将成果输出。


仍以数字为例,当输入图片并用矩阵表明后,通过将灰度值转化为灰度,可以轻松辨识其所表明的内容。


但在核算机的国际里,只要0和1。想要通过辨识矩阵内容并将成果输出,就必须树立矩阵到成果的映射。这样,输入一张图片,通过处理和核算后,才干输出一个数字。


很朴素的主意搅扰将各个数字所代表的矩阵提早寄存在核算机内,当输入一张图片后,核算机通过核算,然后找到最适合的数字进行输出。


举个比方,更简略了解一些。比方,核算机内部现已寄存了包括数字1和7以及它们所对应的灰度矩阵。


人脸辨认的基本原理

数字1


人脸辨认的基本原理

数字7


当新输入一张图画后,程序会主动核算它的矩阵与这些矩阵的类似度。类似度核算可运用的公式许多,比方可以运用百分比,间隔等。


简略起见,就运用两个矩阵对应元素之差的绝对值之和或许平方和等,核算机进行快速运算,找到最类似的矩阵,然后将其所代表的数字进行输出。


当输入以下内容时,通过简略核算,可以知道输出成果为 7。


人脸辨认的基本原理

四、人脸表明

已然可以用矩阵来表明图片,人脸也是相片,那么也可以用相同的办法来进行表明,下面的这张人脸可以表明为:


人脸辨认的基本原理

人脸相片


人脸辨认的基本原理

矩阵表明


五、人脸辨认

尽管被叫做人脸辨认,但更精确的姓名应该是「人脸比对」。人脸辨认的背面,是一张待比对图片和人脸底库中的一切相片进行比对,然后判别图片中人员的身份。


一般来说,待比对相片搅扰咱们在日常日子中被各种设备所收集的相片,比方通过人脸辨认考勤机抓拍的相片。


因为环境、姿态等原因,收集的相片具有很大的差异,导致比对成功率不高。为了提高比对的成功率和速度,许多时分会一起抓拍多张人脸进行辨认,但每次比对的时分输入相片只要一张。


人脸辨认的基本原理

所谓的人脸底库搅扰咱们在体系中提早录入的人脸相片,相片和咱们的姓名一一对应。依据人脸底库中相片数量的不同,可以将人脸比对分为1:1和1:N,因为数量不同这两种办法的核算量和核算办法也不尽相同。


1. 1:1

1:1最常见的场景搅扰人证比对,比方咱们在乘高铁时所遇到的这种设备。


前面的1代表咱们从设备中收集的相片,然后面的1代表身份证中的相片,通过将现场收集的相片和身份证中寄存的相片进行比对,通过判别持证人是否为自己。


这种情况下只涉及到两张图片的比对,核算量相对较小。


或许用在火车票安检等场景中,所以要求的精度较高。


身份证中的相片像素较小,通过市面上的身份证读卡器读取出来的相片仅为100*100像素左右,给精度带来了必定的应战。


现在这个范畴相对老练,运用场景正在逐渐铺开。


2. 1:N

1:N是1张人脸和底库中的N张人脸进行比对。


比方在考勤机中,咱们的人脸底库中包括全公司的一切人脸相片。当上班打卡时,考勤机收集到人脸输入体系,通过比对后输出职工身份。


这种情况下核算量相对较大,时效性和辨认精度太低又会影响运用者实在的体会,所以厂商一般会归纳考虑权衡,在设备的参数中标示所支撑的人脸数量。


这一波人工智能的开展,带动了1:N范畴人脸辨认技能的前进,更多的产品可以在各个场景中落地。比方才智城市、才智家居等。


国内厂商也借着这一波春风,加速技能研制和产品落地,诞生了闻名的AI视觉四小龙等独角兽。


今日梳理了人脸辨认的基本原理,整个完成进程尽管看起来很简略,但技能却在基本原理的根底上继续完善和前进,终究到达比较好的作用。


下次咱们将评论在杂乱场景下人脸辨认遇到的应战及处理方案。


作者:AIoT产品,10年B端产品设计经历;微信大众号:AIoT产品


本文由@AIoT产品 原创发布于人人都是产品司理。未经许可,制止转载


题图来自Unsplash,根据CC0协议

关键词:8路IO控制器


人脸识别的基本原理