sp;“我?”韩宇止住了笑,一本正经回答道,“嗯,写完了写完了,这会儿有点bug,来看看别人做的怎么样了。”
说完韩宇一溜烟的就回到自己的位置上,开始头疼自己遇到的问题。
具体的代码,小册子上没写。神经元的大小,卷积的步长,小册子上给了例子,代码却是一个也没有。刘浩然完全照搬了例子,找了一张图片做测试,然后就做成了打码……
而韩宇遇到的问题则是,卷积设置的太小,以至于最终拼接的时候,图片如果过大的话,电脑会反应很慢,cu占用率几近1oo!
“到底哪里不对呢?”俩人都在想着各自的问题。
图片模糊和图片打码其实是一回事,都是对卷积核和卷积云做平均值处理。这是机器视觉的第一步,被称之为预处理,其目的是降低图片的复杂度和最终计算量。
而不同于小册子介绍的单核卷积,图片的卷积过程其实是个多核卷积。这个过程是立体的,立体并不是指的空间上的立体,图片再怎么立体,它终究是个二维对象。这种立体指的是色彩上的立体,所以通常的图形卷积过程都是三核卷积。
众所周知,红黄蓝是三原色,而对于计算机来说,三原色则是红蓝绿,通常用rgb(red,greed,b1ue)三个o~255之间数值来表示,每个颜色的组成部分都被称之为通道。
所以图形的卷积过程,其实就是对三个通道分别做处理,这就是三核卷积。因而,它是立体的。
这俩人已经算是很优秀了,许多人在面对这一步转不过弯,脑子里无法构建出应有的卷积模型。
邓助理本来是打算开小灶,打算等将来学到了本事,就去求龚塞刚把自己也塞到这个项目里。也是卡在了这一步,因而直接放弃了。
人和人,终究是不一样的。
刚才说了三核卷积,那么就好解释为什么机器视觉会是个黑盒模式,为什么无法用语言来解释机器视觉的特征库里的数据含义。
因为计算机最终拿来做对比的部分,是已经做过预处理的这些图片,分割成的一个个小块。
某些需要单通道计算的模块,识别老王是不是老王,可能只是看“老王头上多少绿”。(green,o~255)
实际上整个流程更为复杂,卷积、池化、激活等步骤会经过多次反复的交替执行,最终才能实现学习或检测的目的。
而学习和检测也是不一样的,为了防止过拟合,使计算机的结果更为普世化,“学习”的过程中还会有dro层这一步骤。
举个不太恰当的例子,一个人素颜和化妆的两张差别比较大的照片,人类设定好参数告诉计算机这是同一个人(监督学习),计算机必须dro掉化妆那部分的特征后,才能把这两个图片当做同一个人。
当然了,dro是随机的,人类只要求得到符合目标的随机结果,因此这个dro可能也要进行成百上千次乃至上万次,才能随机出人类想要的结果。
所以,这里的计算量是相当大的,也就有了使用gu的必要性。
gu就不用多说了,如果把cu比做老板,gu就是这个公司里最擅长计算的员工。
gu非常适合做图形处理和大型计算,显卡里面配置的就是gu。只是这个gu是阉割过的,不太适合ai使用,正常的gu市面上根本买不到,因而才需要侏罗纪去自己设计和小批量的制造。
第221章 老王头上多少绿[2/2页]