15210029627 

贵州软件测评
您当前的位置 : 首 页 > 新闻资讯 > 行业资讯

在机器人的眼里能看到什么,它们和人类的视觉体系相似吗?

2021-04-27 08:40:20

在机器人的眼里能看到什么,它们和人类的视觉体系相似吗?

自从机场服务机器人投入展览后,一向是该展区的热门展项,驻足围观的游客络绎。对机器人的表现,游客也是褒贬不一。有些游客对机器人的精彩表演连连称赞;有些人以为机器人反响迟缓、显得笨重,比较人类的表现。

辨认这些行李关于机器人来说是不是很困难?机器人在视觉方面能否做得好,能否辨认杂乱的方针?它们的目力能否人类?它们终究能看到什么?

这些问题将咱们引向了一个新式的热门范畴:核算机视觉。核算机视觉是人工智能的子学科,而人工智能则是仿生学的一种。人工智能旨在模仿人(有时也包含其他动物)的行为和思想,而核算机视觉将模仿的方针会集在了人眼上,即模仿人“看”的行为。换言之,核算机视觉是一门运用开麦拉和核算机代替人眼进行图画获取、方针辨认、盯梢、丈量、了解和处理的学科。作为一门交叉学科,核算机视觉与许多学科有重要联络:机器学习、神经生物学、认知科学、信号处理(图画处理)等。在后面的介绍中,这些学科间的联络将变得明晰。

眼睛是人体获取外界信息重要的传感器。它高速、信息量大,为人的决议计划和行为供应了丰厚的信息。相同,核算机视觉体系作为人工智能体的一个感知器,也常常为决议计划供应了重要的信息。那么,一个抱负的核算机视觉体系终究完结了什么使命,又给智能体供应了怎样的信息呢?

让咱们来举一个简略的比方。你走进一家咖啡店,发现你的老友彼得坐在角落里,双手托着下巴,一脸的不愉快。所以,你决议走过去安慰一下。假定完结该使命的人类而是机器人,则要由其核算机视觉体系获取图画,然后对该图画进行处理,并得到以下信息:1.这是老友彼得;2.他看上去很懊丧。这两条信息被传递给决议计划器,后者随即做出了走过去安慰的计划,计划则终究被四肢等效应器履行。

对人来说,这个进程再简略,但关于核算机视觉体系来说,却是个相当杂乱的进程。对该图画进行处理的进程中,核算机别离完结了三个层次的使命:初级视觉、中级视觉和视觉。这样的分类办法不只和视觉使命的杂乱程度有关,也和人类在完结这些使命时所触及到的视神经和脑神经部位有关。在以下的篇幅中咱们将介绍一些别离属于这三个层次的典型的核算机视觉使命。

初级视觉

现代数字成像技能使核算机视觉成为可能。运用CCD或CMOS等感光元件,可取得数字化的图画。通常来说,对像素进行处理的使命即属于初级视觉。在发掘出图画中包含的信息时,要需求对图画进行一些处理,以便能够履行的使命。图画的主体和布景之间、同一外表上不同的原料和色彩之间等都会构成鸿沟,从图画中提取出边、角、点等特征能协助核算机了解图画,并运用滤波的办法进行鸿沟特征提取。像滤波这样的信号处理办法在初级视觉中被广的运用,除了特征提取外,还有降噪、滑润等。贵州软件造价

图画上色彩的像素并不是随机散布的,它们一般都在图画上构成含义的组合。比方,草地是由绿色的像素拼组成的,而天空是由许多的蓝色像素组成的。找到这样的具有相同特色的像素构成的像素块称为切割。当然,提取鸿沟能够协助切割图画,可是简略地把的鸿沟切割出的区域都作为具有相同特色的像素块是否正确呢?这正是图画切割具有应战性的。比方一副斑马图片,核算机怎么知道斑马的嘴不是布景的一部分呢?这就触及到了图画的语义。在给图画进行初级切割后,准的切割使命就要交给中级或视觉了。

人类有两只眼睛,相同,机器人也能够经过装置两个经过标定的摄像头来完结双目视觉,然后完结测距,即分辨物体在三维空间中的方位。上文的比方中,双目视觉能够依据透视原则和遮挡的关系来协助视觉体系确定彼得所坐的方位,比方在第二张桌子和第三张桌子之间。

中级视觉

中级视觉是树立在初级视觉的核算成果上的。在履行中级视觉使命时,不只运用了实时的初级视觉核算成果,还结合了的视觉经历。举个简略的比方,平时日子中咱们所看到的,被桌上的杯子遮挡的部分也是桌子的一部分;上文斑马深色的口鼻部并非布景的一部分,而是斑马的一部分。这些结合经历的视觉使命能够要被运用到切割使命中。中级视觉中的切割不在是只是依托色彩将图画分为若干个像素块,而是产生有含义、准的切割,这样的切割不是靠鸿沟提取就能够完结的。切割算法不计其数,常用的有类聚的办法、根据特征向量的办法、根据图论的办法、期望大化、概率的办法(贝叶斯办法)等。

在经历的协助下,视觉体系能够经过拟合的办法来解说乃至纠正图画中的变形或缺失。比方,依据经历桌子的边一般是直的,则视觉体系在提取到桌子的部分边际或拐点后,就能够用直线来拟合被遮挡而缺失的部分,或因摄像头的棱镜引起的失真。这样,机器人在走向彼得时就能以免撞到桌子。

经历也并非是正确的,此刻看到的也许是经历中所缺失的。经过一个加权的概率模型,视觉体系能够将现在查询到的图画和经历中的数据结合起来,然后对未来的状况做一个猜测。这样的办法常常被用于盯梢,也便是在一帧帧连续播放的画面中,依据方针在曾经和现在图画中的方位来猜测方针在未来图画中的方位。比方高速公路上的车辆盯梢体系,体系用从方针上提取出的特征点(赤色)来定位方针。视觉盯梢常用的算法有卡尔曼滤波器、非线性动态模型等。

现在的中级核算机视觉研讨受到了心思学和认知科学的影响。比方格式塔心思学对根据经历和认知全体的中级视觉有较大贡献。

贵州软件造价

(文章内容来源于网络,如有侵权请联系删除)

近期浏览: