电子书:《卷积神经网络与视觉计算》_钱亚冠等译_2018-11-27《卷积神经网络与视觉计算》_钱亚冠等译_20181127

电子书:《卷积神经网络与视觉计算》_钱亚冠等译_2018-11-27《卷积神经网络与视觉计算》_钱亚冠等译_20181127

资源下载
仅限VIP下载,请先
犹豫不决让我们错失一次又一次机会!!!

电子书:《卷积神经网络与视觉计算》_钱亚冠等译_2018-11-27《卷积神经网络与视觉计算》_钱亚冠等译_20181127

111

内容简介:

申经网络的新第3章人工神3.4改进的反向传播算法5.1.3 mentee网络与 finet参考文献本章小结第4章卷积神经网络参考文献102附录ay118后记参考文献

第1章视觉计算简介人们进行科学探索的目的是增强人类的能力。我们用火来烹饪食物.减轻了胃来加工食物的负担。这使得人类可消化的食物量增加.加速了文明的发展—这种文明水平是其他物种未达到的。轮子和交通工具的发明.可使我们旅行的速度大大加快。飞机的发明实现了人类遨游蓝天的梦想。人类发明和技术发展就是人类无止境地增强自己能力和探索未来过程这些进步归功于人类的神经系统。人类错综复杂的神经系统具有思维、情感、推理、想象和晢学的能力。计算机视觉研究者偏向于人类视觉系统( human vision).但对我们来说.认知视觉系统( cognisystem)是人类能力(包括智力)中最重要的部分。虽然人类视觉系统及其认知决策过程是很快速的.但并不是所有生物中最强大的.如敏锐性或夜视能力( thorpe等人.1996; watamaniuk和 duchon.1992)。人类观察世界局限于一段很窄的电磁波谱.而许多其他生物的视觉感知范围比我们广得多。同时.人类也更容易产生许多视觉缺陷.如近视。基于上述考虑.我们很自然地想要改善我们的视觉能力.弥补缺陷多个世纪以来.我们发明了很多工具去超越人类肉眼的观察极限望远镜、双筒镜、显微镜和放大镜.去观察更远或更小的物体。无线电

红外线和ⅹ射线设备可使我们观察到可见光谱以外的范围。最近.利用干涉仪发现了引力波.使得人类可用引力天文学来观察世界。虽然这些设备增强了人类的视觉能力.但学者和哲学家们早已意识到眼睛只是一种成像工具.真正“看到”的是大脑从柏拉图、亚里士多德、查拉卡、欧几里德到达·芬奇都研究了眼睛是如何观察世界的问题.但只有 hermann von helmholtz在1867年所著的《生理光学》中首次提出:眼睛只捕捉图像.而大脑才真正“看到”和识别图像中的物体。在他的书中.他基于达·芬奇早期的工作.提出了关于深度和色彩感知、运动感知的新理论。尽管一直以来人们通过各种方式进行研究. helmholtz则首次提出了无意识推理( unconsciousference)的概念:不是所有的想法、思维和决定都是大脑有意识地完成的。 helmholtz注意到人类很容易受到视觉错觉的影响.引用了太阳围绕地球旋转这个著名的误解案例.而事实上是地平线在移动。使用这种类比. helmholtz提出在人类无意识的情况下.是大脑在理解眼睛看到的推断和理解正在观察的物体。这可能是第一次深入洞察神经视觉的研究。一些近代早期的科学家(如 blakemore和 campbel)开始争论一些现在已知的事实:大脑中有神经元负责估计物体的大小和方位感( blakemore和 campbell.1969)。后来同时期的研究发现了人类视觉系统感知和识别颜色、形状、方向、深度.甚至物体的更复杂原理( field等a. 1993: mccollough. 1965: campbell fn kulikowski. 1966: burton1973)。上述简短的历史叙述说明计算机视觉领域在丰富的人类技术发展中占有一席之地。本书重在简洁介绍现代计算机视觉技术.因为这项技术大多

视觉计算简介来源于人工神经网络.所以称为“神经”计算机视觉( neural computervision)。为了确保本书的完整性.我们在一些基础章节的开始处.通过定义基本概念、公式和方法.向读者介绍一般的视觉计算原理.之后的部分简要介绍图像表示1.1图像表示基础任何计算机视觉处理流程都始于成像系统.它从景物中捕获反射出来的光线.并将光信号转换成计算机可以读取和处理的图像格式。在计算像技术发展的早期.图像通过把胶卷或印刷图像数字化后获得;而现在图像通常直接由数码相机获取.并存储成称为像素的有序数字。目前已有很多关于图像采集和照相机内部工作原理的教科书(例如光学、机械控制和彩色滤波等)(jain.1989; gonzalez和 woods.2002).因此对于这部分内容本书只做简单阐述。图1-1展示了光线进人相机形成图像的采样(即通过图像网格划分)和量化(即用有限的整数表示每个像素的颜色值过程图1-1图像的采样和量化

所有图像可以看作一个矩阵(或三个矩阵.如果分别考虑色彩平面)该矩阵是景物的反射光在相机成像平面上的强度和色彩信息的量化数据图1-1显示了景物在数码相机上成像的过程:相机中的传感器阵列决定了图像的大小和分辨率。假设传感器阵列有nxm个传感器.则产生n×m大小的图像。每个传感器捕获通过透镜人射到该传感器上的光线。对于个b位图像.传感器为每个采样赋予0到(2-1)之间的值。假设一个8位图像.那么采样值就在0到255之间.如图1-1所示。上述过程称为采样和量化。所谓采样就是在连续视场中选择某些点;所谓量化就是把光强的取值限制在有限的离散数值内。在相机设计和相机模型中.采样、量化和图像形成涉及很多主题.感兴趣的读者可以查阅相关文献并进行更深入的研究。彩色图像在照相机中通常会分别对应生成红(r)、绿(g)和蓝(b)三个基色图像。如何产生这些r、g和b图像取决于相机.大多数消费级相机在传感器平面前设置滤色器来捕获所有三个颜色通道的马赛克图像.然后依靠“解马赛克”过程来创建全分辨率、分离的r、g和b图像有了这个装置.我们就能把图像表示为计算机中可存储的数字数据称为图像的像素表示。每个图像是表示一个(灰色)或三个(彩色)或更多(深度和其他场)通道的矩阵或张量。像素顺序与采样顺序相同也就是采集像素的传感器的位置顺序。像素值越大.对应的颜色强度就越大.这可能是图像最明显的表示方法。图像越大.像素越多。当要捕获景物的细节时.传感器需靠得更近.产生的图像分辨率也越髙。如果用两个大小不同的图像来拍摄现实世界的相同区域和视场.那么较大像比较小图像具有更高的分辨率.这是因为较大图像可以分辨更多的细

#############################################

资源下载
下载价格VIP专享
仅限VIP下载升级VIP
犹豫不决让我们错失一次又一次机会!!!
原文链接:https://1111down.com/224402.html,转载请注明出处

本站开启缓存功能

登入后回任何页面即可登入成功,当前页不显示

没有账号?注册  忘记密码?

社交账号快速登录