计算机视觉的原理范例(12篇)

时间:2024-03-06

计算机视觉的原理范文篇1

关键词:视觉艺术网络虚拟现实

艺术活动反应时代的现象,且在各种意义上,艺术与时代革新或改造的根本精神,有着密切的关系。在艺术创作的过程中,感情的自发形成占了大部分,但在有些状态下理性的计划性成分亦占有相当的比例,尤其在新媒体、新美学观念、新素材及新的科学技术高度发展的今天,以理性为诉求的创作灵感,已占有绝对的重要性及审美价值。

科技的革新,从计算机、网络到虚拟现实,在艺术创作上产生极大的变化,具有实验精神的先驱艺术家们热衷于新媒体与材料与新艺术形式的探求,从十九世纪末到今天,其中发生了难以计数的艺术运动,一部新媒体艺术史,几乎就是一部近代科技史,而我们仍然活在其中,变化日新月异,很难去归纳风格,或下任何定论。到目前为止,网络艺术、包括虚拟实境的交互式装置,似乎是互动艺术的主流。科学的发明与发现,大量地运用在改善人类生活上,不过是近五十年的事,却带给人类前所未有的便捷与刺激。改变的不仅是物质的层面,在精神上的意义也相当深远。

尤其是60年代末70年代初,当电子媒体与计算机科技开始普及之时,媒体深深影响我们对世界的认知,人们视野变宽了,世界变小了。当时,艺术、科技与科学间的关系常受争议。艺术与科技运动吸引许多艺术家、科学家、工程师以及业者参与,意图发展出跨领域的合作架构,然而时至今日,这种系统化的合作模式,仍然只是一个理想。因为科技、艺术都是文化有机整体的一部分,原本就不容分割。

运用科技的视觉艺术,一个明显的议题便是科技带来的艺术品复制性与真实性的问题,一切展演都只是以复制品呈现,要观赏者破除原有的观赏习惯,在传统上的艺术价值包含了独创性、唯一性、与真实性,都将被重新思考。

数字化科技成熟后,讲求光与速度,去物质化的虚拟影像透过媒体四处传播,复制已经不再是模仿、替代真实或是真实的幻觉,数字世界已然成为另外一种真实。因为影像可被转换为数字语言,可被任意操弄,因而影像成为一种信息,于是艺术行为也大大不同于前,艺术家在庞杂的影像信息中,选择、过滤、重新组装,不只是利用技术来解决视觉问题,开发新的视觉经验,更利用新媒体去呈现人们生活中的种种困境,作品意义的产生存在于事件的脉络还有与观赏者的互动中。观赏者从最早的被

动接受,到目前已然成为参与者,甚而是展演内容的提供者。以往视觉艺术的形式,可大分为平面的绘画与立体的雕刻,而影像的领域今后将与前述二者并列为视觉艺术的重要形式之一。未来随着计算机图像处理,多媒体、高画质等新媒体技术的高度发展,传统的录像技术也将面临新的整合。

十九世纪八十年代以后高科技产品发展迅速,计算机、雷射光线、传真机、复印机、卫星传播等。这些尖端科学技术,都成为创造想象和架构的创作工具,这些新的媒介能仿真真实世界,也能创造出幻想境界中的奇景。高科技艺术是十九世纪八十年代以后,兴起于美国的新艺术。它是泛指以运用高科技创造的现代美术作品,诸如计算机艺术、雷射光艺术等作品,在美学领域中带来明显意义,结合了人类智能和科技产生的大量新颖技巧。潜藏在这种深具潜力的新视觉技巧下,有一个更深入的意义:在高科技的辅助下,视野更加瞭阔,并为艺术创作,提供了新的美学向度,跳跃连结代替线性思考,多向度空间取代绘画透视,前所未有互动性功能。

尤其是,自从计算机出现以后,因为可以储存、修改,容易重新绘制及复制,所有有关绘画的行为起了很大的改变。1952年美国的BenF.Laposky利用计算机做出一个抽象的图像,1956年才开始能创作出彩色的电子影像,1960年德国K.Alsleben及W.Fetter发表最早的计算机绘图作品,直至1994年网际网络开始盛行,四、五十年间,人们对于空间的思考模式随之改变,我们离开了复杂而趋向一个快速沟通、大纲式了解的理想。我们不再需要画一堆很复杂辅助线去处理放置一个三维物体于二维平面上的问题,计算机影像帮我们解决了这些问题。因此,艺术家已把兴趣放在如何避免复杂的建构,因为人们想象的空间已经改变,波浪的、拥挤的西方绘画已被纯粹的、无限空间的现代绘画所取代。

计算机对现代艺术造成的冲击及影响之巨,超乎想象。计算机一般被认为是一个空间可视化的简单辅助工具,但它不只是一件工具,一种媒体和材料,更重要的是一种新的美学方向,新的再现可能。多数计算机艺术的创作者,深信虽然计算机本来不是为艺术创作的理由而发明,但它会持续发展出特有的本质,继续为艺术家提供最好的工作伙伴。

通常,计算机比传统铅笔的方式更简单、便宜、快速地生产,计算机让艺术家与音乐创作者更快速的生产,这也就是我为什们称之为“罐头艺术”的原因,然后,计算机也可提供一种艺术替代品更快速的方法,这也是我为什么称其为“麦当劳艺术”。当然,计算机艺术有它的隐忧。虽然计算机为艺术带来发展的新契机,却也有不少令人不安的地方。

第一:由于计算机也是科技的产物,自然有现代和传统的冲突,如何把过去的传统艺术,配合新的计算机媒材,加以融合表现出来,呈现附合时代的新风貌而被接受,是值的深思的问题。因为全世界都是用相同的软件和设备,如果一窝蜂的跟着主流,则艺术创作则会划地自限,而显露大量复制和类似的肤浅平面感,失去艺术的美感和深度。第二:如同前面提到的,工具的方便,却造成个人风格的丧失,并且

失去敏锐度,因为一旦创作者习于依赖计算机的修改功能,创作的动力则渐渐退去,例如:惯用PHOTOSHOP的摄影者很可能因此,不在意拍照的决定性时刻,因为可以透过计算机仿真修改,不怕拍不好,但即使效果逼真,却失去艺术价值了。

计算机视觉的原理范文1篇2

关键词:双目立体视觉摄像机标定编码标志点姿态计算

中图分类号:TP391.4文献标识码:A文章编号:1007-3973(2013)002-109-03

1引言

在现代生产生活中,经常需要计算物体之间的相对位置关系,例如两个刚体间的欧拉角以及平移量等。因为空间物体是不规则的,所以常规的测量方法都很难做到。随着视觉传感器的发展,人们开始把视觉传感器运用到空间物体姿态的测量,即机器视觉,这种测量方法是非接触的,测量效率高并且精度高。机器视觉是通过视觉传感器获得一张或多张图像,通过对获得的图像进行分析来达到测量和识别的目的。目前,机器视觉已经运用到很多领域,如航空、航天器的运动分析,地面机动目标实验碰撞分析,自动化生产过程中的装配与检测等。本文建立了一种双目立体测量系统,利用工业相机实时获取物体的图像,通过对相机精确的标定以及精准的图像分析来计算出编码标志点的三维坐标值,从而计算出物体之间的相对姿态。

2双目视觉测量架构

双目立体测量系统如图1,使用两个摄像机对同一块区域进行拍摄。(1)利用张氏标定法对两个摄像机标定,计算出两个相机之间的相对位置关系,固定测量坐标系下的坐标原点(本系统的坐标原点在左相机上)。(2)对图像进行分析,计算编码标志在图像坐标系下的坐标值以及编码标志点的编码值,利用编码值将左右图像匹配计算出编码标志点的三维坐标值。(3)通过四元数法计算出每组三维坐标值之间的旋转矩阵以及平移量,从而计算出两个物体之间的相对旋转角以及平移量。

2.1摄像机标定

张氏标定法的算法为:

(1)从不同角度拍摄若干张棋盘格标定板的图像;

(2)检测出图像中的特征点,即角点;

(3)求出摄像机的内外参数;

(4)求出畸变系数;

(5)优化标定结果。

2.2编码标志点的提取与解码

为了提高运算速度以及左右图像的匹配准确,在本文提到的双目视觉系统中对被测物体表面粘贴了扇环形编码标志点(如图4),即将编码点的外环分成16等份,每个单元环对应的圆心角为22.5度,实心和空心分别表示不同的编码信息,实心码段表示1,空心码段表示0,不同实心码段和空心码段序列的组合表示不同的编码点。该种编码标志点能够满足对旋转、缩放、变形的无关性。

2.2.1编码点的定位

2.2.2编码标志点的解码

如图4所示,编码标志点分为中心圆和编码环两段,其中编码环位于中心圆的外侧,共分为16份。

编码段为白色记为1,黑色记为0,将1、0安顺时针排列成一个8位的二进制数,将这个二进制数循环得到一个最小的十进制数即为编码标志点的编码值,解码过程可以分为以下几步:

(1)以中心圆的圆心为中心裁剪一个能覆盖编码标志点的小图像,对小图像进行轮廓提取得到每个白色区域轮廓的质心(编码环的质心),从而得到“1”的个数。

(2)计算所有编码环的质心与中心圆的质心连线间的夹角,并且将这些夹角除以45度取整,从而得到“0”的个数。

(3)将“1”和“0”组成的8位二进制数循环移位得到编码值。

将左右相机采集到的图像中,编码值相同的点对应起来,利用双目视觉中三维重建公式计算出每个编码标志点中心圆对应的三维坐标值。

2.3相对姿态计算

求两个物体的相对姿态,本质上是两个坐标系的转化问题。在三维直角坐标转换中,常采用七参数Bursa-wlof模型、Mobdensky模型。当两坐标系统下有3个公共点时,就可唯一解算出7个转换参数;多于3个公共点时,就要进行平差计算。在平差计算过程中,转换参数初值(特别是旋转角)的大小,直接影响平差系统的稳定性、精确性和计算速度,精度差的初值可能使得解算的结果严重偏离真值。目前比较成熟的参数估计方法有:四元数法、奇异值分解法(SVD)、迭代法,它们都是在最小平方距离的目标函数下得到转换参数的最优解。由于四元数法的突出特点是具有很好的实用性和较强的稳定性,计算过程简单快速,利用了旋转矩阵的特征和所有可用的特征点,所以本双目视觉系统采用四元数来计算旋转角度。

3实验结果分析

4结论

针对传统的接触式测量法难以实现的测量,本文依据双目立体视觉原理开发了一套非接触式的测量系统,同时编码标志点的引入大大减少了计算量。所述方法稳定、可靠,经实验验证,得到了较好的结果。

参考文献:

[1]张广军.视觉测量[M].北京:科技出版社,2008.

[2]冯文灏.近景摄影测量[M].武汉:武汉大学出版社,2002.

[3]ZhengyouZhang.AFlexibleNewTechniqueforCameraCalibration[J].IEEETransactionsonPatternAnalysisandMachineIntelligence,2000,22(11):1330-1334.

[4]祝世平,强锡富,等.基于计算机视觉的大型工件特征点三维坐标测量方法研究[J].仪器仪表学报,1997,18(6):607-611.

[5]马扬飚,钟约先,等.三维数据拼接中编码标志点的设计与检测[J].清华大学学报,2006,46(2):169-172.

计算机视觉的原理范文篇3

Abstract:Withthecontinuousprogressofindustry,theintroductionoftheautomationhasrevolutionizedthemanufacturinginwhichcomplexoperationshavebeenbrokendownintosimplestep-by-stepinstructionthatcanberepeatedbyamachine.Atthesametime,visionsystemsgreatlyenhancethecapabilitiesofrobotsandallowthemtobeappliedtocomplextaskswithindynamicenvironments.Inthispaper,the"machinesubstitutions"fromthepointofview,thevisualsystemandindustrialrobotcombinedwiththemachinetoolfeedingandcuttingwork.Thiswillnotonlyreducethepressureonworkers,butalsocanimprovetheefficiencyoftheproductionlinetopromotethedevelopmentofindustrialautomation.

关键词:自动化;视觉系统;机器人;机器换人

Keywords:automation;visualsystem;robot;machinesubstitution

中D分类号:TG502.31文献标识码:A文章编号:1006-4311(2017)14-0131-03

0引言

我国的视觉机器人发展相对国外比较缓慢,真正开始研发开始于上世纪80年代末期,一开始是在科研能力上借助他人的成果进行模拟,随着改革开放的实施,引入了相当多的国外人才,这些为视觉机器人的发展奠定了基础[1]。目前我国的视觉机器人还处于研发阶段,在一些高校和企业中有不少的研究成果,但是在市场生产和应用中还没有一套真正属于自己的系统。

在我国,虽然对于不同领域的机器人已经开始推广应用,但很多都是在国外研究的基础上加以改进或进行二次开发,总体的研究水平仍和国外存在一定的差距,视觉机器人更是处在研究的初级阶段,因此,对于视觉机器人的研究、开发和使用具有重要的意义。

本文研究的意义在于从“机器换人”的思想角度出发,将视觉与工业机器人相结合起来应用于机床上下料系统,以此来适应对多样化工件的加工,为了满足不同环境下的生产工作,把视觉传感器置于机器人末端执行器部位,实现随动和实时分析,从而提高生产效率和灵活性,为工人减轻工作压力,同时推动工业自动化发展。

1整体的结构设计

为了实现通过视觉引导机器人完成工件的上下料过程,首先需要图像传感器先获取到由传送带传输过来的工件的位置,然后通过对图像的处理分析,得到工件的形状和准确位置,通过笛卡尔坐标系的转换矩阵,获取工件在世界坐标系下的位置,再通过机械手的控制系统来实现机械手的抓取工作。

其中,传输系统主要包括传送带装置;图像处理系统主要包括补偿光源,图像传感器以及负责图像分析的计算机算法技术;机械手系统主要包括机械手本身,与之相匹配的控制柜,和负责抓取工件的夹具;为了满足不同种类的工件,末端夹具采用了快换装置,方便替换不同夹具来抓取工件。具体布局如图1所示。

2视觉工作原理及摄像机的标定

2.1视觉工作原理

通过对视觉系统的研究可以让机器人能够像人一样“看”清对象,并了解作业对象,对被加工对象有比较直观的认识,从而更好的适应多变的工作环境。计算机的视觉定位是根据“寻位-加工”的方法实施的,其中“寻位”是模仿人去识别感兴工件在空间中的相关信息,通过计算系统建立仿生视觉模型进行相关的计算和处理。

计算机的视觉系统包括工件状态的捕获和对图像的计算,根据得到的结果完成信息的传输。其中图像的获取主要包括光照的补偿、CCD相机和配套的镜头等设备;图像的分析处理一般是通过相关的算法在软件中完成;结果的显示是通过显示设备显示经过处理后的特征图像。信息的传输是把得到的位姿信息传送给相关的执行设备,最终完成动作的实现。

目前的视觉研究中,双目视觉的研究过程存在空间匹配难、可视区域小等特点,在单目视觉中却不需要考虑这些,而且单目视觉相比立体视觉的标定步骤少,结构的设计也不繁琐。单目视觉定位的方式有:几何光学法、几何形状约束法、辅助棒间接测量法、激光辅助测距法等。因为视觉传感器在结构上受到一定的限制,所以上述大多数方法只有在对固定的被测物体进行近距离成像的条件下才会有效。而且单目视觉定位系统不用考虑双目摄像机之间距离的约束,所以在实际的工作坏境中适用性更好。

视觉定位系统完成上下料工作过程图如图2所示。

2.2摄像机的标定

对相机进行标定是机器视觉作业中非常必要的问题,这是获取相机几何参数的过程。从拍摄的图像出发,计算物体的相关信息并重建物理模型,物体和图像之前的关系是由相机的内外参数联合决定的。对相机进行标定的步骤就是寻找图像和物体的对应关系的过程。相机的内部参数是指决定了相机的理想成像和实际成像之间对应关系的相关信息;相机的外部参数主要包括相关的变换矩阵[2]。

目前存在的相机标定技术根据方法不同主要分为三种:第一种是传统的相机标定法;第二种是主动视觉相机标定法;第三种是相机的自标定法。传统的相机标定法是根据已知物体的形状和几何参数,通过相关的计算,得出相机的内外部参数,这种标定方式适用范围广,而且标定的精确度高,但标定步骤繁琐;主动视觉相机标定法需要先取得某些动态参数,通常能够进行线性运算,有较高的鲁棒性,但不适用于相机动态参数未知的情况;相机的自标定法是通过多个图像之间存在的某种关联进行标定,虽然比较灵活,但该方法是非线性标定,而且它的鲁棒性不好。

在进行相机标定之前,还需要先研究相机的成像模型,一般选用理想的针孔模型为例,这也是相机成像模型中最简单的成像方式,如图3所示。

因为图像处理的最终目的是要获取感兴对象的形状和位姿,所以建立了如图3所示的相关坐标系。

①像素坐标系(Ouv):它是用于描述像素位置所使用的坐标系。相机获取的图像最终是以M×N形式的数组进行存储的,像素的数值在图像上表现为该点的亮度,像素坐标系的建立如图中所示。

②平面坐标系(oxy):该坐标系建立在相机的图像平面上,其中横向为x轴,纵向为y轴,坐标的原点是相机的光轴与图像平面的交点。

③相机坐标系(ocxcyczc):该坐标系的建立是以相机的光心为坐标系的原点,xc轴、yc轴平行于图像平面中的x轴和y轴,zc轴与相机的光轴一致。

④空间坐标系(OWXWYWZW):它是固定于场景中的坐标系,为了方便后期的计算,空间坐标系的设定和机器人的基坐标系相重合。

空间坐标系中某点的坐标和该点在像素坐标系中的位置有如下关系:

其中,(xw,yw,zw)表示是某点在空间坐标系中位置,(u,v)是该点在像素坐标系中的位置,矩阵A是指相机的内部的几何参数,sx和sy是指相机的焦距,单位为像素,[RT]是相机的外部几何参数,该公式描述了像素坐标系和空间坐标系之间的转换方式。

根据本文的作业要求,最终选用了传统标定方式中的张正友平面标定法。此方法是张正友教授在1998年创建的一个处在传统标定法和自标定法之间的标定方式[3]。有效的避开了传统方法中对设备的高准则以及标定过程的麻烦,而且标定的结果比用自标定方法的精确度好,具有良好的鲁棒性,它的出现推动了计算机视觉应用的脚步。

3图像的处理

用计算机处理图像时,图像首先会被数字化,然后被表示成矩阵的形式,其元素对应于图像中相应位置的亮度。在图像进行采集过程中采集到有用信息的同时也会采入大量的背景信息,会因为噪声、辐照度以及物体表面的反射特性等原因使图像不理想,为了只获取图像中的有用信息,需要先对采集到的图像进行处理。

图像处理的整体过程如图4所示。

3.1图像的平滑处理

因为噪声在真实世界的每个测量中都是固有存在的,所以要想办法抑制噪声对图像的影响,而平滑的目的就是在于抑制噪声或其他小的波动,它可以根据数据的冗余性对图像含有的噪声进行抑制,所以我们首先需要对相机获取的图像进行平滑处理。平滑处理常用的方法有:均值滤波法,中值滤波法和高斯滤波。通过实验对比可以发现,中值滤波能够保证图像边缘清晰的情况下抑制图像中的椒盐噪声,所以本课题最终采用中值滤波对图像进行处理。

3.2图像增强

增强的目标是通过不同的方法来让感兴区域变得更加明显,可以根据需要扩大目标的特征值,增加对比度,提高图像的清晰度。本文中选用频率域法对图像进行增强处理。

3.3图像的阈值分割

分割算法是基于强度值不连续和相似性的两个进本属性展开的研究。第一类是基于强度的突然变化来分割图像,例如图像的边缘。第二类是将图像分割成和预定义的标准相似的区域,例如直方图阈值法。

图像的阈值问题作为图像处理中的一个重要问题,它不仅可以减少图像包含的数据,还为目标的识别和图像的理解打好了基础。灰度阈值化是最简单的分割处理。阈值技术可以分为两类:全局阈值和局部(自适应)阈值。本文中选用的是阈值化中的一种自动阈值检测法,其处理的结果如图8所示。

3.4边缘检测

目标的识别需要获取工件图像的特征点信息,这些点是从图像轮廓中获取到的。通过锐化的方法可以增强图像的边缘细节、轮廓和灰度跳变部分,得到连续的边界,这对后期的判断有很重要的作用。对于一般的滤波方法得到的结果虽然能够抑制噪声,但也会让图像的边缘变得模糊。本文所采用Canny算法作为边缘的检测工具,最终处理的效果如下。

3.5中心点的提取

本课题中所选工件的厚度是均匀的,所以可选择通过求重心的方法来获得中心位置,假设工件的密度函数为?滓=(x,y),则工件的质量可以表示为:

坐标值的显示结果如图11所示。

把得到的坐标值通过相关的笛卡尔转换坐标处理后,得到可供机器人控制器识别的信息,从而引导机器人自动完成工件的上下料工作。

4结束语

本文首先设计出了由视觉引导的机床上下料系统整体结构,然后根据摄像机的工作原理,对选用的摄像机进行标定,通过计算机对图像进行相关的处理,最终得到工件在工作环境中的具姿,最终引导机器人完成工件的上下料工作。

参考文献:

[1]田涛,邓双城,杨朝岚,张泽.工业机器人的研究现状与发展趋势[J].新技术新工艺,2015(3):92-94.

计算机视觉的原理范文篇4

关键词:机器视觉;图像检测;航空轮胎;表面质量

中图分类号:TP23文献标识码:A

引言近年来,随着生产工艺飞速发展,人们开始关注产品的外观质量,比如印刷品、包装、工艺品等以外观质量为重要附加价值的产品,又比如航空轮胎等表面缺陷会直接影响到使用效果甚至会给使用者的生命财产安全带来无可挽回的损失的产品。众所周知,机器视觉已经发展成为重要的工业生产加工手段之一,在中国成为全球重要的制造中心之一的背景下,中国成为继美国、欧洲和日本后的全球第四大机器视觉市场,同时也是最具发展潜力的市场。一方面外国企业积极入驻中国带来了巨大的视觉系统需求,另一方面国内企业不断扩大生产规模,加大了对视觉系统的需求,以航空轮胎为例,未来十年,国家将在大飞机项目中投入500~600亿资金,大飞机项目的发展,必将会带动航空轮胎行业大规模的发展,对航空轮胎的质量要求也会更加严格。1国内外相关技术研究国外对机器视觉技术的研究,由于开展的比较早,而且具有资金、技术以及硬件方面的优势,已经走在了国内的前面。国外的机器视觉系统的应用领域涉及到了社会生产的各个方面,有原始的在线监视,也有外观检测以及动作、行为控制,许多工业加工成套生产设备都集成了机器视觉系统,成为加工生产线的标配,比如印刷生产线上的机器视觉质量控制系统,又比如汽车制造业中的移动三坐标测量系统[1]。由于经济和技术原因,国内绝大多数图像处理技术公司都以国外产品为主,没有或者很少涉足拥有自主知识产权的机器视觉在线检测设备,对视觉技术的开发应用停留在比较低端的小系统集成上,对需要进行大数据量的实时在线检测的研究很少,也很少有成功案例。但是,随着国内经济发展和技术手段不断提高,对产品质量检测要求就更高,对在线检测设备的需求也就更大,具有巨大的市场潜力。计算机、摄像机等电子技术的飞速发展大大提高了机器视觉系统的硬件水平,同时图像处理理论和算法的快速发展也给机器视觉系统提供了强大的软件支持。但是,仍然伴随着一些问题,主要有以下两点:光学仪器第35卷

第3期谢,等:机器视觉在轮胎检测领域的应用研究

(1)算法的精确性提高伴随着计算量的成倍增加,处理时间就成为了实时检测的软肋;(2)硬件的分辨率提高了,图像的分辨率、精度也随之提高了,但是数据量计算量都因此成倍增加。因此,如何保证检测的实时性和准确性,是机器视觉系统在工业应用中需要解决的核心问题。2视觉检测核心技术

2.1机器视觉图像处理技术机器视觉就是用机器代替人眼来做测量和判断。机器视觉系统是指通过机器视觉产品(即图像摄取装置,分CMOS和CCD两种)将被摄取目标转换成图像信号,传送给专用的图像处理系统,根据像素分布和亮度、颜色等信息,转变成数字化信号;图像系统对这些信号进行各种运算来抽取目标的特征,进而根据判别的结果来控制现场的设备动作。有大量的文献和著作给与介绍和讨论,其中比较著名的马颂德的《计算机视觉》介绍了计算机视觉的算法和理论,以及RichardHartley的《MultipleViewGeometryinComputerVision》介绍了在计算机视觉中的几何理论和方法[2]。机器视觉中的图像处理方法,主要包括图像增强、数据编码和传输、平滑、边缘锐化、分割、特征抽取、图像识别与理解等内容。经过这些处理后,输出图像的质量得到相当程度的改善,既优化了图像的视觉效果,又便于处理器对图像进行分析、处理和识别[3]。机器视觉理论应用于现代检测领域,是上世纪末本世纪初计算机视觉的一个新的研究方向。它使用计算机视觉的理论方法来识别物体的关键点,经过分析处理以后,转换成坐标数据,然后产生检测数据。国内已有学者把机器视觉技术运用于检测领域[4]。但是在轮胎检测领域,机器视觉技术的应用还仅仅停留在理论之上,还没有可实际应用的商品化的设备,更不用说结合机器视觉和嵌入式两种技术的便携式检测仪了。

2.2嵌入式技术嵌入式系统一般指非PC系统,有计算机功能但又不称之为计算机的设备或器材。它是以应用为中心,软硬件可裁减的,适应对功能、可靠性、成本、体积、功耗等综合性严格要求的专用计算机系统。嵌入式系统几乎包括了生活中的所有电器设备,如掌上PDA、移动计算设备、电视机顶盒、手机上网、数字电视、多媒体、汽车、微波炉、数字相机、家庭自动化系统、电梯、空调、安全系统、自动售货机、蜂窝式电话、消费电子设备、工业自动化仪表与医疗仪器等。嵌入式系统有以下几大优点[56]:(1)嵌入式系统通常是面向特定应用的,它通常都具有低功耗、体积小,集成度高等特点;(2)嵌入式系统和具体应用有机地结合在一起,它的升级换代也是和具体产品同步进行的,因此嵌入式系统产品一旦进入市场,就具有较长的生命周期;(3)由于空间和各种资源相对不足,嵌入式系统的硬件和软件都必须设计,量体裁衣、去除冗余,力争在同样的硅片面积上实现更高的性能,这样才能在具体应用中对处理器的选择更具有竞争力。本研究选取嵌入式系统中的DSP(数字信号处理器)来进行开发,具体型号为TI公司的TMS320。它具有很高的编译效率和执行速度,在信号处理方面具有优势,它的特点如下:(1)程序和数据具有独立的存储空间,有着各自独立的程序总线与数据总线,可以同时对数据和程序进行寻址,大大提高了数据处理能力;(2)由于广泛采用了流水线操作,减少了指令的执行时间,可以同时运行8条指令;(3)与一般计算机不同,乘法(除法)不由加法和移位实现,它具有硬件乘法器,乘法运算可以在一个指令周期内完成;(4)指令周期降到了1.67ns。随着工作频率进一步提高,指令周期将进一步缩短;(5)拥有自己独特的专门为数字信号处理而设计的指令系统;(6)相比传统的处理芯片,它还具有体积小、功耗小、使用方便、实时处理迅速、处理数据量大、处理精度高、性能价格比高等许多优点。3轮胎检测系统构成

3.1研究目标机器视觉用于产品表面缺陷检测需要面对以下主要问题:(1)数据处理量非常庞大;(2)如何快读匹配图像;(3)如何快速实现缺陷分割并剔除伪缺陷;(4)如何选取缺陷特征,用以实现缺陷识别。以具体产品为例,相对其他轮胎产品,航空轮胎对质量检测的要求较为严格,只要航空轮胎的检测技术到位,其他轮胎产品也基本可以检测。以航空轮胎的缺陷检测为例,根据GB/T9747-2008《航空轮胎试验方法》、GB/T13652-2004《航空轮胎表面质量》和GB15323-1994《航空轮胎内胎》等标准的要求,研究表面缺陷在线检测的图像处理方案;开发一套基于机器视觉的产品表面缺陷的在线检测设备,同时根据GB/T13653-2004《航空轮胎X射线检测方法》所述,配合X射线发射仪,利用一对一的服务器/客户机构架的机器视觉对标准中所描述的航空轮胎的一系列缺陷,如断层、气泡和裂口等进行高精度、高实时性、高连续性以及非接触式的在线缺陷检测。具体技术指标:(1)能检测出最小直径0.3mm的轮胎内部缺陷(即横向纵向最小均为0.3mm)并能对缺陷进行分类识别,主要包括结构类、气泡类和夹杂物类,对缺陷的检出率要求大于90%;(2)对缺陷部位进行定量和定位分析:读出缺陷的尺寸(误差0.5mm),测出缺陷距离轮胎表面的深度,决定缺陷在轮胎内部的位置;(3)在线检测设备的检测检测速度与X射线管旋转速度同步,X射线管旋转一周即完成一个轮胎一个圆周的缺陷检测。

3.2研究内容和技术路线

3.2.1确定机器视觉检测系统的基本框架在数据量大时,采用一个处理器搭配一台摄像机的一对一方式。在产品表面检测中,由于航空轮胎的圆周面比较大,数据量也就比较大,通常采用的机器视觉单摄像机方式,很难满足圆周面检测分辨率高、数据量大的要求,而多台摄像机能满足分辨率和数据量的要求,却又相应带来实时性差的问题。若采用多台摄像机的方式,就需要配备多套成像系统,一套成像系统造价在10万元左右,基于成本和计算数据量的考虑,本研究选用一对一方式,利用分时运动克服单台摄像机采集数据量不足的缺点。具体来说,就是在经典的服务器/客户端模式架构的基础上设计一种基于机器视觉的系统结构以实现轮胎圆周面产品表面缺陷的在线检测,该结构主要由四部分组成:服务器(嵌入式系统)、客户端(图像处理子系统)、信号模块(PLC)、输出单元。系统框架如图1所示。每隔一定的时间(系统初步设定为5s),服务器通过PLC控制步进电机驱动轮胎做圆周转动,每转过一个固定角度(系统定为120°),服务器就调动客户端完成此区域内相对独立的视觉检测任务,一次间隔只检测轮胎的三分之一(120/360),经过3个时间间隔,客户端即完成了整个轮胎360°的全面检测,然后利用拼接原理把各部分拼接起来,统一到一个坐标系下。拼接测量的关键是利用重叠区计算出各次测量时基准的不同,然后消除不同,统一在一个坐标系下。拼接测量的方法可以直接计算出被测轮胎的全面信息。为了保证服务器和客户端之间图像检测数据可靠、实时的交互,本研究采用千兆以太网的方式传输数据。作为整个检测系统的管理控制单元和人机交互接口,服务器不仅要完成检测任务的调度,还要可以设定检测参数,接收和实时显示客户端上传的图像数据和处理结果(缺陷等),并将信息存入数据库中。此外,服务器还接收PLC传来的位置检测信号,用于与客户端的同步,并且根据检测结果中的位置信号,对执行机构发出动作信号,标记并剔除有缺陷的产品。在客户端处理核心中安装有图像采集卡,接收服务器设置的参数和任务调度,控制采集卡和摄像机完成图像实时采集,利用图像处理算法处理和分析图像数据,将最终得到的缺陷位置和分类信息上传给服务器,保存缺陷图像以备查。

3.2.2设计编写表面缺陷检测的图像处理方案在表面缺陷检测中,根据图像数据的特点,本研究提出以下图像处理过程:缺陷分割、特征提取及缺陷分类。首先是缺陷分割:在表面缺陷检测的时候,利用图像处理算法,处理采集到的产品表面图像,将缺陷从复杂的背景图像中分离出来。接着是特征提取:提取缺陷后,对缺陷的各种标识性属性进行提取,主要是几何特征和灰度统计特征,以保证后续的缺陷分类和识别。几何特征指的是轮廓特征,比如长度、形状、面积、重心等。灰度统计特征指的是分布位置、统计值、均方差等等。还有缺陷分类:本研究采用改进的BP算法[7]对网络进行训练,构建神经网络分类器来实现轮胎缺陷分类,为了提高检测系统对伪缺陷的适应性,本研究将部分伪缺陷也作为网络输出并对其进行训练。由于图像处理中需要运用大量的计算机内存处理算法,为避免编程中出现内存泄露进而造成计算机内存资源流失的现象,决定采用对内存进行托管的C#语言进行编程。

3.2.3服务器和客户机系统之间的同步服务器/客户端模式架构的机器视觉系统具有独立性和并行性的特点,它不得不面临的一个重要问题是如何解决服务器和图像处理子系统之间的同步问题,包括摄像机同步采集、数据同步处理和轮胎运动同步控制等。本研究利用摄像机本身的外同步特性,采用对摄像机提供统一的线扫描触发信号保证摄像机采集同步。机器视觉系统基本组成模块见图2。

4结论实际测量结果证明,应用视觉检测方法可以较好地解决传统测量方法中时间长、工作量大、测量效率低的问题。该方法能够充分利用现代计算机技术的优势,设备简单、易用,克服了传统测量仪器的许多误差来源,具有快速、准确、非接触测量的优点。在实验室中初步完成了实验系统的核心部分(如图3所示),与传统的测量方法相比,原先需要15min的测量时间,现在只需要15~30s就可完成,操作也更加简单便捷。该系统可检测出最小直径0.3mm的轮胎内部缺陷(即横向纵向最小均为0.3mm)并能对缺陷进行分类识别,主要包括结构类、气泡类和夹杂物类,对缺陷的检出率为96%。

参考文献:

[1]彭向前.产品表面缺陷在线检测方法研究及系统实现[D].武汉:华中科技大学,2008.

[2]ZHANGZ.DeterminingtheEpipolargeometryanditsuncertainty[J].AReviewIntJournalonComputerVision,1998,27(2):161-195.

[3]章毓晋.图像处理和分析[M].北京:清华大学出版社,1999.

[4]朱方文.基于LAP方法的机器人灵巧手控制[D].上海:上海大学,2006.

[5]张嘉琪.基于嵌入式系统图像处理平台的万寿菊水分状态检测系统的研究[D].重庆:西南大学,2009.

计算机视觉的原理范文篇5

本文设计了一种基于Hi3516A及ODROID-C2的单目测距系统。该系统以Hi3516A作为主控芯片进行图像数据采集,通过交换机将所采集数据传输到ODROID-C2,再由ODROID-C2对图像数据进行处理,经过识别算法及测距相关算法进行物体识别及测距,最后给出结果值。实际测试的结果表明,测距的精度可达到20cm以内,基本能满足项目需求。

【P键词】单目摄像头测距图像数据采集

1背景及单目测距原理介绍

目标测距是机器人视觉系统的重要应用。目前,主要的目标测距方法主要有超声波测距,红外测距,激光测距以及视觉测距。近年来,视觉测距吸引了许多学者的研究。随着制造技术的发展,摄像头设备价格走低的同时性能越来越好。因此摄像头应用于视觉测距领域成为一种受欢迎的方式。

1.1单目测距原理介绍

视觉测距首先要解决的问题是将图像的座标转换为机器人实际座标。座标映射器的任务就是将摄像头帧图片的像素点座标映射到机器人座标。

从图1三角等比例相似关系可以计算出实际距离d=d0[(h-a)/a]=d0*h/a-d0=A+B/PVC

计算出纵座标后,横座标的距离也可以相应地计算出来,如图2所示。

根据三角形相似关系,实际横座标X=(C*PR)/PV。其中C为常数,PR为X像素点座标像素值,PV为Y像素点座标像素值。在得知常数A、B、C后,再计算目标在图片中的像素值,即可计算出机器人座标的实际值。A,B,C常数与摄像头与地面的形成的角度有关。摄像头的位置确定不变后,这些值就可以确定了。A,B,C常数的值可以通过左确定距离拍摄棋盘格的图片,通过角检测算法确定与棋盘4个角同像素的对应关系得出。本文不对此算法展开讨论。

2系统介绍

单目测距系统分为硬件系统及软件系统。

2.1硬件系统

硬件系统框图如图3所示,摄像头模块包括图像传感器及镜头系统。镜头采用5MP像素,为了有较大的视觉范围,采用3.6MM的焦距,图像传感器采用SONY的IMAX178。此CMOS图像传感器面积为1/1.8'',最大3072*2048约6.29M有效像素。5M像素输出时,可在12bit下达到60帧/秒,14bit下达到30帧每秒。为了达到更高的帧率,选定了5M像素,12bit,60帧/秒。

HI3516A集成智能分析加速引擎,支持智能运动侦测、周界防范、视频诊断等多种智能分析应用。内置A7@600MHz,32KBI-Cache,32KBD-Cache/128KBL2cache,支持Neon加速,集成FPU处理单元,H.264BP/MP/HP,H.265MainProfile,MJPEG/JPEGBaseline编码,H.264/H.265编码可支持最大分辨率为5MPixel,H.264/H.265多码流实时编码能力:?5M@30fps+VGA@30fps。输入支持8/10/12/14bitRGBBayerDC时序视频输入,时钟频率最高150MHz,支持MIPI、LVDS/Sub-LVDS、HiSPi接口,兼容多种sensor并行/差分接口电气特性,提供可编程sensor时钟输出,支持输入最大分辨率为5MPixel。

列举以上参数可知,IMAX178同Hi3516A连接及配合工作是合适的,可充分发挥2者的性能。为了让Hi3516A专注于ISP处理,Hi3516A出来的图像通过交换机传输到ODROID-C2进行算法计算并处理结果。ODROID-C2系个功能强大的四核单板计算机,CPU为四核AmlogicARM?Cortex?-A53(ARMv8),时钟频率为1.5Ghz,集成了包含2个像素处理器+2个Vertex阴影处理器的Mali?-450GPU,2Gbyte的DDR3SDRAM,网络接口为千兆以太网,同时带有H.2654K/60FPS以及H.2644K/30FPS的VPU。可运行最新的Ubuntu及Android系统。

2.2软件系统

如图4所示,IMX178经过光电转换,出来的是Bayer格式的原始图像,Bayer格式的原始图像传送给ISP后经过逻辑单元进行算法处理及Firmware控制镜头及IMAX178完成光圈调节、曝光调节、白平衡调节、减嘈、除雾、Gamma调节、锐化调节等功能,输出RGB空间域的图像给后端的视频采集单元VIU。设计过程可以参考HiISP的开发参考文档,开发文档中详细的列出了相关的接口调用。

如图5所示,Hi3516A运行于Ubuntu系统,主要由2个功能模块组成。分别为图片采集模块及HTTP服务模块。图片采集模块包括图4的ISP子系统以及图片及视频输出接口。HTTP服务模块监听8080端口,以响应ODROID-C2及其他外界访问,接收摄像头相关参数设置及图片、视频采集或其他控制命令。

如图6所示,ODROID-C2运行于Ubuntu系统,主要由4个功能模块组成。图片视频服务器储存所采集的图片及视频文件,然后通过目标识别模块计算出所要识别的目标在图片中的像素位置信息,得出像素位置信息后,将结果发送到目标距离计算模块,最后输出目标到HTTP服务器。

3测试结果

实际距离指摄像头与地面垂直交点为起点,在地平面的直线距离。已经考虑到摄像头与地面的倾角。从120cm到500cm,系统测量均可以识别出目标并准确计算直线距离值。测量实际误差均少于20cm。

4结论

本文给出了一种单目测距系统的方案,介绍了软硬件的设计,并且给出了实际测量的结果值。从测量结果看,从系统畸变允许的视域范围内,误差在20cm以内,基本能满足项目需求。

参考文献

[1]CoordinateMapping,Andreas,Konstantin,Reiko&Taavi,http://robotex.ing.ee/2012/01/coordinate-mapping/2012,01.

[2]IMAX178LQJ-CTechnicalDatasheetV3.0.0,Sonycorporation2012.11

计算机视觉的原理范文篇6

关键词双目视觉;图像处理;图像匹配

中图分类号TP3文献标识码A文章编号1674-6708(2017)182-0084-02

视觉模型及算法的基础是利用两张存在视差的二维图形,构造一个具有更深度信息的立体图形。双目视觉系统则是利用两个摄像机来模拟人的双眼,对场景进行识别和测量,然后通过一定的计算方法将场景结果(图像)进一步处理,就可以获得一个三维的图像。因此双目视觉系统在各行各业都得到了广泛的应用,例如医学检查、制造业和军工制造等领域,也成为目前研究的热点。

1双目视觉系统图像处理原理与现状

1.1图像处理原理与流程介绍

双目视觉具有使用成本低、利用方便、效率较高的有点,因此被广泛应用于诸多领域。计算机视觉系统主要有图像获取、图像处理和分析、输出和显示3个步骤组成的,细化之后,可以将之分为以下几个步骤。

双目摄像机标定是根据有效的摄像机成像模型,通过实验和计算来确定摄像机的内外参数,进而能够正确建立物体表面点的集合位置,以及对应投影点坐标之间的关系。这是计算机双目视觉系统不可缺少的关键步骤。

图像获取是双目视觉系统的信息来源,摄像机在拍摄到场景后,转化为数字信号然后生成二维图形。进而在此基础上形成三维图形。但是光线条件、摄像机的性能等对所获取图像的品质影响较大。

图像处理技术将输入的图像经过处理算法,对原始数据进行预处理操作,降低无用信息和其他信息的干扰,从而达到提高图像质量,使图像能够进行进一步的分析。

图像匹配的目的在于寻找同一场景在左右像平面上的投影点,获取位置关系并得到视差,这是双目视觉系统中最为重要的一步。

获取深度信息是在图像匹配并得到视差后,可以根据三角测量方法计算目标物体的深度信息,从而获得物体表面点的三维坐标。

在整个流程中,图像的匹配工作是双目视觉领域最为基础的问题,也是为后续的图像分析和理解奠定基础的工作。但是由于双目摄像机在不同的场景、不同的角度和位置拍摄,以及受到光线条件的影响,每一幅图像存在较大的差异。例如灰度水平、场景位置、分辨率等等。而图像匹配就是寻找这些因素具有不变性的特征,进而根据这些特征来对两幅图像进行匹配。

1.2影响图像匹配的因素分析

在双目摄像机在获取图像时,由于摄像器材、光线充足、拍摄角度的不同,都会让图像产生一定的畸变,这些畸变导致的误差会在进行图像匹配时被放大,进而导致匹配结果错误的发生。首先是平移、旋转等几何变化时,会导致两幅图像的所有像素都产生位移,对图像的匹配产生较大的影响。而旋转则是由于摄像设备的视角差异,两幅图的相对关系发生旋转。其次是光线条件,在对同一场景进行拍摄时,由于光线条件的差异也会导致图像存在差异。例如在光线较强时,图像的平均灰度高,会产生阴影。而在光线不足的情况下,所获取的图片分辨率就会降低,带来部分遮挡现象,这些差异给图像匹配带来很大的难度。第三种是传感器的噪声产生的影响。传感器是将获取的信息转换成电信号,因此在获取图像时、电磁辐射、传感器件、开关器件等都产生一定的成像噪声。系统就会对信号进行离散化并编码,以便进行计算机处理,但是在这个过程中就会出现量化误差,给图像匹配造成影响。

1.3图像匹配算法的研究现状

在国内外专家学者的研究中,是针对不同的应用目的为出发点,提出了许多具有针对性的匹配算法,具体来说可以分为基于图像灰度和基于图像特征两个类别。两种算法对比来看,基于灰度的匹配算法,是对图像的平均灰度水平、灰度直方图、平均绝对值以及平方差、协方差等进行统计,根据这些特点进行匹配具有精度高的优势。但是也存在计算量大、时间效率不高的问题,因此并不能满足现实生活的需求。而基于特征的图像匹配方法,在是针对图像中包含各种特征的信息进行提取,数据量相对较小,因此匹配效率更高,能够满足时时图像处理的需要。具体来说,基于灰度的图像匹配算法,是通过对图像的灰度信息进行分析,计算图像之间的相似度,进而寻找图像的最佳匹配。也就是说该方法所选取的特征即是图像的灰度。可见该方法思路十分简单,有利于在双目视觉中实现。但由于计算量较大,因此许多研究者提出了快速算法。例如FFT、SSDA等计算方法。而基于特征的图像匹配算法,则是通过对两幅图像的特征和内容进行对比,对特征进行参数描述,然后根据计算得出的相似度进行匹配,完成图像匹配。优势在于该方法的计算过程不会因为几何位置、光线强度等因素的差异而影响匹配结果,数据量较小,极大地提高了计算效率。

2双目视觉图像处理算法的优化

图像的特征,主要包括轮廓特征和区域特征,轮廓特征是指场景或物体的外部边界,而区域特征则是图像某一区域中所独有的属性。从内容上看,图像的特征包括形状、空间、颜色和纹理等;从结构看,图像特征又可以分为点、线、面。因此优化特征图像匹配算法,就要用以下几个方面衡量,一是图像特点的检测和提取是否快捷;二是图像特征描述向量维树是否适合;三是特征点数是否适合。

在本文的研究中,主要采用了SURF特征图像匹配算法。提取图像特征的具体步骤如下。

第一步是特征点检验。利用Hessian矩阵的行列式的值的正负来判断该点是否为极值点,此过程中采用方框滤波替代二阶高斯滤波来减少构建尺度空间的计算量,并引入积分图像来加速图像卷积的计算;

第二步是特征点的精确定位。根据检测所得到的极点值与周围的26个像素点进行比较,进而确定特征点,比周围26个像素的值都大或者都小的即是特征点。

第三步是生成特征描述向量,通过计算得出特征点处圆形领域内的Haar小波响应,然后划出扇形模板,并计算扇形范围的内的Haar小波响应,根据这些特征点来构建特征描述向量。

最后采用SURF特征算法提取,其函数原型如下。

cvExtractSURF(image,0,&Keypoints,&Descriptors,storage,params);?

其中image为图像,Keypoints和Descriptors是两个队列,用来保存图像的关键点位置信息和特征点的描述向量,storage?为图像进行特征提取时开辟的暂存区域,params为SURF参数。

3结论

在本文的研究中,对图像匹配算法的两类常用方法进行了分析,可见目前特征点提取算法更加适合现代社会的需要,计算量小而且效率高。同时在图像进行平移、选择等因素的影响后,具有不变性的特点,这也提高了图像匹配的鲁棒性。在基于SURF特征算法下,提高了图像计算和匹配效率,更加适合双目视觉系统的需要。

参考文献

[1]郝捧华,龚国庆,陈勇.双目视觉图像处理算法的优化[J].北京信息科技大学学报,2012(5):64-67.

[2]戴玉艳.一种基于图像处理的双目视觉校准方法[J].电子设计工程,2015(16):178-181.

计算机视觉的原理范文

【关键词】计算机;视觉系统;框架构思

在现代计算机技术的支持下,对人类视觉功能进行模拟的计算机系统被称为计算机视觉系统,因为视觉系统本身兼具科学性和应用性,所以计算机视觉系统本身既具有科学学科的特性又具有工程学科的特性。对其的研究不仅能够进一步了解人类本身,而且能够在工业生产领域发挥更大的作用。

1计算机视觉系统现有理论框架

1.1计算机世界理论框架

20世纪80年代,麻省理工学院教授Marr在视觉理论研究领域获得突破,提出了利用计算机实现视觉能力的理论框架――计算机视觉理论,这一理论主要特点是以现代信息处理的方式对人类视觉能力作用机制进行了分析,并以人类的视觉能力为基础在计算机技术的支持下形成了三个不同的计算机层次。分别是计算机理论层次、表示层次和算法层次。这三个层次分别对应着人类对视觉信息进行处理的三个环节,通过各个环节的仿生设置,计算机视觉系统就能够将初步的视觉处理能力赋予计算机。这一理论中的核心是计算机理论层次,Marr认为人类的视觉能力主要是从图像中建立物体形状和位置的描述,所以在这一层次中设计者设计的主要环节是从初步获取的二维图像中提取和细化物体的三维结构和位置,并将这些信息在一个二维平面上反映出来,即三维重建。

1.2基于知识的视觉理论框架

基于知识的视觉理论框架最早产生于20世纪90年代,最早的提出者是Lowe。认为在人类的视觉能力发挥过程中,对三维物体的实际测算是不必要的,人类的视觉能力与三维测算能力没有直接的关系,虽然使用三维测算技术也能够实现计算机视觉系统的功能,但并不是对人类视觉功能的模仿。Lowe认为在人类的视觉活动中,会将三维物体看成二维物体,也会将二维物体看成三维物体。这种现象本身并不是偶然性的,而是一种视觉作用机制的必然。既然人类肉眼能够借助一定的作用机制和处理能力实现二维的三维化,在计算机视觉系统中就完全有可能设计出这种对人类肉眼直接模拟的机制。以感知系统感知物体的二维特性,并在其基础上直接生成三维图像,而不需要借助复杂的测量过程。

1.3主动视觉理论框架

主动视觉理论是在现有计算机理论的基础上形成的新型理论框架,是根据人类视觉功能实现的主动性提出的。在人类实现视觉功能的过程中,人类的视觉系统并不是被动的,而是会根据视觉系统的要求调动身体的其他部位进行配合的、具有主动性的,所以在人类视觉功能的发挥过程中,视觉系统是具有主动性的,人类视觉系统的视角、关注点都会是动态变化的。

基于这一理论,主动视觉理论框架认为人类的视觉活动是一种“感知――动作”过程。根据这一原则,主动视觉理论框架认为计算机视觉系统并不需要精准的三维测算系统。而应该以计算机视觉获取系统为核心,设置主动的视觉系统。这一理念在实际的应用中主要通过对图像获取系统技术参数的调整和控制来实现,例如摄像机的位置、取向、焦距、光圈等,通过对这些参数的调整图像信息获取系统就能够从不同的视角对物体进行观察,进而获取物体的三维图像信息。

2计算机视觉理论框架中存在的问题

计算机视觉理论框架的产生极大的支持了计算机视觉系统的研发工作,但是在计算机视觉系统的实际研发工作中,也逐渐暴露出了计算机理论框架的缺陷。当前主流的计算机视觉系统框架中,计算机视觉理论是最早产生的也是唯一一种被动的计算机视觉技术。在其理论系统中更多的强调人类视觉系统的测算能力,而没有意识到人类的视觉系统是一种主观性很强的、目的性很强的信息获取系统,完全建立在测算基础上的计算机视觉理论框架是不必要的。

基于知识的理论框架,认为人类视觉系统的功能实现主要环节是反馈,强调了人类视觉活动中主观意识的指导作用。但是它过于强调系统的目的性和主观性,完全否定了计算机视觉理论,认为人类视觉系统是个完全脱离计算机的认识过程,这种认识显然是错误的,在判断物体尺寸大小、距离远近时,测算无疑是极为必然的。

主动视觉理论并不完全排除三维重建,认为计算机视觉系统的三维重建应该建立在图像获取系统的主动性上。通过改变图像获取摄像机的角度、参数对时间、空间和分辨率等进行有选择的感知,解决了计算机视觉系统认知过程中的不稳定问题,降低了计算机视觉系统实现的难度。但是在其理论框架内部缺乏主观、高层的指导,从整体上看并不完善。

3计算机视觉系统框架的新构思

在计算机视觉系统的研究领域,三种理论构建各有优劣。但是无疑反应了当前计算机视觉系统研发的主流思想,因此计算机视觉系统框架的新构思应该在其基础上进行,致力于克服各个理论的缺点。综合比较三种理论框架,笔者认为计算机视觉理论虽然存在某些问题,但是从整体上看这一理论框架是最具实践性和操作性的,其存在的问题完全可以借助其他理论框架加以解决,因此笔者以计算机视觉理论为主体,结合基于知识的视觉理论和主动视觉理论,提出一个更加完善和通用的计算机视觉系统构架。

计算机视觉系统视觉功能实现的主体结构还是建立在计算理论结构的基础上的,将计算理论框架中的早期视觉处理环节分为图像预处理、图像分割和二维模式识别两个部分,因为图像的预处理是在平面图像基础上的简单处理,不需要主观主导意识和目的性的参与,同时图像分割和二维模式识别能够最大限度的提升后继图像处理的效果。

在早期处理完成以后,后继的中后期处理还是分别情调了二维模式识别和三维模式识别,虽然这两种模式本身的识别原理是一样的,但是其面对的对象不同,物体的模型也不同。一般来讲,在我们的世界中二维信息具有很强的重要性,图形、文字、指纹等关键二维信息在通常情况下作用更大、应用范围更广,所以计算机视觉系统矿建的新思路中,要对二维信息进行进一步的处理。

模型库提供具体物体模型的表示。知识库不但要对物体进行抽象表示而且还要对抽象知识进行推理。人类经验的积累和知识的获取是通过学习而得到的,所以加人模型库、知识库管理,并让其从输出结果中进行学习。这将使模型库和知识库更加丰富和完善。

视觉活动本身是带有目的性的,所以在有些时候视觉系统的应用确实需要视物体的实际情况来决定,有时只需识别场景中存在的是什么物体或某物是否存在,而不要求定量恢复场景中的物体。因此,在计算机视觉系统中引人视觉目的来判断输出是否满足要求。同时,用视觉目的对图象分割和二维模式识别、中期视觉处理、后期视觉处理和三维模式识别加以控制。如果需要三维重建则由主动视觉控制成象来获得景物更完整的信息。

计算机视觉系统框架是支持计算机视觉系统实现的重要基础,所以在计算机视觉系统的研发、设计工作中,对理论框架的研究具有鲜明的现实意义,本文简单介绍了现有框架思想,并分析了其各自的优缺点,最后再这些理论框架的基础上形成了计算机视觉系统框架的新构思。认为计算机视觉系统构架应该以计算机理论为基础,以视觉活动的主观性和目的性为指导,以具体的视觉实现形式为方法。

【参考文献】

计算机视觉的原理范文篇8

关键词:数字摄影测量计算机视觉多目立体视觉影像匹配

引言

摄影测量学是一门古老的学科,若从1839年摄影术的发明算起,摄影测量学已有170多年的历史,而被普遍认为摄影测量学真正起点的是1851―1859年“交会摄影测量”的提出。在这漫长的发展过程中,摄影测量学经历了模拟法、解析法和数字化三个阶段。模拟摄影测量和解析摄影测量分别是以立体摄影测量的发明和计算机的发明为标志,因此很大程度上,计算机的发展决定了摄影测量学的发展。在解析摄影测量中,计算机用于大规模的空中三角测量、区域网平差、数字测图,还用于计算共线方程,在解析测图仪中起着控制相片盘的实时运动,交会空间点位的作用。而出现在数字摄影测量阶段的数字摄影测量工作站(digitalphotogrammetryworkstation,DPW)就是一台计算机+各种功能的摄影测量软件。如果说从模拟摄影测量到解析摄影测量的发展是一次技术的进步,那么从解析摄影测量到数字摄影测量的发展则是一场技术的革命。数字摄影测量与模拟、解析摄影测量的最大区别在于:它处理的是数字影像而不再是模拟相片,更为重要的是它开始并将不断深入地利用计算机替代作业员的眼睛。[1-2]毫无疑问,摄影测量进入数字摄影测量时代已经与计算机视觉紧密联系在一起了[2]。

计算机视觉是一个相对年轻而又发展迅速的领域。其目标是使计算机具有通过二维图像认知三维环境信息的能力,这种能力将不仅使机器能感知三维环境中物体的几何信息,包括它的形状、位置、姿态、运动等,而且能对它们进行描述、存储、识别与理解[3]。数字摄影测量具有类似的目标,也面临着相同的基本问题。数字摄影测量学涉及多个学科,如图像处理、模式识别以及计算机图形学等。由于它与计算机视觉的联系十分紧密,有些专家将其看做是计算机视觉的分支。

数字摄影测量的发展已经借鉴了许多计算机视觉的研究成果[4]。数字摄影测量发展导致了实时摄影测量的出现,所谓实时摄影测量是指利用多台CCD数字摄影机对目标进行影像获取,并直接输入计算机系统中,在实时软件的帮助下,立刻获得和提取需要的信息,并用来控制对目标的操作[1]。在立体观测的过程中,其主要利用计算机视觉方法实现计算机代替人眼。随着数码相机技术的发展和应用,数字近景摄影测量已经成为必然趋势。近景摄影测量是利用近距离摄影取得的影像信息,研究物体大小形状和时空位置的一门新技术,它是一种基于数字信息和数字影像技术的数据获取手段。量测型的计算机视觉与数字近景摄影测量的学科交叉将会在计算机视觉中形成一个新的分支――摄影测量的计算机视觉,但是它不应仅仅局限于地学信息[2]。

1.计算机视觉与数字摄影测量的差异

1.1目的不同导致二者的坐标系和基本公式不同

摄影测量的基本任务是严格建立相片获取瞬间所存在的像点与对应物点之间的几何关系,最终实现利用摄影片上的影像信息测制各种比例尺地形图,建立地形数据库,为各种地理信息系统建立或更新提供基础数据。因此,它是在测绘领域内发展起来的一门学科。

而计算机视觉领域的突出特点是其多样性与不完善性。计算机视觉的主要任务是通过对采集的图片或视频进行处理以获得相应场景的三维信息,因此直到计算机的性能提高到足以处理大规模数据时它才得到正式的关注和发展,而这些发展往往起源于其他不同领域的需要。比如在一些不适合于人工作业的危险工作环境或人工视觉难以满足要求的场合,常用计算机来替代人工视觉。

由于摄影测量是测绘地形图的重要手段之一,为了测绘某一地区而摄影的所有影像,必须建立统一的坐标系。而计算机视觉是研究怎样用计算机模拟人的眼睛,因此它是以眼睛(摄影机中心)与光轴构成的坐标系为准。因此,摄影测量与计算机视觉目的不同,导致它们对物体与影像之间关系的描述也不同。

1.2二者处理流程不同

2.可用于数字摄影测量领域的计算机视觉理论――立体视觉

2.1立体视觉

立体视觉是计算机视觉中的一个重要分支,一直是计算机视觉研究的重点和热点之一,在20多年的发展过程中,逐渐形成了自己的方法和理论。立体视觉的基本原理是从两个(或多个)视点观察同一景物,以获取在不同视角下的感知图像,通过三角测量原理计算像像素间的位置偏差(即视差)来获取景物的三维信息,这一过程与人类视觉的立体感知过程是类似的。一个完整的立体视觉系统通常可分为图像获取、摄像机定标、特征提取、影像匹配、深度确定及内插等6个大部分[5]。其中影像匹配是立体视觉中最重要也是最困难的问题,也是计算机视觉和数字摄影测量的核心问题。

2.2影像匹配

立体视觉的最终目的是为了恢复景物可视表面的完整信息。当空间三维场景被投影为二维图像时,同一景物在不同视点下的图像会有很大不同,而且场景中的诸多因素,如光照条件,景物几何形状和物理特性、噪声干扰和畸变以及摄像机特性等,都被综合成单一的图像中的灰度值。因此,要准确地对包含了如此之多不利因素的图像进行无歧义的匹配,显然是十分困难的。

在摄影测量中最基本的过程之一就是在两幅或者更多幅的重叠影像中识别并定位同名点,以产生立体影像。在模拟摄影测量和解析摄影测量中,同名点的识别是通过人工操作方式完成的;而在数字摄影测量中则利用计算机代替人工解决同名点识别的问题,即采用影像匹配的方法。

2.3多目立体视觉

根据单张相片只能确定地面某个点的方向,不能确定地面点的三维空间位置,而有了立体像对则可构成与地面相似的立体模型,解求地面点的空间位置。双目立体视觉由不同位置的两台或者一台摄像机(CCD)经过移动或旋转拍摄同一幅场景,就像人有了两只眼睛,才能看三维立体景观一样,然后通过计算空间点在两幅图像中的视差,获得该点的三维坐标值。现在的数字摄影测量中的立体像对技术通常是在一条基线上进行的,但是由于采用计算机匹配替代人眼测定影像同名像对时存在大量的误匹配,使自动匹配的结果很不可靠。其存在的问题主要是,对存在特殊结构的景物,如平坦、缺乏纹理细节、周期性的重复特征等易产生假匹配;在摄像机基线距离增大时,遮挡严重,能重建的空间点减少。为了解决这些问题,降低双目匹配的难度,自1986年以来出现了三目立体视觉系统,即采用3个摄像机同时摄取空间景物,通过利用第三目图像提供的信息来消除匹配的歧义性[5]。采用“多目立体视觉技术”可以利用摄影测量的空中三角测量原理,对多度重叠点进行“多方向的前方交会”,既能较有效地解决随机的误匹配问题,同时又能增加交会角,提高高程测量的精度[2]。这项技术的应用,将很大程度地解决自动匹配结果的不可靠性,提高数字摄影测量系统的准确性。

计算机视觉的原理范文1篇9

CG的由来

CG是英语ComputerGraphics的缩写,是一种使用数学算法将二维或三维图形转化为计算机显示器的栅格形式的科学。简单地说,计算机图形学的主要研究内容就是研究如何在计算机中表示图形、以及利用计算机进行图形的计算、处理和显示的相关原理与算法。

利用计算机技术进行视觉设计和生产。它既包括技术也包括艺术,几乎涵盖了利用计算机技术进行的所有的视觉艺术创作活动,如平面设计、网页设计、三维动画、影视特效、多媒体技术,以及计算机辅助设计的建筑设计等。现在CG的概念正在扩大,已经形成一个可观的经济产业,我们提到CG时,一般可以指以下四个主要领域:CG艺术与设计、游戏软件、动画、漫画。

CG动画指电脑制作动画,就是电脑原先就制作好了的动画,主机只需要播放就可以了。跟它相对应的是即时演算动画,是一段程序需要主机进行计算才能播放出的动画。一般来说,CG动画的画面要比即时演算的强上不少,占用的空间也比即时演算的要少。但是CG动画缺少变化性,无法即时更改动作。

在电影特技中的应用

计算机动画的一个重要应用就是制作电影特技可以说电影特技的发展和计算机动画的发展是相互促进的。1987年由著名的计算机动画专家塔尔曼夫妇领导的MIRA实验室制作了一部七分钟的计算机动画片《相会在蒙特利尔》再现了国际影星玛丽莲·梦露的风采。1988年,美国电影《谁陷害了兔子罗杰》(WhoFramedRogerRabbit?)中二维动画人物和真实演员的完美结合,令人瞠目结舌、叹为观止其中用了不少计算机动画处理。1991年美国电影《终结者II:世界末日》展现了奇妙的计算机技术。此外,还有《侏罗纪公园》(JurassicPark)、《狮子王》、《玩具总动员》(ToyStory)等。

行业趋势

计算机图形学狭义上是一种研究基于物理定律、经验方法以及认知原理,使用各种数学算法处理二维或三维图形数据,生成可视数据表现的科学。它是计算机科学的一个分支领域与应用方向,主要关注数字合成与操作视觉的图形内容。广义上来看,计算机图形学不仅包含了从三维图形建模、绘制到动画的过程,同时也包括了对二维矢量图形以及图像视频融合处理的研究。计算机图形学经过将近40年的发展,已进入了较为成熟的发展期。目前,其主要应用领域包括计算机辅助设计与加工,影视动漫,军事仿真,医学图像处理,气象、地质、财经和电磁等的科学可视化等。由于计算机图形学在这些领域的成功运用,特别是在迅猛发展的动漫产业中,带来了可观的经济效益。动漫产业是目前各国优先发展的绿色产业,具有高科技、高投入与高产出等特点。据统计,截至2009年3月,美国动画梦工厂所拍摄的三维动画片《怪物史莱克II》在预算为1.5亿美元的情况下,获得了超过9.2亿的全球累计票房。而我国在2008年度共制作完成的国产电视动画片249部,计131042分钟,与2007年度相比增加了近28%。另一方面,由于这些领域应用的推动,也给计算机图形学的发展提供了新的发展机遇与挑战。

图形渲染是整个图形学发展的核心。在计算机辅助设计,影视动漫以及各类可视化应用中都对图形渲染结果的高真实感提出了很高的要求。同时,由于显示设备的快速发展,人们要求能提供高清分辨率(1920x1080),进一步要能达到数字电影所能播放的4K分辨率(4096x2060);色彩的动态范围也希望从原来每个通道的8Bit提高到10bit及以上。虽然已有的图形学方法已经能较为真实地再现各类视觉效果,然而为了能提供高分辨率高动态的渲染效果,必须消耗非常可观的计算能力。一帧精美的高清分辨率图像,单机渲染往往需要耗费数小时至数十小时。为此,传统方法主要采用分布式系统,将渲染任务分配到集群渲染节点中。即使这样,也需要使用上千台计算机,耗费数月时间才能完成一部标准90分钟长度的影片渲染。

计算机图形学在追求真实感方向的研究发展已进入一个发展的平台期,基本上各种真实感特效在不计较计算代价的前提下均能较好得以重现。然而,人们创造和生成图片的终极目的不仅仅是展现真实的世界,更重要的是表达所需要传达的信息。例如,在一个所需要描绘的场景中每个对象和元素都有其相关需要传达的信息,可根据重要度不同可采用不同的绘制策略来进行分层渲染再加以融合,最终合成具有一定表意性的图像。为此,研究者已经开始研究如何与图像处理、人工智能、心理认知等领域相结合,探索合适表意性图形生成方法。而这一技术趋势的兴起,实际上延续了已有的非真实感绘制研究中的若干进展,必将在未来有更多的发展。

总结

CG技术随着计算机技术的发展,开始为影视视觉服务,从最早pixar开始运用电脑将手绘的二维动画往三维CG动画发展,影视动画就开始蓬勃发展,从1995年pixar公司的《玩具总动员》成功上映,到2011年《变形金刚3》《怪物史瑞克3》站上电影票房之巅。无不预示着电影动画的发展前景。而中国第一部全三维动画电影有环球数码制作的《魔比斯环》在2006年成功上映奠定了中国CG影视的第一步,到今中国CG不断发展,衍生出很多CG影视公司,拉动了整个产业的发展和就业。未来中国CG动画还将蓬勃发展。

(作者单位:辽宁科技大学)

作者简介:

计算机视觉的原理范文

【关键词】特征点提取特征点匹配F-HARRIS

1双目立体视觉的数学表达

为了描述问题的方便我们定义三个坐标系,真实世界事物的大小、位置一般用世界坐标系(xw,yw,zw)表示;摄像机的光学成像系统用摄像机系统(xc,yc,zc)表示,事物的图像在图1所示的xoy平面内,即图像坐标系平面,但图像中心一般不和zc轴重合。

通过图1可以看到,摄像机坐标系就是联系图像坐标系和世界坐标系的桥梁,世界坐标系首先变换到摄像机坐标系,然后通过取整、平移后,变换到图像坐标系的行和列。变换公式如下:

公式中R和T组成旋转、平移矩阵,将世界坐标系中事物的坐标转换到摄像机坐标系,由f组成的转换矩阵,将摄像机坐标系中事物的坐标投影到图像坐标系的x-y平面上,最后把得到的位于图像坐标系x-y平面上的坐标数值除以表示像素大小的dx、dy,就得到图像坐标系的行u和列v,但由于图像坐标系的中心和摄像机坐标系的zc轴一般不重合,因此需要进行平移u0行和v0列。其中,zc表示事物到镜头的距离,f表示焦距,fx=f/dx,fy=f/dy,表示有效焦距。

在单目摄像机系统中,世界坐标系到图像坐标系的转换关系用公式(1)表示,为了简化问题,我们假设世界坐标系的原点和双目视觉系统中左目摄像系统的摄像坐标系重合,且各自成像系统的有效焦距相同。

2双目立体视觉摄像机系统参数

为了能够对(4)式进行求解,需要确定所有参数数值,其中ul、vl和ur是匹配后的特征点像素坐标,标定后的其它系统参数如下:u0r为-17、u0l为43、v0l为-58、r1为0.9996、r2为-0.0010、r3为-0.0290、r7为0.0289、r8为-0.0086、r9为0.9995、fl为1872、fr为1908、tx为-216.21和tz为-0.0818的值。

3特征点的寻找

目前应用比较广泛的图像匹配是特征点匹配法,首先利用特征点算法计算特征点的位置,常用的特征点有SIFT特征点、HARRIS特征点和FAST特征点;然后利用描述子μ卣鞯憬行某种表示,常用的描述子有BRIEF描述子和SIFT描述子,最后进行特征点的匹配。

3.1特征点寻找

双目视觉图像没有旋转、尺度变化,不能发挥SIFT算子在不变特征提取方面无可比拟的长处,反而暴露出其很差的实时性。本文针对HARRIS实时性不足和FAST太依赖阈值以及图像本身纹理信息分布可能造成特征点提取不均匀的缺陷,提出了一种改进的角点检测算法F-HARRIS,该算法借鉴了HARRIS角点和FAST角点的思想,先通过FAST思想(取小阈值)过滤掉大量不是候选角点的像素,之后计算出候选点的HARRIS响应值R,然后筛选出真正的强角点,实验表明其具有几乎和HARRIS角点检测算法一样的效果,检测效率却大大提高,尤其是对于角点数目小的大图像而言,这种优势更加明显,本文将这个算法称为F-HARRIS。

F-HARRIS算法具体流程如下:

Step1:选取图像中的任一像素点p。

Step2:通过4.3.2节中FAST特征点检测算法判断p是否FAST特征点,如果是,转Step3,否则跳转到Step1。

Step3:分别计算该像素点及其邻域构成的子图像在X,Y方向上的梯度Ix和Iy。

Step4:结合高斯模板ω,计算出该像素点的Hessian矩阵M。

Step5:根据Hessian矩阵计算该像素的Harris响应值R,如果R大于阈值t,则为角点,否则不是。如果图像像素没有遍历结束,转Step1,否则转Step6。

Step6:对R进行非极大值抑制,局部最大值点为角点。

通过对比试验,HARRIS方法用时146ms,检测到角点数量884,而改进算法F-HARRIS方法用时50ms,检测到角点数量903。

3.2双目立体视觉的特征点匹配

通过上面的描述,利用F-HARRIS方法我们已经能非常高效的提取特征点,由公式(4)可知,要计算事物的三维空间坐标,还需要将两幅图中表征事物相同位置的特征点匹配。

本文使用双向交叉匹配方法去匹配双目图像的特征点,利用穷举法进行匹配验证。将BRIEF描述子、SIFT描述子和Harris特征点、FAST特征点两两配对,组成四种方式,进行试验验证。实验环境是Intel(R)Pentium(R)CPUG8603.00GHz,4.00GB内存。

通过计算,在进行匹配时HARRIS、FAST特征点和BRIEF描述子的两个组合方案用时分别为408ms和301ms,正确率为72.9%和69.9%,而HARRIS、FAST特征点和SIFT描述子的两个组合方案用时分别为811ms和14975ms,正确率为65.8%和79.9%。因此,BRIEF描述子比SIFT描述子更节省时间,同时保证正确率。最终选择BRIEF描述子作为特征描述子。

经过上面的步骤,我们得到数量比较大的匹配的特征点,但总体来说,误配的数量也比较大,考虑到双摄像机摆放在同以平面的同一高度上,两幅图像中景物的高度不会有太大差别,把该条件作为特征点匹配的约束条件,将F-HARRIS+BRIEF和HARRIS+BRIEF两个方案进行对比试验,匹配时间分别为340ms和145描述,匹配点的数量也不是很大,分别为132和104,试验结果比较理想。

4事物三维坐标的获取

通过摄像机的标定和特征点的匹配,公式(4)中所需要的所有参数已经具备。从公式(4)中可以看到xw和yw的计算都需要得到zw后才能够计算,zw重要性比较高,因此我们只对zw进行了精度分析。需要注意的问题是图像坐标系的原点一般在左上角,而文中都是将图像的几何中心作为原点,计算时需要一个平移转换,才能得到公式(4)所需ul、vl和ur。

本实验中,我们把模型飞机(全长为23cm,宽度为14cm)的质心放置距离双目摄像机透镜中心面(即z轴距离)600mm,1200mm,1800mm,2400mm,3000mm,3600mm,4200mm,4500mm处,获取16组匹配点对(ul、vl,ur)如下:(1415,918,638),(968,765,159),(1449,862,999),(1118,810,662),(1103,807,757),(1325,842,982),(1386,900,1102),(1334,924,1050),(1127,866,874),(1212,917,959),(1254,885,1025),(1255,878,1027),(1197,894,983),(1121,895,907),(1099,894,891),(1036,887,826),算得到的zw坐标为616.35,598.11,1207.50,1208.20,1784.80,1775.20,2370.10,2380.60,2976.80,2942.80,3527.76,3557.70,4088.20,4149.00,4437.10,4408.10(单位:mm),从上述数据可以看到当物体距离摄像机系统越近,测距精度越高,反之,测距精度降低。实验结果还表明:物体距摄像机4.5米以内时,测距误差在3%以内。

参考文献

[1]高宏伟.计算机双目立体视觉[M].北京:电子工业出版社,2012:4-10.

[2]隋婧,金伟其.双目立体视觉技术的实现及其发展[J].电子技术运用,2004,30(10):4-6.

[3]刘红宁.基于双目立体视觉拟人机器人定位关键技术的研究[C].天津:河北工业大学图书馆(硕士学位论文),2006.

[4]宋丽梅.双目立体机器视觉检测系统及其应用[J].西南科技大学学报(自然科学版),2006,21(01):30-34.

[5]马颂德,张正友.计算机视觉―计算理论与算法基础[M].北京:科学出版社,2003:52-56.

计算机视觉的原理范文篇11

关键词:网页设计;能力培养;目标细化

在2014级和2015级12个教学班、在600多人次的教学过程以及期末的200多件课程作业展评中,笔者发现:学生能够较为轻松地完成网页程序代码的编写、驾驭网页的链接,能够处理网页各级界面中的文字、图片、音像、动画、色彩、标题、标志、导航、搜素等各种构成元素,也能够如期完成期末课程作业。但是在众多的学生作品中,很难发现优秀的、吸引人眼球的作品。在3次毕业学生的座谈和2次企业家的面谈中同样发现:高职院校近几年虽然培养出了大批网页设计人才,但能够独立从事网站设计与开发的人才少之又少。

一、课程开设背景与性质分析

通过查阅知网、万方等数据库中其他学者的学术成果并结合自身教学的经验发现,计算机信息工程专业的学生在网页设计课程的学习中常常出现如下问题:

1.网页界面常常呈现“杂”“乱”“多”“满”的现象,没有清晰条理的流程。这主要是缺乏系统的版式设计,构成网页各元素之间缺乏理性秩序所导致的。

2.网页设计中字体使用随意,没有顾及字体与网页风格、企业性质之间的联系,无法反映企业的文化与理念。

3.网页设计中色彩使用随意,没有考虑到色彩的象征与隐喻性以及色彩的对比、和谐等视觉美学特征。

4.网页各级链接之间风格杂乱,基本上是一个界面一个风格,各个界面之间缺乏必然的内在联系,只是各种风格的堆砌。

5.网页设计缺乏创意与创新意,基本上是对已有网页的抄袭与拷贝。由于缺乏相应的美学基础,所做出的网页在视觉上依然“惨不忍睹”。

6.网页设计缺乏内涵深度,主要原因在于各种视觉符号的任意使用,没有考虑到视觉符号能指与所指之间的关系以及视觉符号内涵与外延之间的关系,也没有考虑到视觉符号的使用禁忌等问题。

在课中与课后的互动中发现:大多数学生根本没有意识到上述问题。偶尔有学生即使意识到了上述问题,也因为缺乏相应的美学功底与文化底蕴不知道如何去改变。这些问题会随着课程的结束而一直遗留,最终导致毕业后无法独立完成视觉形式优美、内涵丰富、客户满意的网页设计与制作。

上述问题的出现,究竟是课程设置的不合理?培养目标实施过程中出现的偏差?抑或是教学过程的失误?还是其他因素所导致?

有学者认为,上述问题出现的原因有教材编写没有连贯性、教材内容滞后、课程内容结构不合理、教学方法不合理等。然而笔者认为,造成计算机信息工程专业学生毕业后无法独立从事网页设计的主要原因在于:学生缺乏基本的美学功底与文化底蕴,课程设置中缺乏相应的美学基础课程,有意或无意夸大了软件的功能等。归根结底,是对网页设计职业能力培养目标的理解或者执行偏差所导致,在学生能力培养目标的定位中太过宽泛,没有将学生应该有的能力目标进行细化。

随着网络技术的迅猛发展和信息终端设备的普及,网页设计与制作教学已成为当今高校教育中的热点,网页设计或网页设计与制作这些课程在各大高校遍地开花。视觉传达设计专业与信息工程专业将其作为一门专业必修课,其他专业也大多将其作为一门选修课或者通识课开设。

网页设计是技术、文化与艺术交汇的结果,不仅要求学生具备计算机程序代码编写能力,同样也需要基本的美学能力与文化底蕴,只有具备了技术、文化与艺术素养才能设计并制作出视觉效果良好且让客户满意的网页。

二、能力目标分析及细化

无论是教育部高等学校计算机基础课程教学指导委员会提出的“面向社会、针对岗位、强化能力、促进发展”的指导思想,还是“加强实践、注重应用、增强素质、培养能力”的课程指导原则,均过于宽泛,需要教学单位在具体的授课执行过程中将其细化。

在调庆、四川、安徽三省高职院校网页设计课程培养目标的过程中发现,大多数职业院校将网页设计能力培养集中于以下几个方面:培养学生数据收集、信息处理、素材加工的能力;培养学生通过Photoshop软件制作静态网页的能力;培养学生通过HTML、CSS编程,使用CSS进行页面样式控制,使用DIV+CSS进行网页布局的能力;培养学生设计网站的综合能力;培养和提高学生的动手能力;培养学生运用所学的理论知识和技能解决网站开发过程中所遇到的实际问题的能力。

从上述专业能力培养目标的细化子目标中可以发现,严重偏向于技术而忽视艺术审美与文化品位能力的趋势。

从网页设计课程性质分析可以发现,网页设计是一门综合性、交叉性很强的课程,需要技术、艺术与文化素养作支撑。高职院校培养的人才应该是能够独立策划、编程并设计出视觉优美、内涵丰富的网页人才。视觉传达设计等专业的学生,不乏美学素养,但是计算机程序语言的编写能力较差,缺乏严谨的理性思维;信息技术工程专业的学生,程序语言编写能力是他们的强项,但是其美学素养与文化底蕴相对缺乏。在网页设计的前导课程中,美学相关课程与训练的缺乏,必然会导致信息技术工程专业的学生一条腿走路,成为一个“健全的瘸子”。

所以,本文认为对于计算机信息工程、计算机软件等专业学生的培养目标应该细化为:组织与策划能力、程序编写与测试能力、视觉表现与美化能力。而这些子目标应该继续细化,如下表。

如表所示,可以通过大学语文课程来培养学生的文化素养,通过网页文案策划来训练学生的组织与(下转第59页)策划能力,通过美学基础来训练学生的文字、图形、图像、色彩特征与客户需求的匹配能力,通过字体设计、版式设计、设计色彩、创意思维激发与表现等课程训练学生的视觉表现与美化能力,通过网页设计(HTML+CSS)来训练学生的程序编写与测试能力。然而,在大多数理工类或偏向于理工类的职业院校中,由于课时的限制,往往缺少文化素养与美学素养的培养与训练,这是导致学生网页设计作品中出现常见问题的主要原因。笔者认为,在条件允许的情况下,尽量开设提升审美与人文素养的必修课程且至少250学时。如若条件不容许,则可以通过选修的方式进行。

三、小结

由于对网页设计专业能力培养目标的细化程度不够,导致了网页设计专业能力培养目标不清晰,进而导致课程设置不够合理,只注重于程序编写与测试能力的培养,最终无法设计出有深度、有内涵、有视觉形式美的网页作品。

参考文献:

[1]罗锦光.《网页设计基础》课程教学研究[J].计算机光盘软件与应用,2014(12).

计算机视觉的原理范文篇12

关键词:多媒体教学;多媒体技术;计算机技术;心理学;教育

多媒体教学的发展,与其技术的发展有直接关系。在一些相关论著中,学者们更多的是对多媒体教学技术的论述,强调的是技术,而很少涉及学习者和教育者这样的“人的因素”。虽然对多媒体教学技术的研究是不可缺少的,但是探索多媒体教学的心理机制和教育基础则更为重要,因为人类是以完全不同的方式来加工多媒体教学的。只有这样,才能在多媒体教学中考虑学习者和教育者的主体性。

一、多媒体教学技术及其计算机基础

多媒体与多媒体技术应视为同义词。关于多媒体技术的特点虽然还没有形成共识,但是,也有一些基本的共同之处。早在1996年,吴炜煜先生在《多媒体世界》撰文提出了多媒体五大特点:1.将不同的媒体数据都表示成统一的结构码流;2.实行新的技术标准体制,以适应系统级集成和规范相关产品的性能指标;3.建设“全球信息高速公路”;4.应用“双向性设计”,统一信息提供者、接受者和控制者的关系;5.赋予信息系统对客观世界信息的自然模拟与处理能力。[1]华中师范大学傅德荣教授认为,多媒体特点主要有:1.整合性,通过计算机实现多种单媒体的整合;2.数字化,将各种单媒体变换成数字信息,读入计算机进行统一的整合,数字化技术是多媒体技术的一种基本技术;3.交互性,交互成多媒体系统;4.超媒体,是一种网状式的结构形式。[2]3黄孝建先生主编的《多媒体技术》一书指出,“多媒体技术是一种能同时综合处理多种信息,在信息之间建立逻辑联系,使其集成为一个交互式系统的技术。”“多媒体的关键性在于信息载体的多样性、交互性和集成性。这也是多媒体技术研究中必须解决的主要问题……多媒体系统一般具备如下功能:捕捉、操作、编辑、存储、呈现和通信,为用户服务。”[3]

根据以上关于多媒体技术的几种观点,我们认为,多媒体技术主要有5个特点:一是整合性。多媒体实时地综合,把文本、图形图像、声音、动画以及视频这些媒体中组成两种或两种以上的结合体,为的是借鉴各种媒体的优势,形成一种在功能上更加完善的体系。二是集成化。多媒体表示的并不单纯是信息的多样性,而是通过多种媒体表现、多种感官认知、多种仪器设备、多学科汇聚、多领域应用等交互作用,集成信息码流、设备控制、人与客观现实关系的一体化。三是多维式。多媒体是趋于人性化的多维信息处理系统,目标是要尽可能实现让人类在现实生活的自然环境下,保持信息交流的高保真效果、通信带宽和交互控制能力。四是数字化。多媒体具备数字化处理系统,其信息是一种数字化的信息,其信息结构是一种超媒体的网状式结构,所以高速宽带网络支持多媒体通讯和资源共享,建造全景化虚拟世界数据库成为现实。五是分布式。目前,多媒体技术正朝着分布式的方向发展。分布式多媒体是一门综合性技术,它集计算机的交互性、网络的分布性和多媒体信息的综合性于一身,突破了计算机、通信等传统产业间相对各自独立发展的界限,是计算机和通信领域的一次革命;分布式多媒体的发展涉及两个关键性的技术问题,一个是多媒体网络技术,网络的频宽、信息的交换方式及网络的高层协作,这直接决定着网络质量;另一个是数据压缩技术,使信息量巨大的多媒体数据、特别是视频和声频数据得以在网络上传输;分布式多媒体向社会提供全新的信息服务,使用户不但可以选择播放的节目以及内容,而且还可利用此系统得到诸如咨询、交流等信息服务。多媒体教学正是在上述5个技术特点的基础上实施的,这些技术特点,为我们提供了教学领域内各种综合性的信息服务,并帮助地理位置不同、时间安排不同的用户,克服各种障碍来共同完成教学任务。由此可以看出,在对多媒体教学技术及其计算机基础的理解中,我们不仅要重视计算机的技术,而且也要关注人与机器的关系、人性化的系统和用户至上的观念。

多媒体并不是多媒体计算机的代名词。多媒体计算机只是多媒体的一个特例。[4]它既有计算机的显著特性,又有多媒体的功能,所以学校进行多媒体教学时,通常以多媒体计算机为载体。然而,多媒体计算机仅仅是多媒体系统中的一个分系统,因此,它常常被认为是多媒体中的一个典范,或者说是多媒体的一种狭义的范畴。

多媒体教学为什么要应用多媒体计算机?计算机虽然也是单一的媒体,但它同电视、音响的不同之处就在于它具有强大的扩展性。就目前的科技水平来说,只要在计算机内加上适当的部件,就多了相应的媒体功能,对于多媒体教学来说,非常简便、经济,更重要的是它还能“胜任”多媒体教学的功能,是不可多得的优质的技术设备,必然被学校广泛应用。多媒体计算机正在以我们无法想象的速度发展。其主要作用是让计算机的使用和操作更加接近于人们的日常生活,使人们在日常生活中用各种各样的媒体交换信息。如使用纸张、广播和电视交换新闻、消息和知识。多媒体计算机技术可以使家用电脑用声音媒体、光学媒体和动画媒体来交换信息,它在教育中有着广泛前景。在多媒体教学中,它主要通过文字、声音、图形图像以及视频与动画这4个方面媒体的形式呈现出教学软件,掌握这四方面媒体的制作,成为制作多媒体教学软件的基本技能基础。

二、多媒体教学技术及其心理基础

从媒体技术的基础来分析,多媒体教学技术离不开视觉媒体技术、听觉媒体技术和触觉媒体技术等。多媒体信息是这些媒体信息数字化后整合而成的,如前所述,数字化技术是多媒体技术的基础技术。在数字化的过程中,各种单媒体有各种不同的国际标准,然而,如果重视“感觉通道说”[5],那么就要在探讨这几个方面的媒体技术问题的同时,必须揭示使用者(尤其是学习者)的感觉、知觉的心理机制,特别是人的视觉和听觉特征。

多媒体教学技术的出现扩展了人们用视觉模式呈现材料的具体途径。视觉材料包括文本信息、图形图像信息、视频信息。这些信息通过视觉媒体技术数字化后整合为多媒体信息。在这个过程中,我们对其技术上要作四点说明:第一,视觉媒体是一个非常复杂的信息系统。文本信息是文字信息的集合,它既是一种符号系统,又具有颜色、大小和种类等特征;图形是点、线、面、体等信号的集合,以面为例,不仅指一般的平面图,还包括曲线、地图、设计图等;图像是静止图像和活动图像的集合,所谓视频信息就是活动或运动的图像信息,它由一系列时间轴(周期)呈现的画面构成。第二,视觉媒体信息的数字化是根据上述各种视觉媒体信息的特征进行的。不管是文本信息还是图形信息,它们的数字化都是各自按编码的国际标准完成的。第三,视觉媒体的各种信息根据不同信号实现数字化。静止图像是一种二维信号,先要经过扫描转换成一维信号,再经过采样、量化、编码实现数字化;活动图像的视频按一幅一幅的静止图像以一定周期展示,每一幅的数字化方法与静止图像类似。第四,视觉媒体信息处理是一种按照物理学原理进行的技术。它们都是利用光电和电光转换原理,把光学图像转换为电信号进行处理后再还原为光图像。

为了使

多媒体教学技术的视觉材料更容易被学习者所接受,就必须要顾及人的视觉心理基础,也就是说,上述视觉媒体技术只有通过视觉心理机制才能实现多媒体教学的目标。这里,我们也要强调四点:第一,多媒体技术要考虑光的物理三属性所引起的视觉的三种心理机制。视觉的刺激是光,光是电磁波,电磁波的范围很广,而人可见的电磁波只占电磁波的一小部分。波长不同,会使我们在视觉上产生色调的差别,从而产生不同的色觉。色觉不仅取决于由波长所引起的色调,还和主观感觉的明度和饱和度有关。明度是对光波强度(振幅)的反应,饱和度则由物体发射或反射的光的纯度来决定。所以,多媒体教学技术在视觉媒体设计上要处理好可见视觉、色调、明度和饱和度这几方面的关系。第二,多媒体教学技术要考虑对感光物质的视觉感受器心理机制。视觉感受器的真正感光器官是视网膜上的一些细胞,其中锥状细胞感觉颜色,棒状细胞感觉明度,这两种细胞中感光物质的化学性质不同,光使这些物质分解,色素被漂白,从而刺激了感受细胞的膜,引起神经冲动。所以,多媒体教学技术在视觉媒体设计上要研究这两种感光物质的化学性质。第三,多媒体教学技术要考虑视觉过程,即眼睛看东西是一个编码过程,视网膜上的不同感受野在视觉中枢有不同的神经细胞,各有其功能,不同的细胞对所刺激信息系统的不同特征分别反应,并像计算机那样编码,这种编码实际是对一些图像的辨认。所以,多媒体教学技术在视觉媒体设计上要利用好视觉感受野与信息的特征。第四,多媒体教学技术要考虑各类视觉现象,特别是决定视力高低的视角、强弱光下的适应、视觉后暂留的后像、不同背景的视觉对比、不同明度下对不同光波长的感受性等等造成视觉的各种差异。所以,多媒体教学技术在视觉媒体设计上要运用各类视觉现象产生的规律。在多媒体教学技术中,视听是紧紧地联系在一起的。在计算机环境下,眼睛知觉动画图像,耳朵则知觉解说语言;在演讲的情境中,视觉通道加工投影仪上幻灯片的内容,听觉通道则加工演讲者的声音。听觉材料主要是声音,包括语言信息、音乐信息和效果声信息。这些信息通过听觉媒体技术上数字化后整合为多媒体信息。在这一过程中,我们从技术角度作如下三点说明:第一,声音信息尽管是一种一维的模拟信号,它可以通过采样、量化、码字分配实现数字化,但它比文本信息的数据量要大,通常采用呈现声音和声音合成技术。第二,声波是起源于发声体的振动,在弹性媒质中传播的是一种机械波。它在气体或液体媒质中传播的是纵波,在固体媒质中传播的则是纵波、横波或两者的复合。声音信号有时域特征、频域特征和声色与失真特征。第三,声频或音频是人耳可闻的振动频率,频率范围每秒钟约为20-20000次(赫兹),声频信息数字化后其数据速率大、保真度好和动态范围大。当然,对于不同类型的声频信号,其信号带宽是不同的,电话、调幅广播、调频广播和激光唱盘等的声频信号是有较大区别的。随着声频数字化的发展,压缩编码技术是多媒体教学技术的关键之一。

要使多媒体教学技术的听觉材料被学习者更容易接受,也必须顾及人的听觉心理基础。这里,我们仅作两点分析:第一,多媒体教学技术要考虑声音的物理三属性所引起的听觉的三个特征。正像光有三种物理属性一样,声音也有三种属性,即振动的频率、振幅的大小、基音与陪音的倍数配合关系,以及所产生的听觉的音调(或因高)、音强(或响度)和音色的三个特征。人对不同音调的感受性是有差别的,尽管声频在20-20000Hz范围,但声频为1000-4000Hz之间音调感受性较好(即阈限较低),这是由于耳膜神经纤维承担的振动频率所决定的。测量音强的方法以分贝(dB)为单位,这是物理学与心理学都认可的,即两个声音之间的强度比率为1∶1.26(1分贝),因为1.26是能清楚辨别出两个声音振幅大小的区别。人的音色是由基音和陪音的不同比例的配合决定的。在音调和音强相同的情况下,人们之所以能够分辨出是哪种琴所演奏的曲子,正是由于不同琴的基本振动(基音)与分段振动(陪音)的比例是不一样的,这种比例成整数倍数为乐音,不成整数倍数则为噪音。所以,多媒体教学技术在听觉媒体设计上要利用好音调、音强和音色的三个特征。第二,多媒体教学技术要考虑听觉的感受野。因为听觉神经细胞是有分工的,研究指出,听觉中枢神经细胞有40%只反应噪音而不反应乐音,另外60%的神经细胞对乐音的反应也有分工。[6]冲动频可以出现在声音的出现时,可以出现在声音消失之后,也可以出现在声音出现和消失的一刹那;可以在声频降低时发生变化,也可以在声频升高时发生变化。一句话,听东西也是一个编码的过程,即在听觉的范围内也会有视觉中那种感受野的情况。由此可见,听东西绝不是简单的录音,听觉过程是有分工的,是一个侦察器在那里侦察。所以,多媒体教学技术在听觉媒体设计上要揭示听觉感受野,以及反应乐音与噪音信息的特征。

由此可见,我们在分析多媒体教学的相关技术的同时,也要注意学习者的心理基础,因为学习者是以特有的心理活动的方式来加工视觉和听觉等媒体信息的。

三、多媒体教学技术及其教育基础

在教育中应用多媒体技术,首先是多媒体教学软件的开发,此外,创作工具和虚拟现实等技术也在教育中应用。每一种技术既为教育服务,又有其教育的需要和基础。由于教育对象是人,所以在教育中不管怎样去应用多媒体技术,都要体现每一种技术为人服务,并把学习者和教育者的要求作为出发点。

多媒体教学软件是为教育制作的以计算机为基础的教育应用软件,它包括计算机辅助教学软件、计算机管理教学软件以及应用于教育的图标统计类等的实用软件,其中多媒体教学软件是核心技术。多媒体教学软件的开发,是一项对视觉媒体、听觉媒体和触觉媒体数据加以分析、处理和编辑的过程,这个过程包括两个环节,即设计和制作。在多媒体教学软件的开发设计中,有一个编写稿本的重要技术。傅德荣教授在《多媒体技术以及教育应用》

一书中设专章论述这个问题。他指出,“稿本是表示多媒体教学软件内部结构的各种文档的总和。它是一种多媒体文档。编写稿本的实质是多媒体教学软件的设计”。[2]230这个设计包括三个方面:一是总本设计,涉及内容结构分析、开发策略、超媒体的结构框图和制作原理等;二是详细设计,设计超媒体结构设计、人机界面设计、学习流程设计和框面设计;三是媒体数据设计、涉及静止图像数据设计、视频图像数据设计,动画数据设计和声音数据设计。稿本编写体现出工作的计划和制作的蓝图;成功的稿本编写是多媒体教学软件开发成功的一半,多媒体教学软件就是根据稿本进行制作的。与此同时,多媒体化的教学设计把活动分为三种类型,有课堂型、课外型和知识扩展型。多媒体教学软件设计要从教学实际出发,根据这三种教学模型编制教学软件,前两种属于课程软件,后一种属于参考软件。多媒体教学软件的制作,既需要有多媒体计算机等硬件环境,又需要有多个媒体数据整合而成的软件环境。在制作中,有一个立项、写本、编辑、加工、整合等开发流程;要使用某种算法语言和各种工具的两种方法,强调坚持教育性、可调节性、因材施教和非结构化教材等原则;制作成果是课件,也就是说,是有关课程某一部分内容的多媒体教学材料(包括教科书、参考书、录音带、录像带、幻灯片、影片等),是专为教学活动设计的计算机软件(包括用于控制和进行教育活动的程序,帮助开发、维护程序的文档资料,帮助教师和学生使用程序学习的课本和练习册等)。多媒体教学软件的开发,体现了多媒体技术是计算机教育的最佳手段。因为多媒体教学软件形式丰富多彩、趣味性强,符合学生心理特点;形象直观、生动、活泼,易于理解;有着丰富的教学资源,特别是和国际联网,以获取最新资料;改革教学模式,呈现交互式的教育方式;体积小、分量轻的光盘能容纳庞大的信息等等。多媒体教学软件的开发尽管有一些妨碍教师主导作用的负面影响,但它是各级各类学校教学的需要。现代教育对学习者记忆与学习的要求、师生互动组合方式的要求、个别化教学与因材施教的要求、不同教学环境、不同教学模式的要求等,这些都为多媒体教学软件开发奠定了教育基础。

多媒体创作工具是指能够集成处理和统一管理文本、图形、静态图像、视频影像、动画、声音等多媒体信息,使之能够根据用户的需要生成多媒体应用软件的编辑工具。当前,多媒体创作工具的种类归纳起来主要有以下三种类型:一是交互式流线或图标编辑控制型,编辑人员按照脚本的要求将选定的不同类型的图标根据需要一一放置于流线上进行编辑。二是描述式页控制型,将多媒体素材根据需要编辑在一幅画面之中形成一页书,再将页与页之间按一定的调用关系联系起来以形成一本书的概念,不同页之间根据需要交互性地呈现即形成多媒体应用软件。三是时间流程型,这类工具在编辑信息时显示出较强的时间前后顺序,即时间流程(TimeLine),主要用来编制一些简报类的程序。编制一个优秀的教育软件,我们需要了解诸如软件的使用体、运行环境等问题。其中关系到软件成败的一个重要因素是要了解创作工具的特点,这样,才可根据需要有目的地进行选择。多媒体创作工具与其他工具软件相比,具有以下特点:1.操作简便,易于入门;2.强大的集成性开发环境;3.开发周期的缩短是软件得以投入运作的最好方式;4.具有极大的扩充功能。在软件的制作中创作人员一般都追求一种极大的时效比,也就是在较短的时间内,用较少的原程序求得较好的效果、较高的质量、亮丽的界面和较低的运作环境。因此,如何从众多的多媒体创作工具中选择符合自己最满意的多媒体创作系统,直接关系到以上所罗列的各种要求。一般来讲,选择多媒体创作工具时应从以下几个方面进行考虑:对创作人员,要求其个人能力与经验;对多媒体创作工具运行的环境,我们以PC机的环境作为标准。此外,MAC多媒体系统是一种多媒体的典范;由于多媒体教学软件有诸如教育型、演示型、娱乐型、百科全书型等不同类型,因此,对创作工具的选择要求根据具体需要考虑选取不同的类型。因为不同的多媒体创作工具其适用范围是不一样的。综上所述,现在教育系统使用多媒体教学技术,其质量是受多媒体创作过程影响的。目前,为满足大、中、小学制作多媒体教学软件的需求,在制作软件时需按要求选取适当的创作工具,提高制作人员的业务素质,才能做出质量较高的教育软件。

虚拟现实是一种人和计算机接口的技术,亦称“灵境技术”。它是利用计算机生成一种高度逼真的、模拟人在现实世界中进行视、听、动等行为的虚拟世界。虚拟现实不仅能够展示现实世界的各种现象,而且还能实现现实世界难以实现的特征。虚拟现实通过多种传感设备,使人有很好的临场感,产生身临其境的体验。虚拟现实技术实现人与虚拟环境的自然交互,实现对虚拟系统的自主控制,实现感知的现实、操作的现实和运动的现实所构成的三要素。这里要强调传感设备。它有显示和呈现视听感知现实的立体头盔等设备;有输入人体对虚拟现实操作行为的数据手套等设备;有通过合成和传递方式实现运动现实的计算机模拟等设备。这些传感设备,既有穿戴在人体上的装置,又有设置于现实环境中的传感器,如摄像机、声响设备、远程传感设备等。虚拟现实尽管经费昂贵且有一定实验的危险性等,但作为多媒体教学的一种技术,它在丰富学习环境、为学生扩大知识信息、提高实践能力、增强创造才华等方面还是有教育价值的。虚拟现实的出现,是教学训练、特别是复杂技能和特殊专业训练以及教学评价的需要。如果有条件,教师也可以使用。不少现代教育,如建工、医学、航空、航天等专业的教学,若采用虚拟现实技术,对提高教学教育质量会有很大的帮助。所有这一切,都为虚拟现实技术奠定了教育基础。

[参考文献]

[1]吴炜煜.多媒体技术导论[J].多媒体世界,1996(1):11-13.

[2]傅德荣.多媒体技术及其教育应用[M].北京:高等教育出版社,2003:3.

[3]黄孝建.多媒体技术[M].北京:北京邮电大学出版社,2000:2.

[4]林众,冯瑞琴.计算机与智力心理学[M].杭州:浙江人民出版社,1997:289.

更多范文

热门推荐