计算机视觉处理技术范例(12篇)
时间:2024-03-28
时间:2024-03-28
农业机械化不仅是人类的解放,解放劳动力。这些年轻的劳动力投入到其他领域,促进中国的经济发展可以提高农业生产的效率,优化操作质量和增加作物产量,有利于农业发展和农民收入,因此,今后应重视先进技术的推广,提高农业机械化水平。目前农业机械的使用,一些机械在使用过程中不能清楚地确定作物的位置,机器在关闭过程中很容易错过,所以利用新技术在农业机械有利于弥补农业机械的脆弱性,提高机器的运作效率。
目前,高新技术的应用范围扩大,农业机械行业也开始使用高新技术,引入计算机视觉技术、自动控制技术、信息网络技术、人工智能技术、机器人技术和液压技术在农业机械的应用现状。
2农业机械的应用技术
2.1农业机械的应用计算机视觉技术
农业机械的应用计算机视觉技术,主要是利用计算机视觉技术在农产品质量、品位等农业产品检查,是基于图像处理,计算机视觉的学科,主要是视觉信息处理理论。表达和计算方法研究,近年来,图像处理,计算机硬件和软件,等可视化仿真技术的逐渐发展计算机视觉技术的使用功能也扩大,计算机视觉技术是用来检查农产品的质量不仅是现阶段和分级产品还用于收割、种植等。
2.2农业机械的CAD技术
CAD技术在我国已广泛应用于机械工程设计制造从上个世纪60年代,我国40多年后独立研究开发和推广应用。但由于我国机械工程设计CAD系统的开发过程的社会主义改革开放的影响,以便后期的完美程度我国机械工程设计CAD系统程度的效率和其他性能大大受到限制,相对于我国的国外机械工程设计CAD系统仍处于较低水平。
2.3农业机械的信息网络技术
信息网络技术在农业机械中的应用非常成功,信息网络技术和地理信息系统,结合自动化技术等技术,可以监测作物和土壤的农业生产,也可以生产作物的发展,植物病虫害,和实时监控等等,然后依靠定位系统和地理信息系统来完成现场操作。
农业机械、机器人技术应用、信息网络、计算机视觉、自动控制技术的融合。目前,已经开发了采摘机器人,嫁接机器人,机器人除草,施肥机器人喷涂机器人,等。对肥料和喷涂机器人的使用,可以避免肥料、杀虫剂和其他化学品危害人体,达到改善环境的目的。目前虽然我国机器人技术落后于发达国家,取得了一些就,但由于现代机械机器人的购买成本非常高,所以这项技术并没有得到普及。
在农业机械的设计、制造和测试,虚拟现实技术具有非常广阔的发展前景,利用虚拟现实技术建立三维模型的农业机械设计师不仅可以了解每一个部分的质量,也可以完全满足的每一部分的运行性能三维农业机械模型具有很高的精度,和农业机械制造商大规模生产的计算机数据的基础上。
在虚拟制造系统中,虚拟现实技术的基础,虚拟制造系统是由多种学科知识,利用计算机技术综合建模、仿真、生产、制造汽车。与此同时,虚拟制造系统还可以制定合理的产品检验和测试程序。目前,虚拟制造技术应用范围广泛,涉及开始工装及模具生产设备,和其他领域,可以在生产部门系统,在这一过程中完成建模、修改、分析和优化的四个工作。此外,虚拟现实技术用于柔性制造系统和计算机集成制造系统的设计。
2.4人工智能技术
近年来,全球高端技术获得了农业机械在农业的快速发展,管理,挖掘和采摘等实现智能化,使用人工智能技术研究和开发的激光拖拉机、内部导航设备,等等,可以拖拉机的方向和具体位置测量,并通过建立计算机数据库将记录相关数据,使用数据库了解排水位置、土壤湿度、等等。了解土地信息后,制定合理的土地种植方案,计算机化化肥消费,数量的农药和种子。
3先进技术的应用在农业机械化操作的保障措施
得到更好的应用程序为了促进先进技术,提高农业机械化水平,未来应该完善的技术推广体系,提高农业机械化水平,促进农业生产和发展。完善的技术推广体系,高度重视农业技术推广,建立试验示范基地,发挥作用的指导,让农民参观和学习。让他们意识到农业机械设备的重要作用,加强农业机械化的意识,接受和使用机械设备,技术推广和培训活动。让广大农民掌握农业机械和设备的使用,提高思想认识和应用技能、农业机械和农业技术应用于农业生产。
构建技术环境,当地政府应该高度重视农业机械和农业技术推广的作用。提高思想认识,加强规划和指导,增加资本投资,培训专业人才,创新工作方法,对许多人来说,完善的技术推广体系,认真履行职责,并扩大先进技术的影响。完善法律法规,充分利用其在技术和人才优势,重视技术的宣传和推广活动,增强服务意识,扩展广泛的服务渠道,更好的满足实际工作的需要,对农业技术的发展,为推广农业机械和设备创造便利。
4农业机械新技术的发展
农业机械新技术的应用和发展是为了提高农业的生产力服务,所以农业机械新技术的发展主要是以下几点:
首先,加快新技术的使用和推广。科学技术是第一生产力,加快计算机视觉技术、自动控制技术和智能技术等新技术在农业机械的使用,同时引进国外先进的机械、新技术,促进我国农业的发展,提高农业的生产效率具有重要意义。
第二,政府补贴。购买新机器的个人组织生产、资本压力,使得他们很难机械技术推广,所以对于农业机械推广使用新技术,政府将给予补贴材料,扩大新机器的使用。
第三,提高农业资源的利用效率。机械使用以提高农业生产的效率,提高农业资源的利用率。例如,在传统的农业生产过程中,和处理农作物秸秆,绝大多数情况下燃烧,不仅浪费资源,还污染空气。但农业机械的使用新技术的农作物秸秆粉碎加工、作物秸秆可以转化成脂肪不仅材料,提高农业资源的使用效率,也减少了空气污染。
【关键词】计算机;视觉系统;框架构思
在现代计算机技术的支持下,对人类视觉功能进行模拟的计算机系统被称为计算机视觉系统,因为视觉系统本身兼具科学性和应用性,所以计算机视觉系统本身既具有科学学科的特性又具有工程学科的特性。对其的研究不仅能够进一步了解人类本身,而且能够在工业生产领域发挥更大的作用。
1计算机视觉系统现有理论框架
1.1计算机世界理论框架
20世纪80年代,麻省理工学院教授Marr在视觉理论研究领域获得突破,提出了利用计算机实现视觉能力的理论框架――计算机视觉理论,这一理论主要特点是以现代信息处理的方式对人类视觉能力作用机制进行了分析,并以人类的视觉能力为基础在计算机技术的支持下形成了三个不同的计算机层次。分别是计算机理论层次、表示层次和算法层次。这三个层次分别对应着人类对视觉信息进行处理的三个环节,通过各个环节的仿生设置,计算机视觉系统就能够将初步的视觉处理能力赋予计算机。这一理论中的核心是计算机理论层次,Marr认为人类的视觉能力主要是从图像中建立物体形状和位置的描述,所以在这一层次中设计者设计的主要环节是从初步获取的二维图像中提取和细化物体的三维结构和位置,并将这些信息在一个二维平面上反映出来,即三维重建。
1.2基于知识的视觉理论框架
基于知识的视觉理论框架最早产生于20世纪90年代,最早的提出者是Lowe。认为在人类的视觉能力发挥过程中,对三维物体的实际测算是不必要的,人类的视觉能力与三维测算能力没有直接的关系,虽然使用三维测算技术也能够实现计算机视觉系统的功能,但并不是对人类视觉功能的模仿。Lowe认为在人类的视觉活动中,会将三维物体看成二维物体,也会将二维物体看成三维物体。这种现象本身并不是偶然性的,而是一种视觉作用机制的必然。既然人类肉眼能够借助一定的作用机制和处理能力实现二维的三维化,在计算机视觉系统中就完全有可能设计出这种对人类肉眼直接模拟的机制。以感知系统感知物体的二维特性,并在其基础上直接生成三维图像,而不需要借助复杂的测量过程。
1.3主动视觉理论框架
主动视觉理论是在现有计算机理论的基础上形成的新型理论框架,是根据人类视觉功能实现的主动性提出的。在人类实现视觉功能的过程中,人类的视觉系统并不是被动的,而是会根据视觉系统的要求调动身体的其他部位进行配合的、具有主动性的,所以在人类视觉功能的发挥过程中,视觉系统是具有主动性的,人类视觉系统的视角、关注点都会是动态变化的。
基于这一理论,主动视觉理论框架认为人类的视觉活动是一种“感知――动作”过程。根据这一原则,主动视觉理论框架认为计算机视觉系统并不需要精准的三维测算系统。而应该以计算机视觉获取系统为核心,设置主动的视觉系统。这一理念在实际的应用中主要通过对图像获取系统技术参数的调整和控制来实现,例如摄像机的位置、取向、焦距、光圈等,通过对这些参数的调整图像信息获取系统就能够从不同的视角对物体进行观察,进而获取物体的三维图像信息。
2计算机视觉理论框架中存在的问题
计算机视觉理论框架的产生极大的支持了计算机视觉系统的研发工作,但是在计算机视觉系统的实际研发工作中,也逐渐暴露出了计算机理论框架的缺陷。当前主流的计算机视觉系统框架中,计算机视觉理论是最早产生的也是唯一一种被动的计算机视觉技术。在其理论系统中更多的强调人类视觉系统的测算能力,而没有意识到人类的视觉系统是一种主观性很强的、目的性很强的信息获取系统,完全建立在测算基础上的计算机视觉理论框架是不必要的。
基于知识的理论框架,认为人类视觉系统的功能实现主要环节是反馈,强调了人类视觉活动中主观意识的指导作用。但是它过于强调系统的目的性和主观性,完全否定了计算机视觉理论,认为人类视觉系统是个完全脱离计算机的认识过程,这种认识显然是错误的,在判断物体尺寸大小、距离远近时,测算无疑是极为必然的。
主动视觉理论并不完全排除三维重建,认为计算机视觉系统的三维重建应该建立在图像获取系统的主动性上。通过改变图像获取摄像机的角度、参数对时间、空间和分辨率等进行有选择的感知,解决了计算机视觉系统认知过程中的不稳定问题,降低了计算机视觉系统实现的难度。但是在其理论框架内部缺乏主观、高层的指导,从整体上看并不完善。
3计算机视觉系统框架的新构思
在计算机视觉系统的研究领域,三种理论构建各有优劣。但是无疑反应了当前计算机视觉系统研发的主流思想,因此计算机视觉系统框架的新构思应该在其基础上进行,致力于克服各个理论的缺点。综合比较三种理论框架,笔者认为计算机视觉理论虽然存在某些问题,但是从整体上看这一理论框架是最具实践性和操作性的,其存在的问题完全可以借助其他理论框架加以解决,因此笔者以计算机视觉理论为主体,结合基于知识的视觉理论和主动视觉理论,提出一个更加完善和通用的计算机视觉系统构架。
计算机视觉系统视觉功能实现的主体结构还是建立在计算理论结构的基础上的,将计算理论框架中的早期视觉处理环节分为图像预处理、图像分割和二维模式识别两个部分,因为图像的预处理是在平面图像基础上的简单处理,不需要主观主导意识和目的性的参与,同时图像分割和二维模式识别能够最大限度的提升后继图像处理的效果。
在早期处理完成以后,后继的中后期处理还是分别情调了二维模式识别和三维模式识别,虽然这两种模式本身的识别原理是一样的,但是其面对的对象不同,物体的模型也不同。一般来讲,在我们的世界中二维信息具有很强的重要性,图形、文字、指纹等关键二维信息在通常情况下作用更大、应用范围更广,所以计算机视觉系统矿建的新思路中,要对二维信息进行进一步的处理。
模型库提供具体物体模型的表示。知识库不但要对物体进行抽象表示而且还要对抽象知识进行推理。人类经验的积累和知识的获取是通过学习而得到的,所以加人模型库、知识库管理,并让其从输出结果中进行学习。这将使模型库和知识库更加丰富和完善。
视觉活动本身是带有目的性的,所以在有些时候视觉系统的应用确实需要视物体的实际情况来决定,有时只需识别场景中存在的是什么物体或某物是否存在,而不要求定量恢复场景中的物体。因此,在计算机视觉系统中引人视觉目的来判断输出是否满足要求。同时,用视觉目的对图象分割和二维模式识别、中期视觉处理、后期视觉处理和三维模式识别加以控制。如果需要三维重建则由主动视觉控制成象来获得景物更完整的信息。
计算机视觉系统框架是支持计算机视觉系统实现的重要基础,所以在计算机视觉系统的研发、设计工作中,对理论框架的研究具有鲜明的现实意义,本文简单介绍了现有框架思想,并分析了其各自的优缺点,最后再这些理论框架的基础上形成了计算机视觉系统框架的新构思。认为计算机视觉系统构架应该以计算机理论为基础,以视觉活动的主观性和目的性为指导,以具体的视觉实现形式为方法。
【参考文献】
[关键词]物流企业;自动化;算法
[中图分类号]F252;TP39[文献标识码]A[文章编号]1673-0194(2013)06-0058-03
0引言
随着物流业被列入我国十大行业振兴计划,物流业已经成为我国经济发展的不可缺少的重要组成部分。物流业是我国经济运行的基础,是推动国民经济发展的重要支柱性产业之一。随着国家持续加强和改善宏观调控政策,物流业发展环境和条件不断改善,物流业保持了较快的增长速度。但由于中国物流业起步较晚,存在物流成本较高、管理落后等问题,离一体化、信息化的物流业还有一定差距。中国物流业只有应用现代物流的理念,采用先进的信息技术与运作方式,才能应对拥有技术、资金和管理优势的外国企业的竞争。实现传统物流业向现代物流业的转变,也是物流业自身结构调整和产业升级的需要,是整个国民经济发展的必然要求。我国经济要集约式发展,必然需要推进现代物流。现代物流的根本宗旨是降低物流成本、提高物流效率、满足客户需求,其中信息化是现代物流的核心。随着信息技术的不断更新和物流企业自身的发展,使得新兴的信息业务与传统物流业务之间相互介入,模糊了新兴信息技术及业务与传统物流业务的界限,从而模糊了物流业的产业属性和产业界限,即发生了产业融合现象。产业融合是由于技术进步和放松管制的原因,发生在产业边界和交叉处的技术融合,在经过不同产业或行业之间的业务、组织、管理和市场的资源整合后,改变了原有产业产品和市场需求的特征,导致产业的企业之间竞争合作关系发生改变,从而最终造成产业界限的模糊化甚至重划产业界限。
产业融合促进了传统产业创新,进而推进产业结构优化与产业发展,即产生创新性优化效应。物流信息化的重要性已经引起国内很多学者的重视,并纷纷提出相应的观点和建议。马健(2005)认为物流企业将在建立呼叫中心、应用系统领域和网络计算机领域出现信息化融合的趋势,并提出物流企业应采取的战略。邓小瑜(2011)等从技术融合、产品融合、业务融合、产业衍生4个层面阐述了物流业如何进行信息化建设。物流业与信息业的融合包含通过融合信息技术提高来增强企业竞争力和将信息业务增加到物流服务中形成新的业务2个方面。
视频摄像头在日常生活中非常普遍,但是利用率较低,大部分监控系统都是提供视频数据的线性存储,成为事后证据查找的有效手段。近年来,随着计算机视觉的发展,很多学者开始研究视频理解,尤其是针对视频信息检测与识别技术,建立有效的算法,实现底层图像处理技术与高层视频内容分析之间的关联,从而推动了计算机视觉在物流领域的应用,提高物流企业的竞争力。
1计算机视觉的相关知识
1.1计算机视觉的概念
20世纪80年代初,Marr从信息处理的角度,提出了第一个比较完善的计算机系统视觉框架。计算机视觉是指利用计算机模拟人眼的视觉功能,对图片或视频进行采集、加工、处理和识别,从中提取三维景物的形态和运动信息,解决物流、工业、商业等领域产品图像自动检测识别问题,提高检测识别效率和自动化程度。计算机视觉自动识别技术作为一门交叉学科,近年来受到各相关行业的高度重视。计算机视觉的处理流程为:摄像机图像采集图像处理计算机帧存储、图像识别控制逻辑显示器显示。
1.2亮度要求
基于计算机视觉的硬件环境中,亮度是非常重要的因素。在计算机视觉中亮度的作用是突出物体的重要特征或使物体本身可见,而弱化物体其他不需要的特征或物体所处的背景。如果物体太亮或太暗,都会影响对物体的处理。
彩色物体反射光谱的某些部分,吸收其他部分。因此开发人员可以利用这个特点来提高某些物体的可视度。开发人员可以利用颜色之间的对比增强某种颜色或抑制其相反的颜色。例如,如果一个红色的物体在一个绿色背景中则应该加强红色,这时可使用红色照明。这样红色的物体会显得明亮,同时会变暗绿色的对象。
LED是目前用于计算机视觉的主要照明技术,相比白炽灯、日光灯等使用时间短、亮度逐渐减弱的特点,LED灯的寿命超过100万小时,而且耗电小,产生热量少。
1.3计算机和摄像机的接口
常用的计算机和摄像机接口包括IEEE1394、Ethernet、USB2.0andGigabitEthernet等。
1.4RGB介绍
RGB颜色空间是实际应用最多的一个颜色空间,在使用计算机进行图像处理时,数字图像一般用RGB空间存储和表示,分3个通道:红(Red)、绿(Green)和蓝(Blue),分别反映了颜色在某个通道的亮度值。3种原色光不同比例混合即使得人得到不同颜色的感知,这就是RGB颜色空间的由来。RGB空间中每种颜色都能用三维空间中的一个点来表示。
2计算机视觉在物流领域的优势
随着物流业的迅速发展,计算机视觉在条形码识别、运动物流跟踪方面逐渐得到应用。与传统方法相比,计算机视觉应用在物流领域的优势为以下方面。
2.1灵活、低成本
物流系统中一般采用传感器来收集相关信息,但是传感器的位置是固定的,如果需要多方位的信息,必须同时需要多个传感器才能完成。利用计算机视觉摄像机和计算机来完成,只需要通过程序的设置和一台摄像机就可实现多方位信息的收集。
2.2高效、准确
在一些人眼难以满足要求的场合,或不适于人工工作的环境下,用计算机视觉来代替人工视觉可以提高生产效率、信息的准确率。
3计算机视觉在流水线中多方位跟踪计数的算法
物流企业在流水线产品的计数方法目前主要采用传感器,而利用摄像机所提供的视频信息可以实现多方位的跟踪。计算机视觉是一个集成系统,图像分析的时间有限,算法必须简单有效。本文采用的物流流水线视频图像如图1所示。图中红色矩形表示流水线中传输的物品,绿色区域为流水线中的物品处理区域。
系统会在视频图像中设计①、②、③、④四个计数区域,在物品进行相关处理前进行计数。计数方法为将每帧图像变为黑白图,图像中的红色变为白色,其余都变为黑色。当每幅图像中的红线部分中的白色像素超过一定阈值时,认为物体撞线,如图2所示,这时确定有需要计数的物品通过,可以开始计数。
3.1主要算法
3.2算法的运行结果
OpenCV是Intel公司开发的开源计算机视觉库。它提供了几百个C/C++函数,实现了计算机视觉领域中大部分最常用的算法。利用Intel开发的开源视觉库IntelOpenCV和VC6.0将上述算法转换为对应的源代码,可实现4个区域的物品计数。
3.3算法的评价
该算法利用计算机视觉技术实现了物流流水线上的多方位计数,提高物流企业的信息化水平,节约了资金。算法简单,运行速度快,完全可以满足物流企业的实际需求。
4结论与建议
本文所提出的算法实现了计算机视觉技术在物流企业的应用,为信息产业和物流业的融合提供了新的思路。但信息产业与物流产业的融合并不意味着引入信息技术后物流业的竞争力一定能提高。Berry(1995)指出了企业可以从6个方面来利用技术手段来提高竞争力,根据Berry的建议和我国物流业的实际情况,本文认为从以下几个方面来考虑如何通过与信息技术的融合提高物流企业的竞争力。
4.1要有一个战略性的全局行动纲领
技术只是一种手段,使用技术的目的是为了企业发展服务,应符合全局发展的需要。因此物流企业高层管理者应该参与技术战略的制定,保证技术战略与全局战略一致,并有CIO(首席信息官)监控具体执行情况。而不应该盲目使用一些新技术或进行信息改革,造成企业不必要的损失。
4.2解决主要问题
物流业作为服务行业其最终目的是为客户服务,使用信息技术的有效性应建立在为客户解决实际问题的基础上。因此信息产业与物流业的融合应体现在为客户提供更多的便利,或提供增值服务的基础上。
4.3使用物流公共信息平台和建立物流信息系统,保证系统有效运转
通过现代物流公共信息平台的建设,企业可以及时获得需求信息,政府可获得物流业相关的调控和管理的宏观信息,实现互联互通。通过企业流程再造,利用含有CRM(客户关系管理)等模块的ERP系统,采用EDI(电子数据交换系统)、GPS、条形码、无线射频技术等先进技术,建立真正适应企业发展的符合现有服务模式的管理信息系统。
4.4创新型物流人才的引进和培养
物流企业在自身提高业务流程和信息化水平的同时,还应注重创新型人才的引进和培养,特别是有国际大型物流企业管理和技术经验的复合型人才。
主要参考文献
[1]LLeonard,Berry.OnGreatService:AFrameworkforAction[M].NewYorkNY:TheFreePress,1995.
【关键词】机器视觉;应用研究
机器视觉是一门涉及人工智能、计算机科学、图像处理、模式识别、神经生物学、心理物理学等诸多领域的交叉学科。机器视觉主要利用计算机来模拟人或再现与人类视觉有关的某些智能行为,从客观事物的图像中提取信息进行处理,并加以理解,最终用于实际检测和控制。随着现代计算机技术、现场总线技术与大规模集成电路技术的飞速发展,机器视觉技术也日臻成熟,已经广泛应用在国民经济发展的各行业。
1.机器视觉系统组成
一个典型的机器视觉应用系统包括图像捕捉、光源系统、图像数字化模块、数字图像处理模块、智能判断决策模块和机械控制执行模块,如图1所示。首先采用CCD摄像机获得被测目标的图像信号,然后通过A/D转换成数字信号传送给专用的图像处理系统,根据像素分布、亮度和色彩等信息,进行各种运算来抽取目标的特征,然后再根据预设的判别标准输出判断结果,去控制驱动执行机构进行相应处理。
总之,随着机器视觉技术自身的成熟和发展,可以预计它将在现代和未来制造企业中得到越来越广泛的应用。
2.机器视觉技术的应用
在国外,机器视觉的应用主要体现在半导体及电子行业,其中大概40%-50%都集中在半导体行业。具体如PCB印刷电路;SMT表面贴装;电子生产加工设备;机器视觉系统还在质量检测的各个方面已经得到了广泛的应用,并且其产品在应用中占据着举足轻重的地位。
而在中国,以上行业本身就属于新兴的领域,再加之机器视觉产品技术的普及不够,导致机器视觉在以上各行业的应用几乎空白。目前随着我国随着配套基础建设的完善,技术、资金的积累,各行各业对采用图像和机器视觉技术的工业自动化、智能化需求开始广泛出现,国内有关大中专院校、研究所和企业近两年在图像和机器视觉技术领域进行了积极思索和大胆的尝试,逐步开始了工业现场和其它领域的应用。
(1)工业中的应用
虽然机器视觉技术从20世纪80年代才开始起步,但由于其突出的优点,在各种工业领域被广泛应用,特别是近几年发展十分迅速,国内外的成果也是层出不穷。
在国外,机器视觉技术广泛应用于机器零部件的装配、非接触测量、产品质量检测、在线过程控制、数控机床加工、过程监控等领域。英国ROVER汽车公司800系列汽车车身轮廓尺寸精度的100%在线检测,是机器视觉系统用于工业检测中的一个较为典型的例子,该系统由62个测量单元组成,每个测量单元包括一台激光器和一个CCD摄像机,用以检测车身外壳上288个测量点。汽车车身置于测量框架下,通过软件校准车身的精确位置。测量单元的校准将会影响检测精度,因而受到特别重视。每个激光器/摄像机单元均在离线状态下经过校准。同时还有一个在离线状态下用三坐标测量机校准过的校准装置,可对摄像顶进行在线校准。检测系统以每40秒检测一个车身的速度,检测三种类型的车身。系统将检测结果与人、从CAD模型中撮出来的合格尺寸相比较,测量精度为±0。1mm。ROVER的质量检测人员用该系统来判别关键部分的尺寸一致性,如车身整体外型、门、玻璃窗口等。实践证明,该系统是成功的,并将用于ROVER公司其它系列汽车的车身检测。
机器视觉在国内的应用主要集中于检测与定位等几个方面,这样的工业产品占据了中国市场的绝大部分。机器视觉在工业检测中的应用最为常见的是对各种机械零件的几何尺寸进行测量,在半导体及电子行业,国内高等院校和科研单位也研究出基于机器视觉的管脚尺寸自动检测装置。此外,机器视觉还被用于对于如刀具等工业设备的检测和数控机床的加工。在很多工业领域存在着高精度定位的问题,如钻床数控系统钻头定位、金属板材数控加工轨迹坐标定位等。目前机器视觉技术由于其高精度的优点在这方面得到广泛的应用。华中科技大学在金属板材数控加工中利用机器视觉技术对加工轨迹坐标定位。提出一种基于机器视觉的非接触式加工轨迹坐标定位方法,完成了金属板材数字化成形中支撑模型的非接触式高精度快速定位。湖南大学进行了钻头视觉定位研究,在视觉定位中采用间接定位方式,间接实现钻头刃磨初始状态的定位。中国计量学院等单位进行了基于机器视觉的PCB数控钻机定位研究。大量的实践证明采用机器视觉系统进行定位并且综合运用数控伺服传动技术以及各种先进控制技术能够有效实现精确定位。利用机器视觉系统节约了大量的人力和物力,降低了产品生产成本。
(2)农业中的应用
计算机视觉技术在农业上的应用研究,起始于20世纪70年代末期,主要应用于植物种类的鉴别、农产品品质检测与分级等。随着计算机软硬件技术、图形图像处理技术的迅猛发展,它在农业上的应用研究有了较大的突破,在农业领域的生产前、生产中、收获时和产后的各个环节中,均可以利用计算机视觉技术来实现这些农业生产的视觉化。计算机视觉在产前的应用主要是检验种子质量;在产中的应用包括田间杂草识别、植物生长信息的监测、病虫害的监视和营养胁迫诊断等方面;在农作物收获时的应用主要体现在农业机器人的研制与开发上;在产后的应用包括水果分级和农产品的加工等。在农田作业机械上,机器视觉技术被不断的开发和应用。农药的粗放式喷洒正是农业生产中效率最低、污染最严重的环节。利用机器视觉技术可以实现农药的精量喷洒,近年来,机器视觉技术在播种机械方面的应用主要是检测播种质量;在自动收获机等农田自动作业机械上,更需要依靠机器视觉系统来确定作物行与机械的相对位置,以控制自动作业机械在作物行间自动行进,
机器视觉技术在农业生产上的应用可提高生产的自动化水平,解放劳动力,具有良好的应用前景。同时还应看到,由于农业对象的特点,机器视觉理论和技术的局限性以及硬件条件的限制,机器视觉技术在农业生产的应用距离实用和普及还有相当长的距离。相信随着相关技术的发展,很多问题会得到好的解决,机器视觉技术在农业生产中的应用会极大地加快农业现代化的进程。
(3)医学上的应用
随着药品和医疗器械安全性问题重要性的不断提升,越来越多的生产厂商将机器视觉技术引入实际生产中来,以达到提高生产效率,加强产品品质保障的目的。同样,在医疗系统中机器视觉也得到了越来越多的应用。
机器视觉科技医药领域的应用主要分为医学与药物两部分。机器视觉技术在医学疾病诊断方面的应用主要体现在两个方面:一是对(X射线成像、显微图片、B超、CT、MRI)图像增强、标记、渲染处理,主要利用数字图像处理技术、信息融合技术对X射线透视图、核磁共振图像、CT图像进行适当叠加,然后进行综合分析协助医生诊断;二是利用专家知识和3D重构对物体三维信息与运动参数进行分析并给出形象准确的解释,如诊断与手术等。机器视觉技术的应用不仅节省了人力,而且大大提高了准确率和效率。在药物方面,机器视觉系统对药用瓶的缺陷检测,也包括了药用玻璃瓶范畴,也就是说机器视觉也涉及到了医药领域,其主要检测包括尺寸检测、瓶身外观缺陷检测、瓶肩部缺陷检测、瓶口检测等。除此之外,对药剂杂质的检测、对医学用具质量的检测、对药物外包装泄露的检测等等都在保障着药物的质量安全,保障着人们的生命健康。
(4)交通领域的应用
随着计算机的普及和相关软件的不断更新升级,机器视觉技术在交通领域所发挥的作用愈为重要。机器视觉技术在交通领域的应用范围较广,主要包括视频检测系统、智能车辆的安全保障系统、车牌识别和交通指挥等。
视觉技术应用于视频检测时,视频检测系统的目标就是用数字图像处理和计算机视觉技术,通过分析交通图像序列来对车辆、行人等交通目标的运动进行检测、定位、识别和跟踪,
并对目标的交通行为进行分析、理解和判断,从而完成各种交通流数据的采集、交通事件的检测,并尽快进行相应处理。视频的交通事件和参数检测系统有高度的网络化和智能化,可实现远程监控和设置。视觉技术应用于智能车辆安全保障系统,主要用于路径识别与跟踪、障碍物识别、驾驶员状态监测、驾驶员视觉增强等。德国UBM大学Dick-manns教授领导的智能车辆研究小组一直致力于动态机器视觉领域的研究,研制的EMS-Vision视觉可较好地模拟人眼功能。车牌识别技术(VLPR)是计算机视觉和模式识别技术在现代智能交通系统中的一项重要研究课题,是实现交通管理智能化的重要环节。随着图像处理技术的日趋成熟,更多算法的融入综合,使得车牌识别技术逐渐成熟。单一算法很难达到良好的识别效果,只有多种方法结合,才能实现车牌识别的高效性和准确性。过去的10多年里,有些国家已经成功开发了一些基于视觉的道路识别和跟踪系统。其中,具有代表性的系统有:LOIS系统、GOLD系统、RALPH系统、SCARF系统和ALVINN系统等。
机器视觉技术在交通各领域都发挥着越来越重要的不可替代的作用。在取得较大成绩的同时仍有不足。其一应尽快开发出具有高性价比的实用化的激光距离成像系统,能够获取高质量的原始图片至关重要;其二,处理各种交通事件的及时性决定了所有的图像处理的速度应尽可能的快,目前的各种算法都各有优劣,如何能在最短的时间内完成图像的识别工作成为我们下一步要努力的方向。
3.发展趋势
在机器视觉赖以普及发展的诸多因素中,有技术层面的,也有商业层面的,但制造业的需求是决定性的。制造业的发展,带来了对机器视觉需求的提升;也决定了机器视觉将由过去单纯的采集、分析、传递数据,判断动作,逐渐朝着开放性的方向发展,这一趋势也预示着机器视觉将与自动化更进一步的融合。未来,中国机器视觉发展主要表现为以下一些特性:
(l)随着产业化的发展对机器视觉的需求将呈上升趋势。
(2)统一开放的标准是机器视觉发展的原动力。
(3)基于嵌入式的产品将取代板卡产品。
(4)标准化一体化解决方案是机器视觉发展的必经之路。
(5)机器视觉系统价格持续下降、功能逐渐增多。
4.结语
机器视觉技术经过20年的发展,已成为一门新兴的综合技术,在社会诸多领域得到广泛应用。大大提高了装备的智能化、自动化水平,提高了装备的使用效率、可靠性等性能。随着新技术、新理论在机器视觉系统中的应用,机器视觉将在国民经济的各个领域发挥更大的作用。
参考文献
[1]李福建,张元培.机器视觉系统组成研究[J].自动化博览,2004(2):61-63.
[2]范祥,卢道华,王佳.机器视觉在工业领域中的研究应用[J].现代制造工程,2007(6):129-133.
[3]张萍,朱政红.机器视觉技术及其在机械制造自动化中的应用[J].合肥工业大学学报(自然科学版),2007,30(10):1292-1295.
[4]马彦平.计算机视觉技术在农业生产中的应用与展望[J].中国农业资源与区划,2009,30(4):21-27.
[5]饶秀勤.基于机器视觉的水果品质实时检测与分级生产线的关键技术研究[博士学位论文].杭州:浙江大学,2007.
[6]冯新宇,庞艳辉.车牌识别技术实现方法初探[J].交通科技与经济,200712:50-511.
[7]徐琨,贺昱曜,王夏黎.基于背景模型的运动车辆检测算法究[J].微计算机信息,2007,4-1:120-1211.
关键词:计算机视觉;课程创新;教学改革
中图分类号:G642.0文献标志码:A文章编号:1674-9324(2016)20-0118-02
计算机视觉课程是人工智能学科的分支学科,对互联网技术的发展有着重要的推进作用。随着时代的飞速变迁,越来越多的学生对这一领域产生了浓厚的兴趣,计算机视觉课程在信息专业中也开始占据重要的地位。如何让学生对这门课程保持长久的兴趣,如何培养学生的专业能力和实践能力,是当前高校应该考虑的问题。经过近几年的教学实践后,很多高校已经逐步确定了通过实际应用培养学生兴趣的教学方法,在满足学生对计算机视觉应用需求的同时,加深了学生对理论知识的理解,这已经成为了当前高校计算机视觉课程教学的重要模式。
一、计算机视觉课程的特点
近年来,随着计算机网络的飞速发展,计算机视觉的应用也越来越广泛,成为了信息相关专业学生的一门必修课。计算机视觉课程涉及众多领域,包括人工智能与模式识别、应用数学等,其覆盖范围广,综合性较强。具体来说,计算机视觉课程有以下几个特点:一是内容广泛,理论抽象。计算机视觉是一门新技术,随着时代的变迁,互联网新技术的更新日新月异,这就使得课程内容的更新过快,内容广泛,教师很难在第一时间向学生输送所有的课程知识。二是计算机视觉课程涉及多个学科领域,并且所涉及的领域知识内容复杂,表达抽象,这对学生的学习来说是一个较大的障碍。三是实践性强。计算机视觉课程的知识内容来源于各种专业不同的领域,操作性极强,学生只有在具有一定的工程项目综合能力后,才能进行计算机视觉应用和操作。
二、计算机视觉与计算机图形学、数字图像处理之间的联系和区别
1.计算机视觉与计算机图形学的联系与区别。计算机视觉一般输入的都是图像或图像序列,其输入资料主要来自usb摄像头或是相机。经过处理后,计算机视觉输出的是对图像序列和图像对应的对真实世界的一种理解,在这一方面,计算机视觉有识别车牌、人脸的作用。而计算机图形学则是一种对虚拟场景的描述。它一般是由多个多边性数组组成,每个多边性有三个顶点,输出的是二维像素数组。在增强现实的应用中,人们不仅需要用计算机视觉来提高对物体识别和姿态获取的效率,还需要用到计算机图形学对虚拟三维物体的叠加方法。
2.计算机视觉与数字图像处理的联系和区别。首先,计算机视觉与数字图像处理之间的联系在于数字图像处理是计算机视觉处理的基础,而计算机视觉的研究成果也可以作为数字处理的素材。其次,计算机视觉与数字图像处理之间的区别在于图形是一种纯数字化、矢量的单位,而图像则不仅包括图形,有时还包括来自现实世界的信号,并且图形的处理不是一种简单的堆积,计算机视觉的处理要从图像中找到一些统计数据和信息,并做进一步的数据分析。
三、高校计算机视觉课程教学的创新策略
1.以工程应用为导向的课程内容。鉴于学习本课程的学生在毕业之后多数会进入相关工程企业或者研究院工作,因此,在对学生进行培养时,高校一方面要考虑到学生的知识接受度,另一方面要设置以工程应用为导向的课程内容,帮助学生更好的进入企业或研究院开展工作。高校在进行计算机视觉课程教学创新时,首先要创新课程教材,摒弃以往枯燥的理论书籍,多选取一些实践性和应用性强的教材。考虑到国内教材的滞后性和学生基础的薄弱性,高校应该选择以下两本书作为学生的专用教材:一本是我国著名教授贾云得编纂的《机器学习》,这部教材深刻体现了时展的教学要求,书中不仅详细讲述了计算机视觉中的一些基本知识,包括计算机视觉的基本概念、算法及其应用,还有一些经典的数字图像处理方法和视觉应用分析,对学生了解基础知识和实践内容有着重要的意义;另外一本是国内外十分推崇的计算机视觉著作,它是美国教授RichardSzeliski教授的作品。该书在2010年出版,获得了众多业界人士的好评。RichardSzeliski教授是华盛顿大学的兼职教授,也是微软研究院交互视觉与多媒体的主任,他对计算机视觉的发展和未来走向十分清楚,也深刻了解产业界和大学需要什么样的计算机视觉课程教材。因此,这本教材面向应用,与当今最新的科技成果紧密相连,综合论述了计算机视觉在各个领域的发展,展示了计算机视觉的最新研究成果和未来的发展趋势。此外,本书中还有详细的国外研究案例和更加深入的应用案例,适合学生开展探究性学习。两本教材都是遵循以工程应用为导向的原则,对学生开放性思维的培养有着重要的意义。
2.面向科技最新成果的课程定位。计算机视觉是一门新技术,科技创新是其发展的原动力,因此,高校在进行课程安排时,应该将当今计算机视觉领域的重要的科技成果作为计算机课程的基本教学内容。要想以科技最新成果定位计算机视觉课程,高校要做到以下两个方面:(1)选取涵盖最新成果的教材。考虑到不同学生的数字图像处理基础不一的问题,学校可以在课程中补充一些有关数字图像处理的基础内容。在选择教材内容时,计算机视觉课程的内容应该包括数字图像处理、视觉学习和模式识别这三大部分。数字图像处理是视觉课程的基础内容,主要向学生介绍数字图像处理和计算机视觉所涉及的一些基础知识,包括图像的分割和检测、图像滤波的处理等。数字图像处理是整个计算机课程学习的重要基础内容,其课时可占总课时的二分之一。其次,视觉部分是近几年来计算机视觉的最新科技成果,内容主要包括摄像机的几何设定和计算机摄影机的序列处理等。作为最前沿的科技领域,视觉部分将会是该课程后期的重点内容,与实践作业紧密结合。而模式识别则更多的是新技术的一种工程应用,学生会更多的涉及到实践操作,更好的培养学生的实践能力。(2)强化学生自学和调研能力。课程调研和实践是信息专业学生强化能力的重要方法之一,高校可以在课程项目中引入新技术的探究,在使课程在具有基础性、研究性的同时,具有一定的前沿性,还能让学生在第一时间了解到最新的科技成果和互联网应用技术。在课程调研和实践中,高校必须要强化学生的自学和调研能力,在调研时给每一个小组安排一位高年级研究生作为指导,每组学生独立完成任务,高年级研究生只做引导和辅助的作用。学生在自我设置调研程序,查找资料,理解和熟悉相关程序的时候,能够更加掌握最新科技成果的内容,同时还提高了学生的自学能力和团队协作能力。
3.工程实践化的教学形式。工程项目综合能力是信息专业的学生必须具备的素质之一,因此在计算机视觉课程的教学过程中,培养学生的工程实践能力是教学目标之一。高校可以采取以下两种方法:(1)选取适当的工程实例。对于信息专业的学生而言,计算机视觉课程各个独立的算法和方法较多,彼此没有过多的联系。这对学生来说过于抽象,不易理解,因此教师不应当仅仅限于知识的传授,还应该选取一些适当的工程实例,将知识体系串联在一起,加深学会对教学内容的理解,从而达到良好的教学效果。例如,在教学过程中,教师可以着重介绍手机制造的例子。手机是现在学生十分熟悉的产品,用手机举例更加贴近学生的生活,教师可以详细介绍手机键盘和主板的制造过程,并在这一过程中将所学的算法和理论融合进去,加深学生对知识的理解。其次,教师在手机讲解时,还可以引导学生思考类似的产品制造,从而引出数码相机的制造原理,和学生一起探讨其制造算法。这种做法不仅可以帮助学生学习,还可以让学生拓宽思路,发散思维,不断创新计算机视觉领域。(2)选择合适的实际应用。计算机视觉课程是一门实践性和操作性极强的学科,因此,为了学生更好的学习,教师要将理论工程实践化,选择合适的实际应用来提高学生的实践能力。教师可以安排学生进入手机制造厂房,给学生上一堂别开生面的实践课,详细介绍每个制造流程,并向学生不断抛出与课程有关的问题,引发学生的思考,比如选择什么样的模板匹配法可以更为简单。学生在不断的解答和提问中,对学科知识的了解也会逐步加深。其次,高校可以建立专门的实训基地,学生可以在基地里实践操作,将理论转化为实物,亲自尝试做出模型,这种做法可以极大地提高学生的实践能力,使学生更快的将理论转化为实际。
四、结语
在新形势下,高校应不断创新计算机视觉课程的教学模式,并以此展开教学活动,培养学生的实践能力和创新精神。将工程应用和科技最新成果结合的教学模式,有利于解决理论和实践相脱节的问题,在增强学生学习兴趣、提高学生独立分析能力的同时,还使学生接触了国际最新的研究成果,拓宽了学生的思路,这对学生未来的发展有着重要的意义。
参考文献:
[1]郭小勤,曹广忠.计算机视觉课程的CDIO教学改革实践[J].理工高教研究,2010,(05).
[2]伦向敏,侯一民.高校《计算机视觉》课程辅助教学系统的研究[J].教育教学论坛,2012,(18).
[3]陈芳林,刘亚东,沈辉.在《计算机视觉》课程中引入研讨式教学模式[J].当地教育理论和实践,2013,(07).
[4]杨晨.视觉传达设计专业插画设计课程创新与实践人才培养机制探究[J].艺术科技,2015,(05).
[5]蒋辰.基于数字媒体环境的视觉传达设计专业综合实验课程改革探证[J].文艺生活:中旬刊,2015,(07).
[6]张胜利.视觉传达设计专业中色彩风景写生课程多元立体化教学模式的构建[J].美术教育研究,2015,(08).
关键词:计算机视觉;快速开发;框架;模块化;模块耦合;底层剥离
中图分类号:TP311文献标识码:A文章编号:1009-3044(2012)29-7084-04
在视觉分析实际应用项目中,如何通过建立计算机视觉分析快速开发框架,搭建一个分工明确,快捷有效的图像学应用处理平台,提高开发效率,缩短开发时间,已成为项目开发人员关注的重点内容之一。本框架从项目应用和实际需求出发,将计算机视觉技术的核心算法从底层研究工作中剥离,可极大的缩短开发时间,提高开发效率。
在本框架下,开发人员可各司其职,分工、构成和职能划分明确,框架开发人员只专注于框架接口的定义;算法开发人员只专注于图像处理与识别等算法的开发;上层应用开发人员只负责抽取出一般的处理流程,专注于项目的具体实现和功能模块的组合应用。
1研究与应用
1.1背景
计算机视觉是用摄像机和电脑代替人眼对目标进行识别、跟踪和测量的机器视觉。系统将获取的视频或图像资料,通过计算机处理成为更适合人眼观察或传送给仪器检测的图像,其中包括图像处理、模式识别或图像识别、景物分析、图像理解等相关内容,它们之间既有差别,又有相互重叠。
在计算机视觉分析技术中,对于一些复杂的问题,往往不是某单一学科能够解决的,它需要一系列相关技术的支持。例如:对航道中船舶的识别,获取的视频流往往要经过平滑、去噪等图像处理操作后,便于下一步运用基于直方图分类器的图像识别算法来区分船舶和水面,通过图像分割技术来提取检测目标。而这些方案的实现中,同一个问题的解决又往往需要有一系列的算法来支持。还是以船舶识别为例,图像平滑有领域平均、低通滤波等算法;图像去噪有各种滤波器算法;基于直方图的分类器也存在决策树、贝叶斯、SVM等等算法。虽然上述的算法本身没有优劣之分,但在特定的环境下一定会有某个最佳算法。
因此,在实际应用项目中如何找出其最优路径,除了需要开发者拥有深厚的图像学功底,更需要的是通过大量的对比实验来找出该最优路径的解决方案。即便如此,也只能解决特定环境下的计算机视觉需求,换个应用场景,上述步骤又需要重新进行,此类过程的重复,既增加了开发成本,又延长了开发时间。
本框架从工程化的角度出发,在不同项目中的计算机视觉软件开发中,研究如何提高开发结果的复用性,尽量降低上述各条件间的相互依赖关系,将视觉技术的核心算法从底层研究中剥离,达到缩短开发时间,提高开发效率的目的。
1.2研究目标
1)框架系统的扁平化、模块化;
2)完成处理过程的任意组合,使图像处理模块单一化;
3)理行为在处理模块内部完成,处理结果可通过接口方式进行输出;
4)处理模块间的数据流动定义在框架之中,框架负责配置数据流;
5)置好的数据流,通过指定图像处理模块实现对物体的识别、行为的识别。
1.3.5框架的效果演示
从右侧功能区中选取两个输入模块:MediaOpen00和MediaOpen01,分别打开视频文件“.\公司监控视频.avi”和图片“.\Lena.jpg”,任意添加一些图像处理模块或者图像识别模块,这里我们选取了行人检测算法、基本全局阈值二值算法、人脸检测算法、轮廓检测算法,加入输出展示模块用于显示处理结果。最后我们用曲线将模块间的输入输出点连起来,完成数据流向的配置过程。其中一个输出点可以连接多个输入点,但一个输入点只能接入一个输出点。
2结论
随着计算机视觉技术发展的日新月异,算法的更新和积累将会越来越多。计算机视觉快速开发框架从实际应用工程的角度出发,在不同项目计算机视觉软件的开发过程中,将视觉技术的核心算法从底层研究中剥离,使视觉分析应用项目中的框架开发人员专注于框架接口定义的开发,而项目中的算法、上层应用等开发人员各司其职,分工明确,不但提高了开发结果的复用性,同时,也降低了项目开发中各条件间的相互依赖关系,缩短了开发时间,提高了开发效率。
参考文献:
[1]Garybradski,AdrianKaebler.《LearningOpenCV》[M].O’ReillyMediaInc,2008.
[2]张广军.机器视觉[M].北京:科学出版社,2005.
[3]张少辉,沈晓蓉,范耀祖.一种基于图像特征点提取及匹配的方法[J].北京航空航天大学学报,2008,34(5).
[4]刘立,彭复员,赵坤,万亚平.采用简化SIFT算法实现快速图像匹配[J].红外与激光工程,2008,37(1).
[5]戴斌,方宇强,孙振平,王亮.基于光流技术的运动目标检测和跟踪方法研究[D].国防科学技术大学机电工程与自动化学院.
[6]陈胜勇,刘盛.基于OpenCV的计算机视觉技术实现[M].科学出版社.
【关键词】网页设计;计算机图像处理技术;应用解析
在计算机技术和网络技术飞速发展的背景下,网页设计呈现出蓬勃发展的趋势。网页设计的最终目标是借助于文本、图形、图像、声音、视频等多种媒体表现形式,将所要表达的思想、内容展示给网页浏览者。在激烈的市场竞争中,商业性的网页越来越多,对于网页设计的要求也越来越高。网页既要客观呈现事物,又要精彩美观。图像在网页设计中起着至关重要的作用。在网页设计中应用计算机图像处理技术,可以提高网页设计的自身效果,也是市场需求的必然选择。
1网页设计中的使用图像的意义
在网页设计中引入适当的图像,可以增强网页的艺术感染力和视觉冲击力,更好的传递出网页设计的主题思想,吸引浏览者的注意,也可以体现出网页的设计风格。总的来说,图像具有信息传达和视觉吸引的功能,在网页设计中起着非常重要的作用[1]。
1.1信息传达功能
图像本身就是一种传达信息的重要手段。在文字叙述的区域,引入适当的图片,能够更快、更形象、更直观的突出文字的主题,传递出网页的主要内容。图像与文字相比更容易引起浏览者的关注。采用文字和图像结合的方式,可以帮助浏览者快速找到所需要的信息。图像能够美化网页,将相关的内容、理念等信息直观、高效、形象的传达给浏览者。
1.2视觉吸引功能
在网页设计中,包含许多的媒体类型,比如文字、图像、声音和视频等。只有文字的版面会显得过于单调。图像更容易吸引浏览者的目光,增强网页的视觉吸引效果。图像与文字的有机结合,对网页设计的协调性和美观性非常重要,可以刺激人的大脑,提高浏览者阅读的兴趣,从而达到网页设计的目的。
2计算机图像处理技术阐述
计算机图像处理技术起源于20世纪末,它是以图像为基础,利用计算机技术对图像进行加工和处理的。计算机图像处理技术结合了多媒体技术、数字化技术等,主要包括图像的平移、旋转、裁剪、去噪等前期预处理技术,图像的增强、复原、分割、重建等中期处理技术以及识别、分析、编码、压缩等图像后期处理技术。早期,计算机图像处理技术主要应用于航天事业,但随着计算机和网络技术的迅速发展,计算机图像处理技术被广泛的应用到网页设计中,得到了众多网页设计者的认可。利用计算机图像处理软件可以对图像放大、缩小、合成、色彩调整、创意设计和制作特效等,使图像与网页的主题相一致,进一步达到美化网页的功能。计算机图像处理技术在快速的发展进步,功能也在不断的完善。如今计算机图像处理技术在网页设计中具有非常重要的地位。
3计算机图像处理技术在网页设计中的应用
3.1网页设计中常用的图像格式和选择技巧
计算机图像格式种类繁多,选择适合的图片格式可以提高网页设计的效果、节约下载时间以及较少服务器的负担。在网页设计中应用较多的图片格式有GIF格式、JPEG格式和PNG格式[2]。1)GIF格式。GIF格式英文名称为GraphicsInterchangeFor-mat,可以翻译为图形交换格式。GIF格式的图像分为静态和动态两种类型,采用无损压缩存储方式,但是限制了色彩的表现能力,只支持256色以内的图像。在不影响图像质量的情况下,可以生成很小的文件。它支持透明色,图像可以浮现在背景上面,也可以制作动画,这是它最突出的一个特点。GIF文件的特点顺应了互联网的需求,几乎所有的浏览器都支持这种格式,于是它成了互联网上最流行的图像格式。2)JPEG格式。JPEG格式是一种支持8位和24位色彩的压缩位图格式,是一种有损压缩,文件较小。JPEG的压缩技术十分先进,它具有调节图像质量的功能,可以设置压缩比例,压缩比越大,图像品质就越低,压缩比越小,图像品质就越好,同时,色彩的信息保留非常好。JPEG非常适合储存色彩丰富的图片,例如照片等,图片有轻微失真肉眼也很难辨别出来,但是它不适合存储线条、图标或文字等边缘非常清晰的图片,特别适合在网页和网络中使用。3)PNG格式。PNG格式英文名称为PortableNetworkGraphicFormat具有文件小、无损压缩、支持透明效果的特点。PNG格式存储灰度图像时,灰度图像的深度可多到16位,存储彩色图像时,彩色图像的深度可多到48位,还可存储多到16位的α通道数据。虽然PNG采用的是无损压缩,但是PNG格式图片还是会有不同程度的失真。PNG8最多只能索引256种颜色,如果图像的颜色较多的话不能真实还原;PNG24则最多可以保存1600多万种颜色,基本能够真实还原我们肉眼所见的所有颜色。PNG格式广泛应用于JAVA程序、网页或S60程序中。设计师需要根据实际需求来选择不同的图像格式。存储图像时选择JPG还是PNG的主要依据是图像上的色彩层次和颜色数量。当图像的色彩丰富,并且边缘线条没有锐利反差时,选择JPEG格式可以得到最好的输出结果;当图像是有明显边缘的线条图、没有太多色彩或者需要制作透明背景时,GIF格式是最好的选择;而PNG-24格式虽然看起来非常完美,但是需要考虑浏览器的支持问题,虽然现在大多数的浏览器都支持它,可是IE6是不支持透明的PNG图像的。现在IE6或更早的版本使用者不会太多,但是设计师也要将这个因素考虑在内的。另外页面结构的基本视觉元素,如Banner、商品图片等对质量要求不是特别高的,可以使用JPG进行存储降低文件大小。
3.2网页设计中常见的图像形式
图像的形式多种多样,网页设计中应用较多的有摄影、截图、简单图形、连接图片等。为了让网页内容丰富且有艺术感染力,设计师需要将多种图像形式应用到设计中。摄影是网页设计中图像素材的重要来源,摄影配图是最简单,也是最常见的配图方式。摄影图像属于写实性的,有较强的直观感,可以将浏览者带进特定的情境中。摄影图像经过计算机图像处理技术加工处理后,结合相应的文字描述,很容易被人们所接受和喜爱。另一种应用较多的是插图。在网页中,插图经常用在描述性的文字的四周,既能增强直观感,又能起到延伸文字和拓展信息的功能。插图可以表现写实性的图片,也可以表现抽象类的图片,具体根据实际需要设计。此外,还可以在网页中插入一些有特色的图形符号等图像形式,以增强网页的艺术魅力和视觉冲击力。
3.3网页设计中图像的角色和职责
在网页中图像有多种角色,比如网站的LOGO、背景图、网页关键图和导航等,角色不同,职责自然也不同。下面对其中较为重要的3种角色类型做介绍:1)网站的LOGO。LOGO是网站的标志,也是网站的名片。它是互联网络上各个网站之间链接的图形标志,是网站提供给浏览者进入网站的一个门户。图形的LOGO比文字链接更吸引人的眼球。从某种程度来讲,LOGO决定着一个网站的点击率,可以说是一个网站的“点睛”之处。对于一个高品质的网站,一个好的LOGO能够反映网站的某些信息,比如网站类型、内容和风格等。提起LOGO,我们很容易想到一些熟悉的网站,比如百度、搜狐、新浪等,这就是品牌的效应。LOGO大多是网页设计师切合网站的理念、文化特色精心设计的,兼备功能性和艺术性,给浏览者带来艺术美感的视觉享受和高度的信赖感。2)网页的背景图。近年来,一些网站使用背景图像作为背景,给浏览者一种视觉冲击感。背景是网站的主要组成部分。对于一个网站来说,背景图一定要简单,效果不能太过强烈,只要提供一点质感就可以,否则就抢了页面内容的风头。如果背景图的设计与网站融为一体,并且富有特色,色彩视觉效果处理得当,就会对浏览者产生很大的吸引力,浏览者有兴趣进一步浏览网站。那么这个网站在同行业中便会出类拔萃,在网络营销上也会占据优势。3)网页的关键图。网页上通常都有一些很醒目的图像,用来吸引浏览者的注意力。在网页中插入图像的主要目的是用来宣传一些主题,一般在页面最显眼的位置,不需要过多的文字描述信息,浏览者看到图像就能知晓其所表达的含义,表达内容非常直观,视觉冲击感非常强。
3.4网页设计中图像的处理技巧
3.4.1图像的尺寸网页要达到理想的效果,图像的合理布局就显得尤为重要。设计师就需要灵活运用计算机图像处理技术,熟练掌握图像处理技巧[3]。图像的尺寸直接影响网页的直观效果。尺寸大的图像包含的内容丰富,能够更好的表达出设计意图。尺寸较小的图像,一般个性感强,具有衬托主题的作用。使用矢量创作工具制作的图像通常保存为PNG格式,尺寸需要在矢量绘图工具中确定,转换为位图后一般不再对其进行缩放操作。特别需要注意的是,Fireworks创建的PNG文件中包含图层等一些可编辑信息,其中直线、文字、形状都属于矢量图。将此类图像应用于网页设计中应先进行输出以便压缩文件大小,而输出的PNG图像会丢掉可编辑信息而转为位图。因此,图像尺寸的调节应在输出操作之前完成。对于现成的位图和照片,不要使用HTML语言中的height和width属性来改变图像尺寸,这样可能会使图像严重失真。一般使用Photoshop等软件调好尺寸后再插入到网页中。通常,放入网页中的图片应控制到一个比较小的尺寸。如果与文字混排,宽度最好在300px左右。即便单独出现,宽度也最好在600px以下。至于高度,以不超过一屏为宜。
3.4.2图像的外形不同类型的图像有不同的特色。比如,我们看到矩形的图像,就会有一种中规中矩的感觉;圆形图像给我们一种亲切温暖的感觉;不规则的图像会呈现出动感、有活力的感觉;菱形图像能够增加网页的美感。因此,我们需要将合适的图像应用到相应的网页设计中。
4结束语
综上所述,网页设计是一项涉及领域较为广泛的工作,要求网页设计师具备较高的专业技能。计算机图像处理技术在网页设计中展现出巨大的优势,将其应用到网页设计中,大大的提升了网页设计的质量与效果。在不久的将来,随着计算机技术的发展,计算机图像处理技术一定会取得更大的进步,网页设计也会更加完善、更加精彩。
参考文献
[1]蒋丽君.浅谈网页设计中计算机图像处理技术应用[J].商品与质量:消费研究,2015(1):71.
[2]仇乐.网页设计中计算机图像处理技术应用解析[J].煤炭技术,2013,32(3):204-205.
关键词:单片机;视觉系统;优化
前言
在智能车车速不断提高的背景之下,赛车队的专用车型对其视觉系统的要求越来越高,循迹小车上要安装重要的传感器,这样的传感器可以是目前广泛应用于众多领域的摄像头。在智能汽车上,单片机能对数字信号进行及时有效的采集。该视觉系统设计的重点是要使设计能识别道路的路径。现阶段的汽车设计中,图像采集与处理技术已经被广泛应用,只有采用高速的处理器才能建立很好的图像控制系统,但是这样的设计不符合智能车设计所规定的使用平台和设计技术。
1.主要芯片
在该视觉系统的设计中,采用的主要芯片是MC9S12DG128,它属于16位的单片机,主要采用了增强型的CPU,其内部的总线时钟率较高,单片机内的资源丰富,具有不同类型的转换器等[1]。有具体的进行背景调试的模式,可以在任何情况下进行系统完整的背景调试,其工作的效率也会有一个很大的提高。
在具体的系统设计中,主要的芯片除了MC9S12DG128单片机,还有图像传感器。选用的图像传感器是由美国某家著名的汽车设计公司生产的,这种自带图像敏感阵列和转换元件,而且能提供不同格式的图像传感器具有较强的图像输出速度和分辨率,能自动增加图像的效益,自动进行曝光,调节白平衡,通过具体的总线设置开发系统的图像输出功能。
视觉系统中的存储器会按照一定的顺序对图像进行科学合理的读取,它允许接口电路简单、读取速度较快的动作同时进行。该系统采用的存储器具有高速度、低能耗、容量大的特点[2],应用在具体的视觉设计中具有非常好的实际意义。
2.系统硬件结构设计
MC9S12DG128单片机的频率相对较低,而一般的摄像头的图像输出速度较高,其输出速率要达到30万像素,每一个像素信号的保持时间要有一定的时间限制,但是此种单片机的时间较短。
将图像传感器与单片机之间的数据缓存用一种简单的芯片来完成。在设计符合逻辑的电路的基础上,芯片中可以容纳大量的有传感器接受的图像数据,菜单可以从芯片中读取相应的数据[3]。图像采集中的系统的架构框架图如图1所示。
2.1摄像头同步信号分析。摄像头的同步信号英爱按照以下顺序进行分布,摄像头在完成一帧图像时要在两个正向脉冲之间完成;高电平时要在具体的时间限制内完成一行像素的扫描工作。准确的信号需要通过像素的同步信号才能读取一定的数值。高电平时输出的图像数据在两个脉冲之间有一定数量的正脉冲,每个正脉冲器件又有一定数量的不同类型的正脉冲。
2.2数字图像信号的采集。将图像传感器中输出的图像信号有效的存入存储器中,要通过一定的操作产生符合存储器要求的写时钟脉冲,然后将每一帧的同步信号引入单片机的输入口。当单片机检测到VSYN上跳时,高电平时的像素数据才是有效的,信号产生的下跳,能引导存储器输出图像数据。
3.单片机图像采集系统的优化
图像的有效采集要通过硬件结构可以让单片机来实现,大量数据的运动算能力有限,视觉系统的内部结构也不够完善。对其单片机的图像采集系统采用良好的方法及进行统一的优化,能使单片机更好的发挥其真正的性能,实现一些图像处理和采集工作,提高其工作效率。
3.1减小图像数据量。系统中的传感器具有较强的图像输出功能,在具体的设计研究中,设置其供内部使用的有效寄存器,可以使用特定区域的图像数据设置用户关心的图像信号。这样的情况下,图像的数据量可以大大减少,减少后期的处理难度,提高整个视觉系统的性能。
采用隔像素的方法降低视觉系统中的数据量,在一定的情况下加入计数电路,进行及时的像素采集,可以有效降低图像的数据量,在一定程度上减轻单片机的负担,保证系统图像的可用性。
3.2RFO异步读写图像数据。RFO异步读写系统拥有两套相对独立的读写指向,在两者都进行读写的过程中可以互不干扰。提高图像采集数据的工作效率就必须让图像输出比读写的速度快,最后保障图像的读写工作同时进行操作[4]。在这样的背景指导下,新的一帧图像如果开始被写入存储器后,就开始了单片机的读取数据的动作,在读取的过程中,有效减少单片机的资源浪费,使其获得最大的工作效率。
3.3优化程序算法。基于视觉系统的设计,单片机在一定范围内不能完成较为复杂的图像处理的众多算法。单片机的特性可以指导编写图像处理的算法,避免一些漏洞向的运算,要尽量的简化运算公式,或者采用大约的数字来进行计算,节约一些运算时间。基于图像分割的算法,在具体的视觉系统优化程序算法中确定最小的灰度,将计算的的值控制到最小。
在S12单片机的循迹小车的视觉系统设计中,存储器和单片机的图像处理系统具体的结构相对简单,而且不用花费太大的成本资源,具有很强的复制功能。尽管单片机不是很适合大数据型的图像处理,但是在具体的设计中通过一些优化的手段和方法,将其性能扩展,就可以完成一部分图像处理的工作,保证视觉系统的完整性[5]。将其视觉系统的采集系统设计应用在智能循迹小车上,使用单片机的运行,并配合图像传感器可以实现图像的采集和处理,从而及时的控制小车,使小车的整个运行达到完美的状态。
结语
在对智能汽车各项功能要求越来越多,越来越严格的背景之下,为了提高智能循迹小车的性能,在实际的比赛中取得较好的成绩和效果。在其视觉系统中利用单片机设计其图像采集系统,通过传感器实现对图像的采集的处理,分析主要的芯片功能和其优缺点,从不同的方面有效优化单片机图像采集系统,帮助循迹小车完成视觉系统的的设计,实现智能汽车行业的快速发展。(作者单位:东北林业大学)
参考文献:
[1]郑思敏.基于HCS12单片机的图形处理方案设计[J].现代电子技术,2010,33(4):102-103.
[2]薛涛,邵贝贝.S12单片机BDM调试器使用技巧[J].电子技术应用,2009,35(2):14-16.
[3]刘力.基于视频循迹的智能车软件设计[J].企业技术开发(学术版),2014,(2):28-30.
关键词:机器视觉;应用;图像处理
中图分类号:TP391文献标识码:A文章编号:1009-3044(2007)18-31701-02
MachineVisionTechnologyandApplicationProfiles
CHENFa-dong,ZHANGXiao-fang,ZHAOHuan-yu,ZHANGTao,YUGuo-ying
(HebeiJinniuEnergyCo.,Xingtai054001,China)
Abstract:Thepaperintroducedthemachinevisionsystemstructureandworkingprincipleandthesuperioritiescomparedtohumanvision,theapplicationsofmachinevisionareexpoundedinourindustry,agriculture,medical,robotics,navigation,satelliteremotesensingfields,thefuturedirectionofmachinevisionisstated.
Keywords:Machinevision;Application;ImageProcession
1引言
机器视觉技术是20世纪70年代在遥感图像处理和医学图像处理技术成功应用的基础上逐渐兴起的,并应用于多种领域。在我国,机器视觉仍属新兴行业,但是随着产业化的发展对机器视觉技术的需求必将呈上升趋势。
2机器视觉技术
机器视觉是研究用计算机来模拟生物外显或宏观视觉功能的科学和技术,用图像来创建和恢复现实世界模型,最终用于实际检测、测量和控制,是一门涉及人工智能、神经生物学、心理物理学、计算机科学、图像处理及模式识别等多个领域的交叉学科[1]。
机器视觉系统一般由摄像机、图像采集卡、计算机、光源、光照箱、载物台等组成,如图1所示。
图1机器视觉系统结构示意图
工作原理是:在一定光照条件下,用摄像机把三维场景的被摄取目标图像采集到计算机内部形成原始图像;然后,运用图像处理技术对原始图像进行预处理以改善图像质量,分割图像,提取特征要素,构成对图像的描述;最后,采用模式识别技术进行特征分类,并根据预设条件输出结果。
机器视觉具有与被观测的对象无接触,对被摄物体无损伤,观测过程客观,判别结果可靠性高的特点;同时机器视觉也拓宽了人类视觉范围,在许多人类视觉无法感知的场合,如工业环境下高危险场景的感知、不可见物体感知等等,机器视觉更具优势;而且机器视觉可以快速获取大量信息,而且易于自动处理,也易于实现信息集成,是实现计算机集成制造的基础技术。
2机器视觉技术应用
随着电子技术、计算机软硬件技术、图像处理及与人类视觉相关技术的迅速发展,机器视觉技术在理论和实践上都取得了重大的发展,在我国工业、农业、医学、机器人导航、卫星遥感等领域的应用越来越广泛,下面就机器视觉技术在这些领域的应用概况进行阐述。
2.1工业
在大批量工业生产过程中,生产过程的高度自动化和产品质量的日益提高,要求有更有效、更精确和高速度的检测手段,机器视觉技术能够保证工业现场环境下的可靠性,提高生产自动化程度,大大提高生产效率。因此,在现代自动化生产过程中,机器视觉系统被广泛地用于产品测量、检验、质量控制等领域。
机器视觉在工业中的具体应用主要有:汽车整车尺寸测量,零件边缘及平面尺寸检测,螺纹几何参数检测,带钢表面缺陷检测,电机换向片偏移检测,玻璃制品裂纹检测,烟包包装检测,饮料行业的容器质量检测,半导体集成块封装质量检测,印刷电路板疵病检查,弹性力学照片的应力分析、流体力学图片的阻力和升力分析,邮政信件的自动分拣等。机器视觉可以在一些有毒、放射性环境内识别工件及物体的形状和排列状态[2]。在制药生产线上,机器视觉技术还可以对药品包装进行检测,以确定是否装入正确数量的药粒。
2.2农业
机器视觉技术在农业机械上的研究与应用始于20世纪70年代末期,主要集中于农产品品质检测与分级的自动检测机械的研究[3]。
农产品的生产过程受到自然和人为等复杂因素的影响,产品品质差异很大,机器视觉技术可以检测农产品的大小、形状、颜色、表面裂纹和表面缺陷及损伤。它的优点是:速度快,信息量大,可一次完成多个品质指标的综合检测,还可完成定量指标的测量,精确度高,能够克服人眼的差异和视觉疲劳,实现无损检测。能够检测的农产品有蔬菜、水果、谷物、烟草、茶叶、禽蛋等,其中部分研究已从理论走向实际应用,并取得了较大的经济效益。其中,计算机图像处理技术发挥了主力军作用。此外,人工神经网络等高新技术也开始引入到机器视觉识别与分级中,应用该技术有利于设计制造自动分级流水线,大大提高工作效率。
随着计算机技术及数字图像处理分析理论的成熟,机器视觉技术也逐渐渗透到农作物长势监测、病虫及草害的监测与防治、自动化收获,以及农产品加工、储粮害虫检测等领域。
2.3医学
在医学领域,机器视觉的应用也越来越广泛,主要用于医学辅助诊断。首先采集核磁共振、超声波、激光、X射线、γ射线等对人体检查记录的图像,再利用数字图像处理技术、信息融合技术对这些医学图像进行分析、描述和识别,最后得出相关信息,对辅助医生诊断人体病源大小、形状和异常,并进行有效治疗发挥了重要的作用。
利用机器视觉技术还可对其它医学影像数据进行统计和分析,如利用数字图像的边缘提取与分割技术,自动统计细胞个数,不仅节省人力,还大大提高了准确率和效率。另外,基于CT图像的内部器官的重建,DSA(数字减影)技术等也是机器视觉技术在医学领域的应用实例。
2.4机器人导航
机器人导航包含道路规划、避免碰撞、自适应位置控制和机器人相对于特定目标在三维空间中精确方位定位。在制造业,机器人被广泛地应用于零件的装配和检验,机器视觉应用于机器人使其柔性大大增加,使大批量使用装配、检验机器人成为可能。工业机器人系统是一种基于视觉测量并进行制导和控制的系统,例如机械手在一定范围内抓取和移动工件,摄像机利用动态图像识别与跟踪算法,跟踪被移动工件,始终保持其处于视野的正中位置。相对于室内的工业机器人而言,农业机械的机器视觉导航的工作环境和工作对象更加复杂。
农业机械的自动导航是现代智能农业机械的一个重要组成部分,有着广阔的发展前景,在自动喷洒农药肥料、收割作业、中耕除草、插秧耕作等许多方面有着广泛的用途。在农业机械自动导航系统中,采用机器视觉导航除具有灵活、实时性和导航精度高等优点外,在采集导航信息的同时还能采集有关农作物、病虫害以及农田状况的图像,随着以信息化技术为核心的精细农业的兴起,机器视觉导航必然会有更大的发展空间。
2.5卫星遥感
卫星遥感图像信息量大,数据存在多种干扰和误差,处理和分析的工作量、难度都很大。在卫星遥感系统中,机器视觉技术被用于分析各种遥感图像,进行环境监测、地理测量,根据地形、地貌的图像和图形特征,对地面目标进行自动识别、理解和分类等。具体来说有自动制图,卫星图像与地形图对准,自动测绘地图;对国土资源管理,如森林、水面、土壤的管理等;还可以对环境、火警自动监测。
2.6其它方面
在交通管理系统中,机器视觉技术被用于车辆识别、调度,向交通管理与指挥系统提供相关信息;在闭路电视监控系统中,机器视觉技术被用于增强图像质量,捕捉突发事件,监控复杂场景,鉴别身份,跟踪可疑目标等,它能大幅度地提高监控效率,减少危险事件发生的概率;在航天及军事方面,机器视觉技术被用于卫星照片的自动分析与判读,景物识别,目标检测,识别和定位,目标跟踪,成像精确制导等。
3结束语
综上所述,机器视觉在工业、农业、医学等领域的应用研究得到了广泛开展,但我们应当看到,机器视觉从诞生到今天这短短三十多年时间中,其相关研究、发展和应用还远没有达到成熟的程度。在未来的几年内,随着中国加工制造业的发展,对于机器视觉的需求必将逐渐增多,随着机器视觉产品的增多,技术的提高,国内机器视觉的应用状况也将由初期的低端转向高端。实现实时在线、智能化、高精度检测与控制必将成为我国机器视觉的发展趋势。
参考文献:
[1]刘曙光,刘明远.机器视觉及其应用[J].河北科技大学学报,2000,21(4):11-15.
[2]席斌,王振雷,钱锋.机器视觉工业检测系统的应用与发展[J].控制工程,2006,5(13):220-222.
[3]刘中合等.计算机视觉技术在农业机械中的应用[J].农业装备与车辆工程,2005,12(4):37-39.
【关键词】计算机;多媒体技术;关键性技术
目前,随着多元化科学技术的发展,多媒体技术的广泛应用已经引起了社会的广泛关注,对人们的生活和社会生产产生了非常重要的影响,是促进社会经济发展的重要力量之一。为此,本文围绕计算机技术,对多媒体的内涵和相关的关键技术进行了下列阐述。
1计算机多媒体技术概述
1.1对媒体技术的含义
多媒体技术发展离不开数字化技术的发展,打个简单的比方,对文本文件或者动画文件中的相关元素进行综合处理,对其中的信息进行总结,然后采集并处理这些内容,充分运用多种硬件设施和软件设备建立多种媒体之间的相关联系,然后在此基础上形成人机相互交流系统的一种技术[1]。这种技术就是多媒体技术。在多媒体的辅助下,信息可以在传播的过程中不断得到完善,实现和计算机交互功能的相互连接,促进其作用的充分发挥,使文字、图像在被看见的同时还能后满足听觉的信息需求,对这种新型材料进行制作,这个过程就是多媒体技术[2]。
1.2多媒体技术的特点
专业化是多媒体技术的最大特点。所谓专业化就是多种媒体集中在一起的综合形态,能够同时对两种或者两种以上的媒体信息进行交互的有效载体。数字信号是多媒体技术最基础的运行单位。在这一平台上,可以将文字、声音和图像等信息结合在一起。这也说明,多媒体技术还具有多样性的特点,也正是这种多样性,相互关联的信息才能进行有效的传递,然后利用数字化信息来有效解决数据在传递过程中的失真问题。
2计算机多媒体的关键技术
2.1视频压缩技术
Shannon信息理论是传统压缩编码技术的基础。这一信息理论则是建立在集合论基础之上,然后利用统计概率的相关模型来对信息的来源进行描述。这种压缩编码技术存在一定的局限性,未能对信息接受对象的主观能动性以及事件本身包含的具体内容、重要性、产生的后果等主要因素进行充分考虑。因此,在Shannon信息理论的基础上,压缩编码技术也在不断的发展和完善。数据压缩编码技术按照不同的分类标准,可以被分成很多不同的类型。(1)以照信息来源的统计特点为划分依据,该技术可以分为转换编码、预测编码、小波编码、矢量量化编码和神经网络编码等5种;(2)将数据的视觉性特征作为划分依据,那么该技术可以被分为图像编码和以图像纹理和轮廓为基础的编码等两种;(3)从图像所表达的景物特点来划分,图形编码和以内容为基础的编码是两种最主要的编码方法。其中图像编码的发展经历了两个阶段。第一阶段是以数据统计为基础的,将数据的冗余去除,是一种层次比较低的压缩编码方法。第二阶段则是以内容为基础,然后将其中的冗余去除,鉴别其中的对象和方法,就是我们这里所讨论的压缩编码技术。这是一种高层次的压缩编码方法,既是一种新型的压缩编码方法,也是目前使用最广泛的压缩编码方法。
2.2视频点播技术
采用用户信息交流的方式进行自然进化的过程就是多媒体的交互。多媒体服务涉及的范围非常广泛,其中应用最广泛的就是视频点播技术。网络技术和计算机技术的发展和相互融合是视频点播技术发展的技术。视频点播的主要内容包括计算机技术、通信技术、电视技术等,是一种将上述技术整合为一体的新型技术,充分发挥了视频技术和网络技术的优势,彻底改变了被动收看电视节目的方式,可以根据用户的实际需求收看电视节目,还能够随意播放,人们可以根据自己的意愿来点播自己喜爱的电视节目。同时,视频点播技术中传递方法的运用彻底改变了传统的课堂教学模式,拓宽了教学的模式,影音、广播、语音、发送消息、网络影院、远程教育和点播教学等都可以借助互联网进行传播。视频服务器是该技术必不可少的重要组成部分,是视频系统完成功能和提高性能和质量的关键部分,所以在视频服务系统中是被重点研究的对象。视频服务除了要求保证端到端的播放质量之外,还需要观察系统各方面的性能。在大多数情况下,视频流编码压缩和传递技术、视频流调度技术、IP网与Cable网实现、存储和I/O调度策略、接入控制、流量控制与差错控制、视频服务器体系结构等是视频服务系统中需要重点解决的问题。
2.3多媒体数据库技术
多媒体信息中的非格式化数据所占的比例较大,基于此,我们可以将多媒体数据的特点归纳为三点,即对象的复杂性、数据存储的分散性和时空的同步性。其中关系数据库相对比较简单,但是在多媒体资料的管理的质量依然不高。从目前的实际情况来看,基于对象数据库来管理多媒体资料并不能满足使用的需求,因为基于对象是一个新一代数据库应用,它所需要的是强有力的数据模型的基础良好。这种基于对象的方法适合用来描述非常复杂的对象,结合了封装、继承、对象、多态、类等概念,所以能够对多样对象和它们之间的内部结构之间的相互关联进行清晰地描述。目前,多媒体系统进行研究和开发的主要方向就是要将面向对象程序设计语言和数据库技术的相互结合,但是首先需要解决的问题就是要制定对象的统一标准。
2.4现实虚拟技术
虚拟技术是信息技术行业少有的高新技术之一。该技术是一种集成化的技术,具体内容涉及到人工智能、人机交互技术、计算机图形学、传感技术、网络设计等非常广泛的领域。同时,虚拟技术还可以利用计算机来进行三维画面的合成,让用户获得逼真的听觉、视觉、嗅觉等感官的体验。在虚拟技术的基础上,人们可以借助固定的设备,自然的参与到虚拟世界的体验中。现实虚拟必须通过计算机生茶,其基础必须是视觉、听觉、嗅觉和触觉等具体的感官。在这种情况下,用户需要通过身体四肢的正常活动和虚拟环境交互。除了上述四种技术之外,计算机多媒体的技术还包括流媒体技术和音频技术等,而且随着网络技术和计算机的发展,这些技术也必将在多媒体技术中发挥更重要的作用。
3结语
综上所述,随着计算机技术的不断进步和发展,多媒体技术的发展也不断成熟和完善。为了切实满足人们对现实生活多样化的需求,多媒体技术已经在教学、视频、视频会议、娱乐节目点播、军事等很多行业得到了广泛应用。多媒体技术和视频压缩技术、视频点播技术、多媒体数据库技术、现实虚拟技术、音像技术和通信技术等多种技术的有机结合,极大地促进了信息处理技术的发展。
作者:张萌臧书雯单位:辽东学院
参考文献:
关键词:机器视觉技术;计算机视觉;自动检测;图像信号处理;工业应用
从字面意思理解,机器视觉技术是利用计算机来替代人的视觉,换句话说,也就是利用计算机来代替人的视觉来对现实事物进行三维判定。该项技术是人工智能中一门重要的处于蓬勃发展中的分支学科。机器视觉技术是由计算机、人工智能、神经生物学、图像处理、心理物理学等众多学科相交叉产生的一门新兴学科。该项技术有着速度快、精度高、噪音小、抗扰能力强、使用方便等诸多优势,可以在相对恶劣的条件下进行工作,可以提高企业的生产效率和降低劳动成本。随着科学技术的不断发展,该项技术已经广泛应用于各个行业生产中。
1机器视觉技术的发展现状
1.1光源照明技术
选取的光源和照明方案的效果好坏直接影响机器视觉系统的成功与否。优质的光源和照明方案要尽可能做到突出物体特征、又有极高的对比度、确保整体亮度等。通常情况下选取透射光或反射光。在选择照明设备时要满足几何形状的要求,并要对其使用寿命进行考虑。
1.1.1光学镜头
光学镜头在进行成像时的质量将会对机器视觉技术的使用有着直接的影响。一般情况下,光学镜头有定焦和变焦两类。在相同的档次下,定焦比变焦的成像要更好,所以优先选取变焦镜头。另外,还要考虑焦距、接口等因素。
1.1.2摄像机
在获取图像时通常有主动和被动视觉两类。摄像机是最为常用的被动视觉元件,主要的核心在于电子耦合器。电子耦合器有着质量轻、体积小、成像清晰、寿命长等优势,在机器视觉中有着广泛的应用。
1.1.3图像采集卡
图像采集卡是连接图像采集与处理部分的重要元件。因为在进行图像信号传输时要求传输速度极高,一般的传输接口无法达到需求,这便是需要使用图像采集卡的重要原因。部分高档的图像采集卡拥有DPS处理模块,可以对图像进行一定的提前处理。
1.2信号处理
对已经采集到的信号进行处理,这是机器视觉技术中最为关键的一步。现在多数的较为先进的处理技术已经应用于其中。随着信息技术的高速发展,众多的计算机、微电子和集成电路技术不断进步,为图像处理提供了优质的硬件支持。
1.3执行机构
执行机构是可以使机器视觉系统实现其功能的最后元件。要确保其在进行制作与安装过程中的精度,此外在设计过程中,充分考虑稳定性等。但是由于现在以计算机为基础尚未进行模块化,安装上存在困难,尤其是工业上已经大量使用的PLC接口进行连接时存在问题。
2应用于工业上的机器视觉技术
视觉技术最重要的优势便是可以不与被观测物体直接接触,不会对观测者与被观测对象造成损害,非常安全,这是其他感官所无法替代的。通常来讲,人类肉眼无法观测到的机器视觉是完全可以办到的,也就是可以扩大肉眼的视觉范围。而且机器可以在人类无法适应的环境下进行工作,没有疲劳地进行长时间的工作,因此可以应用于众多的长时间工作于恶劣环境中。但是,当前的机器视觉尚处于对平面图像的识别与处理,对于立体的成像相对有限。
2.1在自动检测中的应用
自动检测是在自动化生产过程中的极其重要的步骤。机器视觉已经广泛使用于自动检测系统中,检测方式主要有两种方式,即几何测量测试与自动识别检测。
在制造技术中有着不可替代作用的技术便是几何测量技术。以前使用的测量技术在读数时非常繁琐,测量时间较长,人工测量时有着极大的误差,自动化程度不高。测量技术在测试领域是新发展起来的技术,它的发展有着视觉技术推动的结果。当前时期主要有工业CT、激光扫描、激光雷达、结构光测量等方式,它们均有着自身的优势与不足。自动识别检测主要在产品外形或表面探伤上进行应用,这类系统的技术相对较为成熟。
2.2在智能装配中的应用
在当今社会的工业生产中,装配工作占整个商品生产过程中的主要部分,而且装配质量的好坏将会直接影响产品的性能。装配工作因为有着复杂以及多样性的特点,在对其应用自动化技术过程中存在诸多的困难。视觉系统可以极大地减少产品的研发时间,在不进行更改硬件的基础上对各类零部件进行相应的处理。机器视觉技术不但能够完成相对简单的工作,而且可以在极其恶劣或者有害的环境内进行装配工作的展开。当前时期在工业生产中已经引进了大量的含有视觉系统的机器人进行工作。目前对于装配过程中机器视觉的难点在于对立体物体的识别与定位,今后的主要研究方向是三维重建以及立体匹配。
3视觉伺服系统
视觉可以进行不需接触便可以测量的特点使其在伺服系统中有着非常重要的作用。一种较为普遍的应用便是使视觉传感与操作结合于同一个开环的系统内,伺服系统的精确度只由视觉传感以及执行机构二者的精确度进行影响。它的视觉控制使用的是开环视觉方式,也就是说,将图像中包含物体的特征进行提取,同时利用该信息进行相应执行,机构会有所反映,这里的视觉信息只是作为指令来进行使用。通常根据误差信号对视觉伺服系统进行分类,可以分为以位置和图像为基础以及混合两种形式的系统。
关键词:多媒体;多媒体技术;发展前景
中图分类号:TP37文献标识码:A文章编号:1007-9599(2012)10-0000-02
众所周知,在现代科学技术高度发展的今天,信息的传输、信息处理和信息的共享已成为现代社会进步的关键,多媒体技术就是适应于这一需要的产物。它将图形、图像、动画、声音和视频等技术相结合,充分利用了文字、图像、声音等信息,并模拟了人的形象思维与逻辑思维的能力来综合处理和应用这些信息,从而大大地提高了计算机获取、处理信息的能力使信息接收和处理能按人类最自然、最习惯的方式进行,难怪有人称多媒体技术是信息处理技术的第四次革命性的飞跃。
一、计算机多媒体技术概念
所谓计算机多媒体技术,就是通过计算机将文字、图像、视频、声音、动画等多种形式的媒体信息通过一系列的变换,转变成为数字信息,同时,把这些数字信息通过友好的界面进行显示出来。多媒体的范围非常广泛,比如文字、图像、视频、声音、动画通以及用于传递信息的计算机程序等均属于多媒体。计算机多媒体技术应用在我们生活中的很多地方,例如:数字化图书馆融入了多媒体技术后,使得数字化图书馆更加生动真实。
数字化技能将文件处置带入了新之域地,使人门能够用更快之速度出产文件,用更便当之样式修改图象并且文件,应用Internet通信把图象并且文件火速地传到四面八方。通过数字收缩,在那根本上解决了录像带资本来源长久保留之难点。未来之人门需要某一内容时候,能够通过Internet调出,在那Internet终端上阅读,自满时候,再在那终端打印机上打印出来。因特网就是在这种背景下,不知不觉地走近了我们的生活。
二、多媒体发展现状
多媒体(MULTIMEDIA),指信息表示媒体的多样化,常见的图像、声音、文字、动画,承载信息的程序等都是媒体。多媒体技术是指我们利用电脑把文字、图形、影象、动画、声音及视频等媒体信息都数位化,并将其整合在一定的交互式界面上,使电脑具有交互展示不同媒体形态的能力。多媒体技术极大的改变了人们获取信息的传统方法,符合人们在信息时代的阅读方式。多媒体技术的雏型被认为始于1984年,Apple公司首先引入了位影射bitmap的概念对图形进行处理,并使用了窗口和图形符号作为用户接口。目前多媒体技术仍不完善,等待解决的问题还很多,尤其是我国处于起步、发展阶段,需要不断拓展应用领域,探索新的应用途径,以适应信息社会发展的需要。
三、多媒体技术的特点
(一)多媒体信息表现与交互
在多媒体平台下,多种媒体并存,各种媒体在空间如何进行组织,媒体之间的相互作用如何描述和解释,在时间上怎样安排,都是多媒体在表达信息时必须考虑的问题,其交互的作用和影响在表现中是一个不可缺少的成份。
(二)音频采集技术
音频采集通常将模拟信号采样生成数字信号,经过计算机处理后再现或存储到数字介质上。VFW。技术和DirectShow技术都能实现Windows平台上多媒体信息实时采集,但DirectShow目前市场上比较流行的WDM硬件驱动模型,不仅支持比较早的VFW方式的驱动,而且解决了采集设备性能的差异以及兼容性问题与多媒体本身数据量巨大的问题,是目前音视频采集开发的首选技术。
(三)数据压缩技术
多媒体是面向数据、文本、语音、图像、三维动画等多种媒体的处理。为了得到满意的视频画面质量和听觉效果,必须对音频和视频信号实时处理。数字化后的视频和音频信号的数据量是非常巨大的,如一幅640×480mm分辨率的真彩色(24bit/象素)视频图像,数据量为7241Mbit/帧,1000MB的硬盘只能存放1000帧未经压缩的图像。
四、音视频的压缩/解压缩
无论声音的采样参量如何,原始声音的数据量都很大,原始数据量计算方法如下面公式所示。
数据量=采样频率×采样位数×声道数/8(字节/秒)
例如,采样频率位44.1KHz,采样位数为16,双声道,则数据量为181.5千字节每秒,如果我们直接把原始数据在网络中传输,将消耗较多的带宽,并且用网络状况的变化,可能导致声音传输的不平滑,不连续。因此,采样的原始数据必须压缩后才能发送。目前较多的使用开源的MP3压缩代码。
视频数据量远远大于语音,例如视频帧量化为离散的象素,每行181个象素,每幅图像151行,每个视频帧的分辨率都需要大约39KB来表示其内容。若视频帧不经过压缩以25帧/秒传送,那么原始的视频序列数据率约为7.7MbPs。视频相关的应用和推广完全依赖于理想的视频压缩技术。
五、多媒体技术的发展趋势
计算机多媒体技艺之成长前景有三个方面:多媒体技艺集成化、多媒体终真个智能化及嵌入化、Internet化成长。
热门推荐