图像和图形知识
闭路监控基础知识:图像和图形知识
1.有关色彩的基本常识
我们知道,只要是彩色都可用亮度、色调和饱和度来描述,人眼中看到的任一彩色光都是这三个特征的综合效果。那么亮度、色调和饱和度分别指的是什么呢?
★ 亮度:是光作用于人眼时所引起的明亮程度的感觉,它与被观察物体的发光强度有关;
★ 色调:是当人眼看到一种或多种波长的光时所产生的彩色感觉,它反映颜色的种类,是决定颜色的基本特性,如红色、棕色就是指色调;
★ 饱和度:指的是颜色的纯度,即掺入白光的程度,或者说是指颜色的深浅程度,对于同一色调的彩色光,饱和度越深颜色越鲜明或说越纯。通常我们把色调和饱和度通称为色度。 现在你该明白了,亮度是用来表示某彩色光的明亮程度,而色度则表示颜色的类别与深浅程度。除此之外,自然界常见的各种颜色光,都可由红(R)、绿(G)、蓝(B)三种颜色光按不同比例相配而成;同样绝大多数颜色光也可以分解成红、绿、蓝三种色光,这就形成了色度学中最基本的原理----三原色原理(RGB)。
2.目前常见的图形(图像)格式
一般来说,目前的图形(图像)格式大致可以分为两大类:一类为位图;另一类称为描绘类、矢量类或面向对象的图形(图像)。前者是以点阵形式描述图形(图像)的,后者是以数学方法描述的一种由几何元素组成的图形(图像)。一般说来,后者对图像的表达细致、真实,缩放后图形(图像)的分辨率不变,在专业级的图形(图像)处理中运用较多。
在介绍图形(图像)格式前,我们实在有必要先了解一下图形(图像)的一些相关技术指标:分辨率、色彩数、图形灰度。
★ 分辨率:分为屏幕分辨率和输出分辨率两种,前者用每英寸行数表示,数值越大图形(图像)质量越好;后者衡量输出设备的精度,以每英寸的像素点数表示;
★ 色彩数和图形灰度:用位(bit)表示,一般写成2的n次方,n代表位数。当图形(图像)达到24位时,可表现1677万种颜色,即真彩。灰度的表示法类似;
下面我们就通过图形文件的特征后缀名(就是如图.bmp这样的)来逐一认识当前常见的图形文件格式:BMP、DIB、PCP、DIF、WMF、GIF、JPG、TIF、EPS、PSD、CDR、IFF、TGA、PCD、MPT。
★ BMP(bit map picture):PC机上最常用的位图格式,有压缩和不压缩两种形式,该格式可表现从2位到24位的色彩,分辨率也可从480x320至1024x768。该格式在Windows环境下相当稳定,在文件大小没有限制的场合中运用极为广泛。
★ DIB(device independent bitmap):描述图像的能力基本与BMP相同,并且能运行于多种硬件平台,只是文件较大。
★ PCP(PC paintbrush):由Zsoft公司创建的一种经过压缩且节约磁盘空间的PC位图格式,它最高可表现24位图形(图像)。过去有一定市场,但随着JPEG的兴起,其地位已逐渐日落终天了。
★ DIF(drawing interchange formar):AutoCAD中的图形文件,它以ASCII方式存储图形,表现图形在尺寸大小方面十分精确,可以被CorelDraw,3DS等大型软件调用编辑。
★ WMF(Windows metafile format):Microsoft Windows图元文件,具有文件短小、图案造型化的特点。该类图形比较粗糙,并只能在Microsoft Office中调用编辑。
★ GIF(graphics interchange format):在各种平台的各种图形处理软件上均可处理的经过压缩的图形格式。缺点是存储色彩最高只能达到256种。
★ JPG(joint photographics expert group):可以大幅度地压缩图形文件的一种图形格式。对于同一幅画面,JPG格式存储的文件是其他类型图形文件的1/10到1/20,而且色彩数最高可达到24位,所以它被广泛应用于Internet上的homepage或internet上的图片库。
★ TIF(tagged image file format):文件体积庞大,但存储信息量亦巨大,细微层次的信息较多,有利于原稿阶调与色彩的复制。该格式有压缩和非压缩两种形式,最高支持的色彩数可达16M。
★ EPS(encapsulated PostScript):用PostScript语言描述的ASCII图形文件,在PostScript图形打印机上能打印出高品质的图形(图像),最高能表示32位图形(图像)。该格式分为Photoshop EPS格式adobeillustrator EPS和标准EPS格式,其中后者又可以分为图形格式和图像格式。
★ PSD(photoshop standard):Photoshop中的标准文件格式,专门为Photoshop而优化的格式。
★ CDR(coreldraw):CorelDraw的文件格式。另外,CDX是所有CorelDraw应用程序均能使用的图形(图像)文件,是发展成熟的CDR文件。
★ IFF(image file format):用于大型超级图形处理平台,比如AMIGA机,好莱坞的特技大片多采用该图形格式处理。图形(图像)效果,包括色彩纹理等逼真再现原景。当然,该格式耗用的内存外存等的计算机资源也十分巨大。
★ TGA(tagged graphic):是True vision公司为其显示卡开发的图形文件格式,创建时期较早,最高色彩数可达32位。VDA,PIX,WIN,BPX,ICB等均属其旁系。
视频(动画)
1.动态图像的组成
动态图像,包括动画和视频信息,是连续渐变的静态图像或图形序列,沿时间轴顺次更换显示,从而构成运动视感的媒体。当序列中每帧图像是由人工或计算机产生的图像时,我们常称作动画;当序列中每帧图像是通过实时摄取自然景象或活动对象时,我们常成为影像视频,或简称为视频。动态图像演示常常与声音媒体配合进行,二者的共同基础是时间连续性。一般意义上谈到视频时,往往也包含声音媒体。但在这里,视频(动画)特制不包含声音媒体的动态图像。
2.动画的定义
什么是动画?所谓动画,就是通过以每秒15到20帧的速度(相当接近于全运动视频帧速)顺序地播放静止图像帧以产生运动的错觉。因为眼睛能足够长时间地保留图像以允许大脑以连续的序列把帧连接起来,所以能够产生运动的错觉。我们可以通过在显示时改变图像来生成简单的动画。最简单的方法是在两个不同帧之间的反复。这种方法对于指示"是"或"不是"的情况来说是很好的解决方法。另一种制作动画的方法是以循环的形式播放几个图像帧以生成旋转的效果,并且可以依靠计算时间来获得较好的回放,或用记时器来控制动画。
3.常见的视频文件格式
视频信息在计算机中存放的格式有很多,目前最流行的两种格式是:
苹果公司的Quicktime和微软的AVI。
★ Quicktime:是苹果公司采用的面向最终用户桌面系统的低成本、全运动视频的方式,现在在软件压缩和解压缩中也开始采用这种方式了。其向量量化是Quicktime软件的压缩技术之一,它在最高为30帧/秒下提供的视频分辨率是320x240,其压缩率能从25到200。
★ AVI:类似于Quicktime,是微软公司采用的音频视频交错格式,也是一种桌面系统上的低成本、低分辨率的视频格式。AVI可在160x120的视窗中以15帧/秒回放视频,并可带有8位的声音,也可以在VGA或超级VGA监视器上回放。AVI很重要的一个特点是可伸缩性,使用AVI算法时的性能依赖于与它一起使用的基础硬件。
MPEG-4简介
MPEG-4是目前业界先进的视频压缩技术,具有直览图像清晰,传输带宽要求低,远程监控方便等特点。
MPEG 协会创建于1987年。MPEG是Motion Pictures Expert Group的缩写。这个协会是一个全球性的机构,主要致力于影像压缩的研究。MPEG-1,用于VCD内的压缩技术,MPEG-2,用于DVD内的压缩技术,以及MP3压缩方法,都是由这个协会创建的。MPEG的压缩方式的优点除了画面质量高,带宽要求低以外,也是在于它是现在数码影像届公认的商业标准。使用MPEG压缩方式的影像数据流可以通过各类的媒体播放器播放。
以下是MPEG-4与MPEG-1和MPEG-2的比较:
MPEG-1 MPEG-2 MPEG-4
标准创建时间 1992 1995 1999
最高图像分辨率 352 x 288 1920 x 1152 720 x 576
普通PAL制式分辨率 352 x 288 720 x 576 720 x 576
普通NTSC制式分辨率 352 x 288 640 x 480 640 x 480
最佳声音频率 48 kHz 96 kHz 96 kHz
最多声音通道 2路 8路 8路
最高数据流量 3 Mbps 80 Mbps 5 to 10 Mbps
一般数据流量 1380 kbps (352 x 288) 6500 kbps (720 x 576) 880 kbps (720 x 576)
帧每秒(PAL) 25 25 25
帧每秒(NTSC) 30 30 30
图像质量 一般 非常好 非常好
编码硬件要求 低 高 非常高
解码硬件要求 非常低 中等 高
技术支持->监控常识
监控系统性能对比表
比较内容 计算机数字压缩监控系统 闭路电视监控系统 多媒体监控系统
压缩方式 对图像进行数字压缩 无图像数字压缩 不对图像进行数字压缩
配 置 在先进的计算机上集成,设备简洁,可靠性高 由监视器、录像机、编码器解码器、视频转换器、图像分割器、矩阵等组成。设备多、可靠性低 由监视器、录像机、编码器解码器、视频转换器、图像分割器、矩阵等组成。设备多、可靠性低
纪录方式 数字信号 模拟信号 模拟信号
图 像 由计算机显示器显示,图像分辨率达1024x768, 16位增强色,高分辨率,高清晰度,高画质 采用监视器显示,扫描线分辨率为300线 可由计算机显示器显示分辨率可达1204x768或由显示器显示分辨率为300线
传 输 可通过普通电话线远距离传输图形信号,传输速度率为5/帧秒,且能保证图像质量 不能远距离传输 可进行单帧传输
安 全 系统智能化,自动登陆每一个进入系统的人员,有多个安全防范等级,能有效的防范内部人员作案 任何人都可进入系统而不被纪录,不能防范内部人员作案 不能对每个进入系统的人进行安全检测,不能防范内部人员作案
系 统 采用计算机中文视窗Win2000操作平台,可支持各种软、硬件的扩展,随着计算机升级而升级 系统一经配套组合,便不可升级 系统一经配套组合,便不可升级
操 作 操作简单到只要一按电源开关即可,全自动进入监视状态 需要开启每一台设备的电源,并设置每一设备的参数后,方可工作 需要开启每一台设备的电源,并设置每一设备的参数后,方可工作
值 守 可无人值守 根据系统大小,需多人值守 根据系统大小,需多人值守
功 耗 150W-500W 500W-3000W 500W-3000W
录 制 可多个硬盘循环录制 磁带更换录制 不能循环录制
回 放 可单帧画面回放检索即连续回放,画面质量可靠 只能利用录像机暂停键查看画面,画面质量差 可单帧画面回放或利用录像机暂停键查看画面
检 索 多检索点,可根据文件类型摄像机型号及文件的年月日时分秒进行所要的画面检索 需耗费很多时间自在录像带上反复进退查找确定时刻的画面内容,对某一时刻进行检索难度大,偶然性强 检索方式略多于模拟纪录方式
编 辑 支持多种软件,可对图像的每一帧画面进行多次编辑、修复、打印 不能编辑、修复、打印 可对图像的每一帧画进行多次编辑、修复、打印
图像校正 计算机软件可调整图像清晰度\对比度、亮度及色度等 不能做任何校正 可部分调整图像清晰度对比度亮度及色度等
报 警 智能报警,即可将报警后的图像录入,也可将报警前的内容录下来 只能录下报警后的内容 可将报警后的的内容,也可将报警前的内容自动录入
维 修 无需拆机维护,经培训后普通保安人员即可进行维护 对系统中的每一部分都必须专人定期保养维护,如:清洁录像机磁头、保存录像带等 对系统中的每一部分都必须专人定期保养维护
占用空间
相当于PC机的体积,占用空间很小 设备及连线复杂,占用空间较大 设备及连线复杂,占用空间较大
价 格 经济,原有设备不至浪费,免费升级软件,可在相当长的时间内不被淘汰 设备投资大,维修费用高,且无升级潜力 设备投资大,维修费用高,且无升级潜力
多媒体数据压缩和编码技术标准
目前,被国际社会广泛认可和应用的通用压缩编码标准大致有如下四种:
H.261、JPEG、 MPEG和DVI。
★ H.261:由CCITT(国际电报电话咨询委员会)通过的用于音频视频服务的视频编码解码器(也称Px64标准),它使用两种类型的压缩:一帧中的有损压缩(基于DCT)和用于帧间压缩的无损编码,并在此基础上使编码器采用带有运动估计的DCT和DPCM(差分脉冲编码调制)的混合方式。这种标准与JPEG及MPEG标准间有明显的相似性,但关键区别是它是为动态使用设计的,并提供完全包含的组织和高水平的交互控制。
★ JPEG:全称是Joint Photogragh Coding Experts Group(联合照片专家组),是一种基于DCT的静止图像压缩和解压缩算法,它由ISO(国际标准化组织)和CCITT(国际电报电话咨询委员会)共同制定,并在1992年后被广泛采纳后成为国际标准。它是把冗长的图像信号和其它类型的静止图像去掉,甚至可以减小到原图像的百分之一(压缩比100:1)。但是在这个级别上,图像的质量并不好;压缩比为20:1时,能看到图像稍微有点变化;当压缩比大于20:1时,一般来说图像质量开始变坏。
★ MPEG:是Moving Pictures Experts Group(动态图像专家组)的英文缩写,实际上是指一组由ITU和ISO制定发布的视频、音频、数据的压缩标准。它采用的是一种减少图像冗余信息的压缩算法,它提供的压缩比可以高达200:1,同时图像和音响的质量也非常高。现在通常有三个版本:MPEG-1、MPEG-2、MPEG-4以适用于不同带宽和数字影像质量的要求。它的三个最显著优点就是兼容性好、压缩比高(最高可达200:1)、数据失真小。
★ DVI:其视频图像的压缩算法的性能与MPEG-1相当,即图像质量可达到VHS的水平,压缩后的图像数据率约为1.5Mb/s。为了扩大DVI技术的应用,Intel公司最近又推出了DVI算法的软件解码算法,称为Indeo技术,它能将为压缩的数字视频文件压缩为五分之一到十分之一。
说到MPEG,相信没有哪位朋友会不知道,但要追根究底地问你MPEG到底是什么,恐怕就没有多少人能正确地回答出来了。实际上,MPEG的全称应该是Moving Pictures Experts Group(即动态图像专家组),由ISO(International Standards Organization,国际标准化组织)与IEC(International Electronic Committee)于1988年联合成立,致力于运动 图像(MPEG视频)及其伴音编码(MPEG音频)标准化工作。
MPEG共有4个版本,其中前两个版本MPEG-1和MPEG-2应用比较广泛,而MPEG-4虽然已推出近两年,但有关它的应用却直到最近才活跃起来,MPEG-7则是属于未来的标准。今天,我们就在了解MPEG这个家庭的成长历程和各个成员的特点的基础上,重点看看MPEG-4的特点和应用,相信在不久,大家就会广泛地接触到采用MPEG-4这种先进技术制作的产品。
广泛应用的MPEG-1与MPEG-2
MPEG-1标准(ISO/IEC11172)制定于1992年,是针对1.5Mbps以下数据传输率的数字存储媒体运动图像及其伴音编码设计的国际标准,主要用于在CD-ROM(包括Video-CD、CD-I等)存储彩色的同步运动视频图像,它针对SIF(标准交换格式)标准分辨率(NTSC制为352×240;PAL制为352×288)的图像进行压缩,每秒可播放30帧画面,具备CD(指激光唱盘)音质。同时,它还被用于数字电话网络上的视频传输,如非对称数字用户线路(ADSL)、视频点播(VOD)、教育网络等。
使用MPEG-1的压缩算法,可以将一部120分钟长的电影压缩到1.2GB左右,因此,它被广泛地应用于VCD制作和一些视频片段的下载,目前90%以上的VCD都是用MPEG-1格式压缩的。
MPEG-2标准ISO/IEC13818)制定于1994年,是针对3~10Mbps的数据传输率制定的的运动图像及其伴音编码的国际标准。MPEG-2可以提供一个较广的范围改变压缩比,以适应不同画面质量、存储容量和带宽的要求。它在与MPEG-1兼容的基础上实现了低码率和多声道扩展:MPEG-2可以将一部120分钟长的电影压缩到4~8GB(它提供的是我们通常所说的DVD品质),其音频编码可提供左右中及两个环绕声道、一个加重低音声道和多达7个伴音声道(因此DVD可有8种语言配音)。
除了作为DVD的指定标准外,MPEG-2还可用于为广播、有线电视网、电缆网络等提供广播级的数字视频。不过对普通用户来说,由于现在电视机分辨率的限制,MPEG-2所带来的高清晰度画面质量(如DVD画面)在电视上效果并不明显,倒是其音频特性(如加重低音、多伴音声道等)得到了广泛的应用。
MPEG-3是ISO/IEC最初为HDTV(高清晰电视广播)制定的编码和压缩标准,但由于MPEG-2的出色性能已能适用于HDTV,因此MPEG-3标准并未制定,我们通常所说的MP3指的是MPEG Layer 3,只是MPEG的一个音频压缩标准。
令人称道的MPEG-4
MPEG-4于1998年11月公布,预计投入使用的国际标准MPEG-4是针对一定比特率下的视频、音频编码,更加注重多媒体系统的交互性和灵活性。为此,MPEG-4引入了AV对象(Audio/Visual Objects),使得更多的交互操作成为可能:
"AV对象"可以是一个孤立的人,也可以是这个人的语音或一段背景音乐等。它具有高效编码、高效存储与传播及可交互操作的特性。
MPEG-4对AV对象的操作主要有:采用AV对象来表示听觉、视觉或者视听组合内容;组合已有的AV对象来生成复合的AV对象,并由此生成AV场景;对AV对象的数据灵活地多路合成与同步,以便选择合适的网络来传输这些AV对象数据;允许接收端的用户在AV场景中对AV对象进行交互操作等。
MPEG-4标准则由6个主要部分构成:
1、DMIF(The Deliveries Multimedia Integration Framework,多媒体传送整体框架)。主要用于解决交互网络中、广播环境下以及磁盘应用中多媒体应用的操作问题。通过传输多路合成比特信息来建立客户端和服务器端的连接与传输。
2、数据平面。为了使基本流和AV对象在同一场景中出现,MPEG-4引用了对象描述(OD)和流图桌面(SMT)的概念。OD传输与特殊AV对象相关的基本流的信息流图。桌面把每一个流与一个CAT(Channel Association Tag)相连,CAT可实现该流的顺利传输。
3、缓冲区管理和实时识别。MPEG-4定义了一个系统解码模式(SDM),该解码模式描述了一种理想的处理比特流句法语义的解码装置,它要求特殊的缓冲区和实时模式。通过有效地管理,可以更好地利用有限的缓冲区空间。
4、音频编码。MPEG-4不仅支持自然声音,而且支持合成声音。MPEG-4的音频部分将音频的合成编码和自然声音的编码相结合,并支持音频的对象特征。
5、视频编码。与音频编码类似,MPEG-4也支持对自然和合成的视觉对象的编码。合成的视觉对象包括2D、3D动画和人面部表情动画等。
6、场景描述。MPEG-4提供了一系列工具,用于组成场景中的一组对象。一些必要的合成信息组成场景描述,用于描述各AV对象在一具体AV场景坐标下,如何组织与同步等问题。
MPEG-4的应用
与MPEG-1和MPEG-2相比,MPEG-4更适于交互AV服务以及远程监控,它的设计目标使其具有更广的适应性和可扩展性: MPEG-4传输速率在4800-64000bps之间,分辨率为176×144,可以利用很窄的带宽通过帧重建技术压缩和传输数据,从而能以最少的数据获得最佳的图像质量。因此,它将在数字电视、动态图像、互联网、实时多媒体监控、移动多媒体通信、Internet/Intranet上的视频流与可视游戏、DVD上的交互多媒体应用等方面大显身手。
当然,对于普通用户来说,MPEG-4在目前来说最有吸引力的地方还在于它能在普通CD-ROM上基本实现DVD的质量:用MPEG-4 压缩算法的ASF(Advanced Streaming format,高级格式流)可以将120分钟的电影压缩为300MB左右的视频流;采用MPEG-4压缩算法的DIVX 视频编码技术可以将120分钟的电影压缩600MB左右,也可以将一部 DVD影片压缩到 2 张 CD-ROM上!也就是说,有了MPEG-4,你不需要购买 DVD-ROM 就可以享受到和它差不多的视频质量!播放这种编码的影片对机器的要求并不高:只要你的电脑有300MHz 以上(无论是哪种型号)的CPU、64MB内存、8MB的显卡就可以流畅地播放。
不过,和DVD相比,MPEG-4属于一种高比率有损压缩算法,其图像质量始终无法和DVD的MPEG-2相比,毕竟DVD的存储容量比较大。此外,要想保证高速运动的图像画面不失真,必须有足够的码率,目前MPEG-4的码率虽然可以调到和DVD差不多,但总体效果还有不小的差距。因此,现在的MPEG-4只能面向娱乐、欣赏方面的市场,那些对图像质量要求较高的专业视频领域暂时还不能采用。
属于未来的MPEG-7
继MPEG-4之后,要解决的矛盾就是对日渐庞大的图像、声音信息的管理和迅速搜索。1998年10月基于这种设想的MPEG-7标准被提出,它的正式名称是"多媒体内容描述接?quot;,将对各种不同类型的多媒体信息进行标准化的描述,并将该描述与所描述的内容相联系,以实现快速有效的搜索。
由于该标准不包括对描述特征的自动提取,它也没有规定利用描述进行搜索的工具或任何程序,因此,它可以独立于其他MPEG标准使用,但MPEG-4中所定义的对音频、视频对象的描述仍然适用于MPEG-7,这种描述是分类的基础。我们可以也利用MPEG-7的描述来增强其他MPEG标准的功能。
MPEG-7的应用范围很广泛,既可应用于存储(在线或离线),也可用于流式应用(如广播、将模型加入Internet等)。它还可以在实时或非实时环境下应用,如:数字图书馆(图像目录、音乐字典等)、多媒体名录服务(如黄页)、广播媒体选择(无线电信道,TV信道等)等。它在未来将会在教育、新闻、导游信息、娱乐、等各方面将发挥巨大的作用。
MPEG-1的出现使VCD取代了录像带,MPEG-2的出现使数字电视逐步取代模拟电视,MPEG-4的出现使多媒体系统的交互性和灵活性大为增强,而MPEG-7的出现将会带我们进入一个互动多媒体的网络时代。