近两年,安防行业高速发展,“平安中国”、“平安城市”以及奥运会的承办为我国安防产业的发展注入勃勃生机,也为我国的安防产业、企业提供了快速发展的机遇,带动了安防技术的迅速发展和提升。近年来的发展表明,安防技术的总体趋势是朝着高清化、智能化、网络化的方向大步迈进。而在广电领域,通过多年的发展,高清制播、图像智能化分析和全台网络化等技术已非常成熟,在各个电视台中已经普遍应用。
ASMF高码率可满足安防高清需求
最初,“高清”概念与标准是广播电视业提出的。主要有三种标准:720P、1080i、1080P,其画面宽高比定义为16:9。720P即是1280×720分辨率,1080i与1080P是1920×1080分辨率,后缀“i”和“p”分别表示隔行扫描与逐行扫描。其中,1080P是最高等级的高清视频清晰度标准。对于快速移动目标的图像采集,相比隔行扫描,逐行扫描可以获得更好的动态图像,隔行扫描将会产生图像晃动现象。高清视频编码最常用的编码格式是MPEG-2、MPEG-4、H.264和VC-1这四种算法。H.264相对于MPEG-2、 MPEG-4而言,其压缩效率是三种编码中最高的。(见图1)
编码结构
高质量、高效率的编解码器是高清图像处理的关键,能同时支持高效全格式帧精确编解码的技术是构建高清安防系统的必要条件。在广电,根据高清节目的内容采用了不同的码率,如低端的新闻、教育等节目的制作采用较低的18Mbps的码率,而高端的节目制作,包括电视剧、体育等一般采用200Mbps的码率。相对于安防4Mbps到10Mbps的高清码率,广电节目制作系统对高清图像的编解码实时处理要求远超过安防高清系统的要求。
我们知道MPEG系列压缩保准的数据流主要是由I、B、P帧构成的图像组(GOP)为一个单元,只有I帧是全帧(参考帧),而B、P是预测帧,在数据流播放过程中,若直接对码流进行切换,必须等到I帧到来,这样就产生了时延,延迟时间取决于图像组(GOP)的长度。是否不必从I帧作为入口,而做到精确任意帧播放和检索?这是可以的,在广电的非线性编辑系统中就实现了帧精确的播放和快速连续搜索,在播放和搜索过程中,可流畅地看到每一帧,并能精确地停在任何一帧(I、B、P帧),可以逐帧搜索,还可实现精确快速连续倒放和逐帧倒放搜索。同样,对于H.264、MPEG-4压缩格式也实现了毫秒级响应的帧精确定位。而在安防领域目前普遍只做到了秒级检索定位。
众所周知,高清意味着高码率,如何在实现高码率数据存储时,兼顾高安全性、高实时性、高性能的要求?为了解决这个问题,我们需从文件格式着手。MXF是英文Material Exchange Format(文件交换格式)的词头缩写,MXF被设计可用于包装MPEG–2数据流、DV数据流、YUV数据流、PCM音频文件以及几种格式的数据库文件(同步或非同步模式)。MXF可以同时处理打包多条轨道的音视频和数据库文件,它被设计为既支持流媒体传输又支持文件的传输。在专业广播电视环境中MXF被广泛使用,结合安防监控高清码流数据的特点,我们在MXF基础上设计了一种专用于高清图像存储的格式,称为高级媒体文件系统(Advanced Security Media Format)缩写为ASMF。
文件由文件头、文件体和文件尾组成。文件头作为文件的开始包含了该文件视音频轨道数、时间长度等基本结构信息,文件体用来存放视音频数据和对应的索引等信息,文件尾作为文件结束点,用来包含最终的媒体和元数据信息,同时可以利用其中的关闭与否的标记,来决定更新信息是否可用。
ASMF完全独立于操作系统,直接对磁盘进行读写操作,具有极高的I/O读写性能,全面满足高清系统读写要求。通过智能磁盘I/O调度算法,可有效避免磁盘读写“冲突”。分散式实时备份的ASMF RAID能够提供大于RAID0+1的数据安全性,确保磁盘意外损坏的情况下让数据不受到影响。(见图2)
文件系统格式
同时,ASMF文件支持通道、多个不同时间片断视音频数据的聚合保存。使得各个音视频片断之间建立关联,更加富有逻辑性。比如我们可以把一个案件相关的几个摄像头录制的场景,几个涉案人物对应的片段都存放在同一个文件中,与之相关的事件信息,场景描述信息,关键段落信息等元数据(MetaData)作为辅助和描述信息也保存在ASMF文件中,从而使资料使用过程中具有更好的访问性能和更方便高效的提取和操作。
ASMF文件格式支持内容的高效访问和快速“帧精确”定位。支持多层、分布、金字塔式的超级索引模式,定位时采用逐层分段查询访问的方式,能够快速精确定到文件中的任意帧及视频段,而不需要分析整个索引,极大地提高文件定位和响应。
转场智能识别技术在安防的应用
另一方面,广电领域中独具特色的智能化转场识别技术也可用于安防系统。转场是视频场景与场景之间的过渡或转换,例如在报道一家企业时,前一场最后一个镜头是在企业拍摄的产品,下一个镜头是在市场拍摄的产品,报道就由车间转到了商店,由生产转到了销售,这个场景的转换在广电领域就称为转场。当时这个转场智能识别技术被国外厂商所掌握,后来国内的厂商通过自主研发掌握了转场识别核心技术。
通过转场智能识别技术,能对存储的素材按转场进行镜头分割,自动生成该素材的分镜头列表,并提供快速的分镜头定位。从目的上讲,智能转场识别与安防的移动侦测识别的目标是一致的,都是通过检测图像的画面变化识别出不同的场景,不过转场智能识别技术属于更高级的视频分析技术,识别的精度更高。并且基于转场智能识别技术,可进一步实现图像的黑场、彩条、雪花的检测,这些技术在安防系统中可用于检测摄像机的工作状态,成为自动检测摄像机图像系统工作状态的技术手段。
在广电领域中,体育节目制作部门会经常制作一个足球精彩射门集锦,以前都是通过制作人员逐个浏览足球赛录像资料,将其中的精彩片段剪辑到一起,非常耗时,工作效率非常低。后来广电设备厂商针对这个问题研发了一个足球精彩度分析智能算法,能自动分析录像中足球射门镜头,并这些镜头自动剪辑成一个短片,制作人只需对剪辑完成的短片做出简单调整就可播出,极大地缩短了节目制作周期。这里的足球精彩度分析智能算法其实就是安防领域中提到的视频智能算法,通过识别画面中的人群密度,足球运动速度、球门的特征和守门员特殊的服装颜色等参数准确识别出射门的精彩镜头。
除了基于视频的图像智能分析外,广电还有语音的智能分析技术,主要用于分析播音员的声音,通过声音识别自动对齐屏幕下方的字幕。在安防领域该技术可应用到监控环境中的异常声响的识别,如爆炸声、枪声、呼救声等。
MSB在网络视频监控领域的优势
目前,随着网络视频监控的发展,视频监控开始向道路交通、企业信息化、家庭、教育、医疗等新的应用领域渗透。网络视频监控具有独特的优势,与模拟和数字监控技术相比,网络视频监控利用了TCP/IP网络,可以实现远程监控和低成本扩展监控范围。然而我们也应该看到,当前安防网络化的重点侧重在多个监控子系统间的联网,监控与相关业务、与工作流程的结合还比较少。在这方面,广电领域的MSB(媒体服务总线,见图3)高清全台网的技术体系架构就与用户的业务和流程结合的较好,通过在中央电视台、奥运会等项目的运用,取得了不错的效果,非常值得广大安防厂商在设计视频监控系统时借鉴。
高清系统结构图
在广电领域中,MSB是根据行业特点,以SOA为技术理论基础,结合多种开发技术及协议规范,用于电视台全台信息化建设的核心架构。MSB分为两个部分:架构和协议规范。从架构上讲,MSB是面向广电行业、各行业多媒体相关应用的基础平台及业务整合目标;以SOA思想为蓝本,吸收了SOA里ESB、BEPL等先进理念。具有SOA体系松耦合、协议转换、路由、流程定义等所有的核心优点;支持媒体总线功能。实现媒体文件的松耦合、格式转换、路由及交换功能;以“服务”为主的思路实现多个子系统的互联互通。从协议规范的角度来说,MSB用XML schema逐步定义了一套基于电视台典型业务抽象的业务规范;用“服务”、“接口”、“参数”具体表现了业务规范。
每个模块定义的主要功能如下:
· 系统资源注册:实现各个系统提供的标准服务类别、技术体系类别等、通信地址等参数注册及存储;
· 协议转换中介:以“技术实现无关的业务规范”为准则,实现了不同技术封装的业务协议的格式转换。还可进一步实现规范内容转换;
· 媒体处理中介:实现了媒体的迁移、格式转换、媒体分析等功能间接口;
· 信息总线:承载元数据通讯的逻辑链路;
· 业务规范:完成了与技术实现无关的业务规范基础框架制定,并给出了和协议封装无关的XSD定义;
· 媒体总线:承载媒体文件流动的逻辑链路;
· 业务监控及管理服务:提供获取注册在总线上的系统服务状态,浏览系统运行日志,干预服务运行状态的服务接口;
· 业务流程定义服务:提供按用户设置策略,定义几个系统间的服务执行流程的服务接口。
从宏观来看,MSB是一个总线的结构,其它业务系统都通过一个服务接口层插接在总线上。从整个概念来讲,它更像一块无源的工控机主板,里面驻留了一些基础的配置模块和路由模块。业务系统通过标准的插接件,接入到不同规格的接口上。
总的来说,广电领域的相关技术在安防领域中具有很大可移植性,为安防系统的建设、整合、发展提供了一个新的思路。一方面我们可采取拿来主义,将广电领域的先进技术借鉴到安防系统的建设中,另一方面,我们也要根据安防的特点做技术创新,共同推动智能高清监控时代的来临。(来源:安防知识网)