首页 文学文摘 时政新闻 科技科普 经济法律 健康生活 管理财经 教育教学 文化艺术 社科历史

视频浓缩与对象检索技术的研究

作者:向昌盛 张青荣 陈尧 来源:电子技术与软件工程

摘 要

本文主要介绍基于目标视频摘要技术、根据特征视频检索技术以及模糊视频图像清晰化技术,实现快速浏览视频信息,甄选出重要信息的目标。

【关键词】视频摘要 视频检索 视频浓缩

1 引言

1.1 视频浓缩与对象检索技术研究的意义

随着多媒体技术与计算机网络技术的不断发展,多媒体已经广泛应用在多个领域,比如:国防、刑侦、小区监控、医疗等。如何众多视频中寻求用户需要的信息,成为了必不可少的技术研究。视频浓缩与检索技术的出现,为用户提供了诸多方便,在信息甄选中也节省了很多时间,特别在刑侦过程中,在海量监控视频中快速找出有用信息,减少了破案时间,增加了将犯罪嫌疑人绳之以法的机会。

1.2 国内外研究现状

(1)QBIC系统:QBIC(QueryByImageCo

ntent)是由IBMAlmaden研究中心开发的,是基于内容检索系统的代表。它允许使用例子图像、用户构造草图和图画、选择颜色和纹理模式、还可根据背景对大型图像及视频进行查询,甄选所需要的信息。

(2)VisualSeek系统:VisualSeek是美国哥伦比亚大学电子工程系与电信研究中心图像和高级电视实验室共同研究的。简而言之,利用它可以再互联网上实现“基于内容”的视频检索,在Web上就可以成功搜寻到自己所需要的视频或图像信息。

(3)VideoQ系统:VideoQ是哥伦比亚大学研究的一个项目,它扩充了传统的关键字和主题导航的查询方法,允许用户使用视觉特征和时空关系来检索视频。在以往的检索方法中有了更进一步的提升。

(4)TV-FI系统:TV-FI(TsinghuaVideoFindIt),是清华大学开发的视频节目管理系统。这个系统可以提供如下几个功能:视频数据入库、基于内容的浏览、检索等。实现的功能是综合功能。

2 视频浓缩技术

2.1 视频浓缩技术的概念

视频浓缩(Video Synopsis)是对视频内容的一个简单概括,以自动或是半自动的方式,通过对视频中的运动目标进行算法分析,提取运动目标,然后对各个目标的运动轨迹进行分析,将不同的目标“组合”到一个共同的活动场景中,生成新的浓缩后视频的一种技术。

2.2 视频浓缩技术设计

视频浓缩主要有三个方面的技术操作:活动目标提取、策略性摘要展示和索引能力。活动目标提取,即只关心活动目标,对视频进行时空浓缩。比如,将24小时内的街道监控视频浓缩至30分钟,就可以清楚地看见有哪些活动目标在监控区域内出现。大大减轻了工作的繁冗度。策略性摘要展示,即主要通过活动背景和活动目标有策略的组合,避免活动目标的重合、活动目标的割裂、以及与活动背景的不平滑等。最后,使得同一空间中的不同活动目标在同一时间呈现在画面中。索引能力指的是:根据特征视频检索技术,即根据目标,快速在视频中找出符合条件的目标。方便用户迅速还原真实的监控情况。

2.3 视频浓缩技术的应用

由于信息技术的快速发展,海量监控视频便应运而生,在“办案”过程中给工作人员带来了巨大的困难,需对视频进行反复查看,采用人海战术,既费时又费力,而且还达不到预期的效果。所以视频浓缩技术显得尤为重要,视频浓缩技术可以为公安刑警部门减少查看视频的时间,为案情侦破省去的更多的时间。此外,对于重点、高级安保区域,如监狱、小区、银行、政府机关等,通过视频压缩技术,有利于工作人员提前发现异常情况,对于监控区域的安全性有了更高一层的保障。

3 视频检索技术

3.1 视频检索技术的含义

视频检索技术(video retrieval technology)即从大量的视频数据中找到符合特征对象的视频。视频检索是一门交叉科学,以图像处理、模式识别、计算机视觉、图像理解等领域的知识为基础。从认知科学、人工智能、数据库管理系统及人机交互,信息检索等领域。引入媒体数据表示和数据模型,从而设计出有效、可靠的检索算法,系统结构、以及友好的人机界面。在视频检索中,为提高检索效率及质量,查询模块在检索前应先调用历史记录和知识库,引导用户查询。此外,为使索引特征能体现用户查询需要,系统将用户反馈信息进行登记,自动更新数据库实现自我调整和适应。基于内容的视频检索需要解决的另一关键问题是怎样判断特征之间的相似性。现有的视频检索系统提交的查询结果和用户的查询需求往往有一定偏差,这是由于视频信息包含复杂的底层特征和高层语义特征,与用户的表达有很大差异。为更好的判断相似性,需要用户在查询过程中与系统不断交互,通过不断反馈信息来调整检索内容以便逐步靠近用户查询需求,同时系统根据反馈信息更新数据库进行自我学习。

3.2 视频检索的方法

3.2.1 基于视觉特征的索引方法

基于视觉特征的基本方法,简单来说就相当于在一片课文中寻求关键字,来找寻与关键字相匹配的内容,在视频检索中的应用也是如此,选取关键帧后,再让系统自动或者是半自动的搜寻与关键帧匹配的视频内容,它通常需要示例图片或示例视频,如果用户没有此条件,那么采用该方法进行视频检索就相当困难。因此,这种方法有一定的局限性。

3.2.2 基于音频特征的索引方法

省音是视频的组成部分,试想一下,如果一部电影没有声音,那么人们就很难理解电影的主要内容,所以,靠音频检索视频不失为一种重要的方法。声音的主要特征是响度、音调、及频率。不同的声音大多可以通过这些特征区分出来。将音频进行FFT变换(离散傅立叶变换)后,可以将平时很难从表面区分出来的声音区分出来。另外,FFT还可以将特征音频的频谱提取出来,以供对特征视频进行索引,可以节约很多时间。但是,基于音频特征的检索方法还是有一定的局限性,通常对视频索引起辅助作用。

3.2.3 基于文字内容的索引方法

这种方法分为两种子方法。第一,基于视频本身存在的文字进行检索,视频中的文字分为人工文字和长景文字。人工文字,由意可知,就是人工添加的文字,例如新闻标题。而场景文字,则是区别人工文字的,例如,街上的广告牌语、特征的场景标记文字、路牌等。从视频帧中提取文字,可以为视频索引起到很大的作用。第二,基于人工语言命令检索,比如在小区的监控视频中,希望找到6栋4楼楼梯间右侧的视频,只有人工输入命令语言,就可以完成。

4 基于视频浓缩与检索技术的产品功能

(1)基于案件分级管理。

(2)活动目标视频摘要。

(3)人车分类检索。

(4)目标方向检索。

(5)时间校正。

(6)感兴趣与不感兴趣区域。

(7)视频对比播放。

(8)视频图像清晰化处理。

参考文献

[1]陆燕,陈福生.基于内容的视频检索技术.1001-3695(2003)11-0001-04

[2]张治国,刘怀亮等.基于高层语义的视频检索研究.计算机工程与应用 168 2007,43(18).

[3]刘红英.基于内容的视频检索技术.ISSN 1009-3044(2009)03-0732-02.

[4]周渝斌.海量监控视频快速回放与检索技术.计算机应用.2012,32(11):3185-3188,3197

[5]唐波,等.基于数据库的视频检索实现.数字电视与数字视频1002-8692(2005)02-0020-05

[6]庞志恒,葛友杰,陈春龙等.视频浓缩与基于对象检索技术研究.科技信息[J].2013(2).62-64

作者简介

向昌盛(1991-),男,土家族,湖北省来凤县人。现就读湖北民族学院科技学院本科。

张青荣,(1995-),女,土家族,湖北省恩施市人。现就读湖北民族学院科技学院本科。

陈尧(1982-),男,土家族,湖北省恩施市人。湖北民族学院科技学院理学硕士学位。现为湖北民族学院科技学院讲师,从事计算机应用、生物数学研究。

作者单位

湖北民族学院科技学院 湖北省恩施市 445000