视频搜索范文

2024-08-29

视频搜索范文(精选5篇)

视频搜索 第1篇

随着互联网技术和视频网站的快速发展,互联网视频节目数量和用户数量大规模增长,视频作为资讯与娱乐内容的载体传播得更为迅速,而论坛、微博等应用更给视频内容的传播带来了社会化特征。同时IPTV、移动互联网等新的应用业务更是进一步将互联网视频内容推向了电视、手机等各种终端平台,大大推动了互联网视频内容的传播。视频数量和视频网站数量的快速增长,在满足网民个性化需求方面,迫切需要研究如何有效的对互联网上的海量视频数据进行采集、分析和搜索,为用户提供更好的视频服务体验。

从技术层面上,视频网站普遍采用HTTP传输协议以及FLV/MP4视频文件格式,采用AJAX等技术实现网页的动态更新,支持在线播放方式,在带宽合适的情况下视频文件在播放过程中不会出现长时间等待,无需用户预先下载节目到本地。从节目组织形态方面,视频网站采用剧集列表、专辑等多种新的视频组织形式,使得用户可以方便的从数以亿计的视频集合中找到其感兴趣的视频节目。而对于视频搜索引擎而言,则需要研究如何利用每个视频网站的上述数据特征,并在全网范围加以聚合和优化,以实现更好的用户体验。

互联网视频搜索需要在现有的文本与视频搜索[1]内容的基础上,结合视频网站数据的新特征,以提高视频搜索的有效性和针对性。互联网视频搜索首先以视频网站首页或排行榜为入口,采集其中的视频页面;将页面上的视频描述信息进行自动抽取,将视频文本描述存入视频文本数据库中;然后下载视频文件存入视频文件库中,同时对视频的内容进行分析,提取视频中具有代表性的图片帧作为视频关键帧,以此作为对视频内容的概要描述;其后根据视频文本数据库和视频节目库中的信息对视频进行分类和统计;在进行视频搜索时,系统对搜索结果自动聚类,去除重复视频并自动将互联网视频热点推送到用户面前,在搜索时也会根据用户的个人信息进行个性化推荐,向用户推荐最感兴趣的视频以及最热门的视频。互联网视频搜索涉及面向视频网站的视频节目采集、视频信息自动抽取、微博视频采集、视频节目下载、视频分类、视频热点发现等多项关键技术。

1 互联网视频搜索技术

1.1 视频节目采集

目前互联网上视频数量巨大,同时增长迅速,其中优酷、土豆网等网站的视频数量已突破千万。同时视频节目还可能嵌入在论坛、新闻、博客、微博等多种类型网页中,如何从大量的网页中高效的发现和采集这些视频节目具有很大的挑战性,这都给视频采集提出了极高的要求。

作为一类面向主题的采集,视频资源发现与采集是视频搜索的基础,数据采集的有效性、准确性以及数据质量将对搜索结果质量产生重大影响[2]。由于网站通常内容结构非常复杂,存在类似评论、相关链接等用户参与性网页和链接,对于视频采集器来说,需要采集的无关的网页数据量巨大,采集效率不高。同时由于Ajax技术的使用,给视频采集造成了更大的困难,如点击量、评论数等更新频繁,相关视频采用基于Ajax的动态网页生成,普通的爬虫无法采集到视频相关信息,甚至可能采集不到任何有用信息,造成数据不全。

为了提高视频网页获取的准确性和有效性,可用的方法包括:分析动态页面来实现音视频节目的自动发现;采用各种视频网页概率预测算法以提高采集的有效性;通过分布式并发采集和定制多种信息的更新策略来提高采集的效率;通过解释执行Javascript函数或采用网页链规则自动发现技术解决动态链接的发现问题;采用灵活的采集范围限制策略提高采集的针对性。

1.2 视频信息抽取

由于视频页面中存在大量无关信息,如广告、网站推荐链接,这些内容与视频本身关联不大,因此需要进行信息的自动抽取,提取视频的标题、简介、关键词、频道、发布时间、点击量、评论数等各种视频信息,形成完整的视频节目对象。以针对某视频网站的视频信息抽取为例,在通过视频网页抽取标题、描述等视频基本信息的同时,需要抽视频点击量、评论数等动态信息并跟踪其变化。图1是视频页面信息抽取样例图。

视频节目信息抽取主要包括基于模版的方法,模版的生成可以采用手工的的方法或基于统计的方法进行自动生成。信息抽取还需要将抽取出的数据进行归一化并入库。

1.3 微博视频采集

微博视频采集的主要目标是跟踪视频在微博上的传播情况,为视频搜索引擎推荐微博上的视频传播热点提供数据基础。通过分析微博网站,选取部分网页地址作为种子URL,其典型的页面如图2所示。

图2所表示的微博信息有两条(以红色的框为分割),第一条是转发信息,第二条是原创信息,微博信息通常由程序从数据库中读出后自动生成,都有良好的结构性。每条信息主要包括以下内容:该信息的原创作者,信息主题、转发作者(转发信息特有)、转发数量(转发信息特有)、评论数量、信息发布时间、转发时间(转发信息特有)。在微博采集时将以上网页地址放入URL采集队列,然后取出队列头部的一个URL,采集该URL对应页面的所有微博信息,利用信息抽取技术使其结构化,将采集后的每条信息存入数据库。采集一个页面的时候,要检查当前信息的发布时间是否早于上次采集该页面的时间来判断是否终止。另一方面,一个页面采集完成后,判断其是否有下一页或其它有效链接,将其加入URL采集队列的尾部。重复以上过程直至URL采集队列为空或者采集的页数大于等于预设的最大采集页数。在有的微博中,为了减少空间占用和减少网络流量,并不使用真实的较长的URL,而通过t.cn代理分配给每个真实视频URL一个唯一的较短的微博视频URL。通过地址分析可以获取其真实地址,从而获取到视频的标题、描述等相关信息。

1.4 视频节目下载

视频节目下载用于后续的音视频分析和处理,并在本地存储一段时间范围内的视频数据,确保即使在网站删除视频内容或网站无法访问的情况下也能保存数据,同时提供基于本地的视频播放服务,方便用户的操作。

与传统的网页下载相比,视音频节目的数据量较大,据统计现有在线视频的平均大小在15M左右,视音频下载对网络带宽和存储的需求都要求很高,需要为下载视频提供高效的带宽分配和存储解决方案,以较好的支持后续的视频点播和浏览服务。视频下载涉及的主要技术包括以下几方面:

下载任务调度:为了实现对大规模视频的快速下载,通常需要采用多机多任务并行下载的方式。具体采用基于网站的任务调度策略, 对来自不同网站的下载任务进行集中管理,当下载器有空闲处理能力时,向调度器请求下载任务。

视频地址发现:视频网站普遍采用Java Script等技术进行视频地址的隐藏,通过传统网页文本分析很难直接发现其视频真实地址。为此首先采用专门设计的地址提取器对其进行视频真实地址的分析,然后采用下载模块进行视频数据的下载。地址提取器分析并获取网页中所包含的视频的信息,包括视频的真实地址、视频的类型、长度等信息。

1.5 视频分类

视频分类主要依据文本和视频内容,依照一定的分类体系对视频节目进行归类,主要的分类方法包括:

基于文本的自动分类:基于字符串匹配的分类方法包括前缀模式、后缀模式和子串模式等。文本分类更多的借助模式分类的相关方法,如基于规则的分类方法和基于统计机器学习的方法,如K近邻分类、贝叶斯分类、决策树分类等。

基于视频内容分析的分类:对视频内容进行分析,提取有效特征,然后通过统计模型,将视频内容自动分类。

1.6 视频热点发现

视频热点主要包括热点视频节目、热点关键词、热点事件等几个层次[3]。热点视频节目主要通过综合统计来源于不同网站或同一网站的同名节目,综合考虑节目的点击量、评论数等各种因素以及这些因素的变动趋势来进行统计和分析;热点关键词统计通常基于节目的标签、标题、描述等,再去除其中的停用词,并综合考虑节目的权重和词频等因素,发现其中的热门词汇,并可以结合搜索日志等信息进行分析和整理;通过对视频节目聚类可以发现热门事件,并记录事件的演变趋势。

2 总结

与文字相比,视频获取的信息无疑将更加生动和直观,视频内容必将成为未来互联网络信息传播和娱乐的重要方式,IPTV、移动互联网等应用更是进一步加速了互联网内容视频化的进程,也为视频搜索的发展提供了新的机遇和挑战。

摘要:随着互联网技术和视频网站的快速发展, 互联网视频节目数量和用户数量大规模增长, 资讯与娱乐内容以视频形式作为媒介传播得更为迅速, 而论坛、微博等应用更给视频节目的传播带来了社会化特征, 网民对视频节目搜索的需求日益增加。视频节目搜索涉及视频采集、视频节目信息抽取、视频节目下载、微博视频采集、视频分类、视频热点发现等多项关键技术。

关键词:视频节目,互联网视频,搜索

参考文献

[1]李晓明, 闫宏飞, 王继明.搜索引擎原理、技术与系统[M], 北京:科学出版社, 2005年.

[2]李佳文.面向主题的互联网信息发现与采集[D], 中国科学院计算技术研究所硕士论文, 2009 (4) .

视频搜索 第2篇

——以用户需求和视频分享网站的发展为切入点

一.客户的要求永远都是“多、快、好、省”

关键词: VeryCD 公交车 淘宝 京东商城

1.30秒完成视频拷贝

四天之前(即2010年12月5号),我和师妹在北京语言大学的食堂吃饭,她问我:“师姐,你最近有没有找到《The Apprentice》 S10E09?(注:《The Apprentice》 美国的NBC电视台2010年秋季播放的一个真人秀节目,中文译名《学徒》或者《飞黄腾达》每周播放一集)我在百度视频搜索里看到11月份的E08就再也找不到新的了,已经有一个月没有人在土豆或者优酷上更新了……”我回答说:“我最近也发现一个奇怪的事情,新浪微博里很多人推荐的电影链接都打不开了,我只打开过一个还是在56.com上。”奇怪……

午饭回来,我又点开百度视频搜索,再一次输入关键词“学徒 第十季 09” 依然一无所获,都到12月了,为什么还没有更新?我心中疑虑顿生。突然想到了“飞黄腾达”的百度贴吧,看有没有人和我有同样的疑问,飞快进入,果然有4个帖子是问为什么从11月份之后《学徒》在网上就找不到了的帖子,不过没有人回答。但是,有1个帖子已经开始讨论“S10E11中David表现是如何之傻”之类。我心中一惊,网上有人已经看到10集了,我还在找第9集。这里面一定有问题,太奇怪了……

改变搜索习惯,放弃百度视频搜索,来到百度网页搜索。关键词依旧是“ 学徒 第十季 09 ”,赫然看到射手网的“学徒字幕11集下载”的字样,焦躁不已,都到11集了。灵机一闪,既然各大视频网站上看不到,那就看能不能下载。去迅雷,BT,VeryCD上试试看。点击收藏夹,直接跳到我最常去的VeryCD,键入关键词,马上找到了11月份的3集最新视频,一阵狂喜,用了2个小时把它们下载下来。不过说实话,这三集加在一起的时间也就2个小时(每季40分钟左右),通过下载的方式来看美剧虽然清晰度比在线观看要好很多,但时间成本太高,我还是倾向于在线观看,方便直接。

给师妹了一个短信,2分钟之后,她拿着USB数据线和三星移动硬盘来了,用了不到30秒,完成了全部视频的拷贝工作。“太感谢你了,要是以后都能像这次一样,30秒就可以的看到原版美剧,我就不去土豆,优酷,56.com的那些网站上天天搜索了,太累了,也没有这个清晰。”她一脸遗憾,好像这次用一条数据线,花30秒钟,免费看到3集原版美剧的完美体验是永远无法重复的事情一样。至少,在那天的狂喜之后,她带着自己的硬盘和一丝不易察觉的遗憾离开了。

于是,我在想那“一丝不易察觉的遗憾”意味着什么?

2.两块钱和两毛钱的区别意味着什么 下午一口气把三集全看了,喝了杯水,看了一下百度“飞黄腾达”贴吧里的讨论,有几个帖子感觉“于吾心有戚戚焉”,心情一片大好。抬头看窗外已经全黑,于是决定果断放弃食堂,步行去五道口吃饭,慢慢地享受一下这份愉悦的心情。

307路公交车在学院路上缓缓爬行着,这天和往常的每一天没有任何区别,依旧是车山车海,堵成一片。步行应该是此时最便捷的短途出行方式,当我看到那些在等待回家的上班族顶着寒风立在307站牌旁时,我想如果是长途,我只会选择地铁而不是公交,因为它速度快,虽然地铁的价格是2块,而公交车学生卡的价格是2毛。速度快,提高了出行效率,相应的价格也会较高,这就是2块钱的价值所在。效率高,节省时间的商品或者服务理所应当会在市场上处于优势地位,获得相应较高的价值体现。

307站牌的旁边张贴着巨大的广告海报,凡客诚品的男女模特穿着2011年的时尚春装,看着前方,眼神迷离,个性十足。旁边的那张朱红的巨幅广告上赫然写着“淘宝商城”四个大字。但是,自从来北京之后,我已经不去淘宝了、淘宝商城就更不用说了,淘宝的账号好久都没有用了,阿里旺旺也从电脑上卸载了。为什么?因为不需要了。

淘宝培养中国网民养成了在网上购物的习惯,但是,在网上拍完商品之后,用户要承受因远距离而带来的运费和漫长的货流运输时间,从当当,卓越,京东商城前后推出货到付快和运费全免的政策后,淘宝的劣势就初见端倪了。两年以前,马云更因淘宝假货充斥而遭遇尴尬时刻。淘宝的商品确实很多,但是因为大而全,所以良莠不齐,好坏难辨。淘宝商城应运而生,保证全场正货,努力向着提供“质量好的产品”方向发展。但是从那之后,taobao.com已经渐渐淡出了我的“网上购物”收藏夹。因为如果淘宝和淘宝商城教会我体验什么叫“多”和“好”的话,那么当当,卓越,京东商城的购物体验教会了我什么叫“多、快、好、省”。

我突然想到了中午师妹“那一丝不易察觉的遗憾”究竟代表着什么?无论是对于已经存在几十年的交通工具还是近几年刚出现的购物网站,作为一种对金钱和时间的消费行为,人们对于为他们提供的商品的服务商永远抱有“多、快、好、省”的愿望和期待。观看视频,实际上是对个人时间的一种消费,每个人都希望自己可以在有限的时间里花最小的代价得到清晰度高,流畅度好,内容丰富的视频资料,正如我的那个小师妹30秒钟通过拷贝得到了《飞黄腾达》的原版视频那样。

那么,对于提供视频服务的网站来说,他们要解决的问题便是:

二、究竟要多多?要多快?要多好?要多省?

关键词:浮躁与理性 高清与流畅度 盗版与正版 盈利模式

1.喧嚣的视频网站

早年国内的视频网站紧随美国YouTube的风潮,群雄并起。一时之间,土豆网,优酷,56.com,酷6,新浪互联星空,六房间等网站如雨后春笋般出现,大有逐鹿中原的架势。这些网站在视频内容上基本上如同早年的淘宝,处在大而全的原始竞争中。要多多就有多多,中国第六代导演贾樟柯遭禁播的《小武》到法国备受争议的热门导演波兰斯基的《红》、《白》,《蓝》。只有你想不到的,没有你看不到的。韩剧大行其道,美剧紧随其后,电视的统治地位在这两股风潮的席卷下已经摇摇欲坠。电视会不会消失?报纸会不会消失?电台会不会消失?电影院会不会消失?这是当时人们茶余饭后喜闻乐道的话题。还记得当年无论是雅思作文还是托福作文,备考题库中必然有一道是“网络会不会代替电视和报纸,陈述你的观点并说明你的理由。”

早期网络视频的出现,确实极大地缓解了当时网民急切需要满足的多媒体视听需求同以电视为唯一输出媒介而造成的多媒体视听资源不足的矛盾。电视一夜之间从神坛坠落,视频网站风靡大江南北。同学之间以知“土豆”、“优酷”为荣,以不知为耻,其流行程度可见一斑。

2.视频网站的三大悖论

在浮躁和繁荣并存的形势下,视频网站开始了技术层面的第一次混战,焦点有两个流畅性和清晰度。为了增加视频播放的流畅性,土豆网突出了飞速土豆,优酷网,56.com,ku6也纷纷推出了自己的加速器,但是,最终,作为一个用户来说还是以优酷的i酷加速器效果最为显著。高清和流畅度是视频网站的第一个悖论,画面越高清数据流量就越大,就很难同时保持视频的连续性,但是,为了增加用户的粘性,搜狐推出了高清频道,土豆,优酷也把很多高清视频加上了“hd”标记。正当高清战在视频界打得不可开交的时候,很多高清电影,高清韩剧、美剧一夜之间销声匿迹。于是便有了开头我和师妹的那个讨论,这些美剧为什么不在视频网站上更新了呢?

因为关于中国视频网站的第二个的悖论:正版和盗版的“版权战”已经开响。其实,搜狐作为一个门户网站,开通搜狐视频频道之初,就不惜高价重金购买了《迷失》、《绯闻女孩》等热播剧版权,雄厚的资金实力不可小觑。如果说视频网站在初期遇到的是诸如清晰度和流畅之类的技术壁垒的话,那么,“版权战”的实质就是资金壁垒。谁能够获得国外热播电视剧和电影的中国网络播放版权,谁就能在这次市场洗牌中脱颖而出。作为一名学生,平常看得较多的美剧,现在我仅能够在搜狐高清频道和奇艺网上找到美剧的身影。土豆,优酷等只能看到泰国,日本,韩国,香港等东南亚地区的电视剧及电影。美剧的版权太贵,相比之下,东南亚地区的版权则便宜很多。作为一名美剧控,我想未来的竞争已经在搜狐高清和奇艺网之间展开。

在“版权战”过程中,我们看到了视频网站花重金向美国,日韩,港台的视频制作机构(大部分是电视台和电影公司)购买电视剧和电影版权的现象。在网络视频把电视从神坛上拉下来之后,两者开始从分隔对立的状态走到了互惠合作的谈判桌前。电视媒体提供优质电视剧,而视频网站则通过购买版权获得自己的流量和点击率。但很显然,优质,高清,口碑好的视频价格一定很高,除了引进版权,只能走投入资金,自己制作视频的道路。在十一月份,红遍中国网络的11度青春电影《老男孩》便是由优酷网出品一部自制电影短片。电影短片的制作发行,本来应该是电影集团或者电视集团的角色,优酷从视频分享网站走向电影短片制作方向,向着自己产业链的上游做了一次有意义的尝试。

在版权战和资金壁垒的压力下,优酷已经开始出现某种程度的产业链整合。这样的跨界发展,在最近的一年的网络视频产业中屡见不鲜。作为国家最大电视台制作平台的中央电视台在2009年底推出了独立播放CCTV节目的CNTV.cn,而独占中文搜索鳌头的百度公司在今年年初也顺势推出了旗下的视频网站奇艺网。这不得不让人想到国际媒体大鳄鲁伯特·默多克以及他身后集广播、影视、报业等领域为一体的传播媒介帝国。反观这个集横跨多行业,发展相当成熟的跨过媒体集团的发展历程,有一点可以确定:任何一种媒介都只是传播内容的一种手段,最核心的东西是“内容”。所有的媒介传播形式,只有“多,快,省”地提供“好”的“内容”,这些媒介才有存在的价值。在中国视频网络经历了“技术战”、“版权站”之后,聚焦好的内容,用雄厚的资金抢占优质影视资源成为了各大公司的首要任务。这是一个“内容为王”的年代。

三、未来网络视频将向何处发展? 关键词:hulu YouTube 分享 整合

前一段时间网上对于美国hulu模式讨论的很热烈,原因是YouTube到目前为止还没有找到自己的盈利模式,而hulu却轻而易举实现了盈利。Hulu提倡用“最简单的方式以最佳体验看到最高质量的视频”的精英路线,所以广告商趋之若鹜。而YouTube更加提倡用户参与,支持视频分享和视频上传,走更加平民化的路线。但是,更加符合Web2.0自由,分享精神的YouTube并没在商业成功,这十分耐人寻味。

视频搜索 第3篇

客流信息是重要交通流数据之一, 是开展运输组织和管理工作的主要依据。随着智能交通的发展, 对客流信息获取的渠道、技术、质量、速度等都提出更高的要求。常见的客流计数实现技术包括:压敏传感、红外检测、光电脉冲检测、视频分析等[1]。在视频监控技术被广泛应用到交通领域的背景下, 基于视频分析的客流计数技术逐渐成为主要研究方向之一。调查发现, 在实际中该技术具有迫切的应用需求, 例如:机场、火车站、地铁站等重要交通枢纽及火车、长途大巴车、公交车等交通工具。

目前国内外已有大量关于视频分析在客流计数上的应用研究, 根据研究的视觉维度可将其大致分为两大类:基于立体摄像机和基于单摄像机。基于立体摄像机的视频客流计数系统结构复杂, 目标空间参数计算耗时长[2], 多数研究更倾向于采用基于单摄像机的二维视频图像序列。根据计数原理可以将客流计数方法分两大类:基于线性回归的人流计数和基于区域估计的人流计数。

(1) 基于线性回归的客流计数

线性回归计数的原理是在图像中设置检测线, 将跟踪的目标位置或特征信息与检测线进行线性拟合, 从而估计出客流数目。在此类算法中, 目标的质心、外轮廓边缘线、某一局部特征 (头部、头肩、颜色) 等常被作为目标跟踪的对象。文献[3]在公交环境下记录乘客目标在图像序列中的运动轨迹, 通过目标轨迹线与进出口检测线的相交方式来判断乘客的上下车行为。文献[4]利用椭圆检测将 “团块”中的多目标分割, 解决拥挤状态下多目标计数问题。文献[5]提出一种基于双椭圆模型的视频人数统计方法适合多种镜头方式、人群密集、部分遮挡等环境下的人流计数。文献[6]使用“ Ω ”型头肩轮廓特征在前景图像上对人体目标进行匹配, 进而进行识别计数。文献[7]在目标区域内利用估计的头部平均面积提取人体头部作为计数的对象。文献[8]使用Hough变换识别圆形物体的原理检测人头, 对人头进行定位。文献[9]基于XYZ和HSV颜色空间构建了一个行人发色和肤色检测模型, 通过对发色和肤色的双重检测从而确定人头位置。线性回归计数算法属于直接的计数方法, 在算法中要求对单个目标准确识别及跟踪, 因而对目标分割及跟踪的精确性要求较高。

(2) 基于区域估计的客流计数

区域估计计数是通过在一定时间周期内对图像检测区域中的目标特征向量进行估计实现计数, 是间接的计数方法。在算法中经常使用模型学习的方法对目标的面积、轮廓、人脸、头部、头肩模型、着装颜色等目标特征向量进行识别计数。文献[10]通过搜集低水平集和高水平集目标跟踪的数据, 使用Adaboost算法对目标跟踪数据进行分类识别得到跟踪的目标数。文献[11]利用Adaboost对检测区域总的人脸进行识别计数。文献[12]使用SVM对所构的人体头肩模型进行学习, 实现对行人数目计数。文献[13]将图像分割和纹理提取为数据序列, 使用RBF神经网络算法对数据序列进行学习, 从而实现对人体的识别与计数。文献[14]使用动态纹理模型将多个目标分割为不同运动方向“团块”, 再采用贝叶斯归回归模型对从“团块”中提取低级特征 (Low-Level Features) 进行学习, 实现对不同方向行人的估计。因而基于区域估计的计数算法依赖于模型学习算法, 而很多模型计算复杂且需要经过大量样本训练, 难以做到实时计数。

从上述分析可知, 基于视频分析的客流计数方法多种多样, 每一种方法都是针对具体应用而提出, 计数精度很大程度上依赖于对象分割和目标跟踪的准确性, 而现阶段这两者理论算法均尚未成熟, 尤其要实现运动目标准确跟踪仍然非常困难。本文以视频客流计数在长途大巴车的应用为背景, 直接在对象分割的基础上设计视频客流计数系统, 以减少跟踪算法效率对计数准确性的影响, 并使系统具有超载报警和智能结算等功能。视频客流计数系统结构如图1所示。

2 乘客目标分割

目标分割是实现目标跟踪和目标计数的重要前提条件, 其提取效果直接影响计数的准确性。背景减法是利用当前图像与背景图像的差分结果来检测出运动区域, 由于算法能够提取较为完整的前景目标且背景建模和背景更新算法研究有巨大的进步空间, 因而该项目标检测技术得到广泛应用及研究, 相关算法及改进算法层出不穷。本文使用视频序列中不包含乘客目标的第一帧作为初始背景, 再不断利用符合背景要求的图像对背景进行更新。假设背景图像为B (x, y) , 当前图像f (x, y) , 两图像像素之差diff, 阈值为T, 则:

经过式 (1) 、式 (2) 运算得到背景减法结果图像中往往存在噪声, 传统检测算法常使用图像滤波、数学形态学、图像二值化等技术对图像后处理, 这类做法有利于下一阶段的目标识别、跟踪等, 但却使提取的目标失去了原始的信息。为了利用目标的原始像素并减少繁琐的后处理技术环节, 本文提出一种基于目标的原始乘客像素统计的视频乘客计数算法。

3 基于像素统计的乘客计数方法

3.1 算法思想

视频图像经过目标检测算法处理后, 图像中多数非零像素都聚集在目标区域, 而背景区域除了少量噪声外大部分为黑色 (即像素值为0) , 如图2所示。根据目标检测结果图中非零像素的这个分布特征, 本文在图像中间设置检测区域 (ROI) , 对区域内的非零像素数目进行统计, 并通过对检测区域内的像素统计规律识别达到乘客计数的目的。检测区域大小要求能包含一个体型较大的乘客, 同时又能够恰好将前后的乘客分开, 通过大量的实验观测得到检测区域的合适尺寸为100×200像素 (在图像中100×200像素的矩形框尺寸对应客车两个台阶的面积, 通常乘客上车过程中这个尺寸范围能够检测得到目标像素最多) , 如图2中白色矩形框所示。

从图2可以看出, 在第126帧时乘客到达检测区域右侧, 检测区域内非零像素数目较少;图2 (b) 中在第140帧时, 乘客目标头部进入检测区域, 区域内非零像素数目逐渐增加;图2 (c) 中在第154帧时, 乘客身体进入检测区域, 此时检测区域内非零像素数目达到一个较大值。图2 (d) 中在第173帧时, 乘客目标离开检测区域, 检测区域内非零像素恢复到较低值。可知在第126帧~154帧, 检测区域内像素是非线性上升的过程, 而从154帧~173帧, 检测区域内非零像素数目处于非线性下降的过程。通过对126帧~173帧视频序列中检测区域内非零像素数目的变化统计得到如图3所示的曲线。从图3可以看出, 当一个乘客通过检测区域时, 区域内非零像素数目呈现非线性上升至最大峰值, 再由最大值逐渐下降至较低值的变化规律。在统计曲线上, 除了最大的波峰外还分布许多小波峰, 称之为“毛刺”, 这是由于背景光线改变、乘客运动发生形变、目标检测算法效果等因素引起的。根据乘客的运动可知通常情况下乘客在视频序列中存在时间较长, 所占的帧数较多对应波峰宽度较大的波峰, 而由其他因素引起的波峰宽度较小, 大多属于“毛刺”。因此可以认为在像素统计曲线上每个局部极大波峰与一个乘客目标对应。

对录制的乘客上车视频序列进行检测区域非零像素数目统计, 其中前7位上车乘客对应的曲线如图4所示。从图4曲线可以看出, 曲线上形成7个较为明显的波峰, 对应如图5所示的前7位乘客组成的乘客上车视频序列。当乘客以较快的速度通过检测区域时, 其在视频序列中存在的时间较短, 波峰宽度相对较小, 以较慢的速度通过时, 则得到宽度较大的局部波峰。当前后乘客相邻的间隔较大时, 波峰波谷较为明显, 而当间隔较小时, 波峰波谷特征减弱。峰值的大小则反映乘客的形体、目标检测算法能够提取的目标有效面积像素等。可见当乘客连续通过检测区域时非零像素统计结果为一条波峰波谷明显的曲线, 通过对曲线上波峰波谷进行识别统计, 就可实现对乘客的计数。

3.2 加权步长波峰搜索识别算法

由于曲线上 “毛刺”的存在使得波峰识别变得困难。根据对乘客像素统计曲线的分析, 本文提出一种基于加权步长的波峰搜索识别算法, 其基本算法原理是选择一个固定宽度的搜索窗口在频谱曲线上进行滑动, 在这过程中求窗口两端点的像素差值, 将得到的差值与不同等级的阈值进行比较, 确定曲线上升或下降的步长权值, 归一化差值 (差值≥0, 归一化为1;<0, 则归一化为-1) , 具体算法流程如图6所示:

加权步长波峰搜索识别算法能够将正弦曲线转换为方波, 通过对方波的识别实现对其波峰、波谷的统计。采用算法对图5单人间隔上车视频序列多目标通过像素统计曲线进行处理, 得到如图7所示的方波图, 将其与图4的带“毛刺”的正弦曲线相比较, 明显方波更便于识别统计。通过多次实验验证, 证明本文提出的基于加权步长的波峰搜索识别算法对于带“毛刺”但存在有明显波峰波谷的信号波具有良好的识别效果。

4 试验及结果分析

本论文在Windows XP环境下采用C++语言及Open CV图像处理库函数实现系统, 系统整体算法流程如图8所示, 系统界面如图9所示。用户可手动输入汽车的牌照号、额定载客人数、运营线路等相关车辆信息, 然后选择测试视频样本, 自动乘客计数系统就能够自动计算出乘客人数, 将计数结果传输给超载警报系统做判定, 同时把数据传送到结算报告系统, 通过超载警报子系统和结算报告系统的处理, 系统最后输出最终结果。

使用录制的多乘客视频资料对系统进行测试, 证实系统能够实现预期的乘客计数、超载报警、结算报告功能。对大巴车上乘客有秩序上下车视频序列, 系统能够准确记录不同时段上下车的人数, 并在超载的情况下发出报警信息, 最后自动生成运营报告。然而目前视频计数系统乘客计数的精度只达到90%, 要将该系统应用到实际中还有一定困难。除了要提高视频计数系统的准确性外, 还需完善中央处理系统、超载警报系统、结算报告系统等, 使输出的最终结果更直观可靠。在提高软件功能同时考虑软、硬件之间的结合问题, 如数字信号处理器 (Digital Signal Processing, DSP) 的选择, 视频计数系统与车载GPS平台的相互融合, 无线通信模块配置等。

5 结语

视频搜索 第4篇

百度没有想到,扶持旗下视频网站奇艺的同时,却也为自己带来了一个竞争对手。

日前,视频网站优酷推出视频垂直搜索品牌“搜库”,希望此举能帮助优酷和其他视频网站摆脱传统搜索引擎对它们的控制。这一举动,意味着优酷将与百度在视频搜索方面展开正面竞争。

对于公司的这一险招,优酷网CTO姚键坦言并不惧怕来自百度视频搜索方面的压力。在他看来,与传统搜索引擎相比,在视频领域拥有成熟运营经验的优酷对于视频用户行为的把握度会更高,在提供视频搜索内容时可以更加贴近用户的需求。

作为一个垂直搜索引擎,搜库的视频内容会根据影视剧的热度来排序,追求“快、专、热”会成为搜库视频搜索的宗旨,而百度作为传统的搜索引擎工具,更多的是为用户提供一个“大而全”的内容呈现。

姚键颇具信心地说:“单就视频搜索来说,百度在这个方面并不比搜库有优势。”但在业内看来,优酷这一制衡奇艺,挑战百度权威的举动过于冒险。如果承担优酷这一希望的搜库上线后不温不火,优酷将更加难从百度等通用搜索那里得到流量。

挑战者优酷能打赢这背水一战吗?

得此失彼

视频网站奇艺的崛起,离不开百度的帮扶。

2010年1月6日,百度宣布正式组建独立网络视频公司。2010年2月24日,百度宣布,奇艺网获得美国私募股权投资公司普罗维登斯资本5000万美元投资,公司由百度控股。

在奇艺成立之初,百度并未投入现金,而是以流量入股。百度通过对搜索结果的干涉——当用户搜索某部电视剧或者电影时,奇艺总是能够出现在搜索结果的最上方,从而得到用户。对于业内的指责,奇艺网CEO龚宇曾对此回应,称“奇艺只是百度的合资子公司,按照《反不正当竞争法》,根本不存在这种问题。百度视频坚持的原则是,只有画面清晰度、流畅度做到最好的,才会予以推荐”。

根据艾瑞的数据,奇艺在用户规模上已经位列视频行业第七,用户时长则排名第四。事实上,是百度的流量导入成就了奇艺如今的成绩。正因有百度流量的支持,奇艺从一开始就强调不会烧钱购买独播剧。但现在奇艺一改往日姿态,开始购买独播剧,这一变化源于奇艺遭到了其他视频行业大佬的“围剿”。

奇艺不买独播剧的理由很简单,只要花上更少的钱购入非独播剧,用户一旦在百度上搜索,自然会被带到奇艺。于是,奇艺遭到其他视频网站的“围剿”——“不卖剧”给奇艺。据了解,目前视频网站都在重金购买影视剧的独家网络版权,但视频版权价格在三年内已经涨了上百倍,甚至一集超过80万元。各家视频网站在购得独家版权后为减低成本压力,便分销给其他网站。优酷、土豆、搜狐视频、迅雷这些曾经打得不可开交的视频网站,如今也会互相分销最热门的影视剧,但它们却对奇艺的求购说“NO”。例如在今年最热门的剧集上,优酷分销《裸婚时代》、搜狐分销《新还珠格格》,但它们均唯独不卖给奇艺。

日前,在优酷黄金资源推介会上,优酷网总编辑朱向阳表示,下半年优酷将推150部热剧,其中50部为优酷独家。“优酷2011年将在内容储备、市场规模、收入水平、用户数量等各个维度进一步拉开与竞争对手的差距。”朱向阳说。据内幕人士介绍,优酷、搜狐视频等视频网站不分销影视剧给奇艺,实际上是对百度将流量导给奇艺的一种抗议。对奇艺而言,如果买不到最新的热门剧,即使有百度的搜索支持,也将会陷入“无米之炊”的窘境。因此,奇艺如今高价购买独播剧,主要是为了和其他视频网站交换,但这意味着奇艺的运营成本将大大上升。

而且更重要的是,百度通过流量帮助奇艺,也让自己失去了其他视频网站的广告投放。据业内消息灵通人士透露,资金紧张的奇艺在今年上半年曾与优酷接触,希望被后者并购,但优酷并未接受,原因在于优酷认为奇艺估值过高,而且其最大的价值在于百度的流量,如果没有了百度的流量支持,优酷收购奇艺的价值不大。

优酷抵制

在百度的帮助下,奇艺一天天壮大。然而,百度在流量上对奇艺的帮助,却引来了其他视频网站的抵制。

百度对奇艺的流量贡献有多大?奇艺CEO龚宇透露,现在,奇艺的流量有45%由百度提供,其余55%的流量来自用户的主动访问和很少的一些网络推广。“在不损害百度自身价值的前提下,以合适的方式为奇艺带来流量。”龚宇对此解释,“如果奇艺的视频清晰度和播放流畅性能够满足全行业最好的质量要求条件,百度的搜索结果会把奇艺排在靠前的位置。”这意味着,经由百度搜索得到的视频结果,随时有被奇艺“劫道”的可能。

对此,优酷率先反击。日前,优酷CTO姚键称,优酷推出的自有搜索引擎搜库是全网搜索,收录了土豆、奇艺、乐视等视频网站的内容。优酷把搜库打造成视频领域里的专业入口,搜索结果根据视频的热度、点击率、播放平台质量、播放量等多种因素进行排序。

《IT时代周刊》在采访中了解到,优酷推搜库的原因之一是目前百度、谷歌给优酷带来的流量“少得可怜”。而视频用户对搜索的依赖性却越来越大,搜索已成为视频应用的重要组成部分。据中国互联网络信息中心(CNNIC)发布的调查结果显示,用户获知视频的途径有71.6%是通过搜索引擎。据悉,古永锵为尽力避免未来对搜索引擎的依赖,早在2008年底就曾主动屏蔽百度视频搜索,声称优酷要做自己的视频搜索。

视频网站依赖于搜索引擎的原因在于,国内网络视频行业目前尚没有一个在品牌方面绝对领先的网站品牌出现。另外,相对于内容版权垄断在几家大媒体集团手中的国外市场不同的是,国内视频版权拥有者过于分散。中影、华谊、湖南广电、海润等内容提供商虽然拥有较多的内容资源,但在全国网络视频内容中所占的比例仍然不高。加之视频网站之间对“独播权”的争夺,导致即使排名靠前的网站仍难以掌握所有内容,使得用户需求很难在一家网站中得到满足。

面对百度的搜索优势,优酷等视频网站十分被动。优酷需要作出反击,来保住自己在行业内的龙头地位。据悉,目前优酷推出的搜库搜索,不但能快速推荐给用户基于当前网速环境下的最合适视频,保障观看的流畅性,而且,搜库针对影视剧结果特别设计了专属页面,除正片外还提供相关新闻、 预告片、评论、MV等专业信息,并引入来自豆瓣的点评、打分信息。此外,搜库还开发了全新排序算法,热门内容会被重点推荐,使得搜索结果更具指导性。

据悉,搜库上线后,土豆网、CNTV、新浪、乐视等10余家网站的视频内容已被接入,用户在搜库平台上进行视频搜索时,上述10余家网站提供的内容都会进行排序呈现。对于收录的对象,姚键则表示,目前只会去收录国内一些播放流畅的视频网站,在进行内容排序时,会根据一些视频内容的关注度、清晰度以及地域特征进行综合判定,流量最高的视频内容也会被排到搜索结果的最前面。

百度没想到,自己为了扶持奇艺成长,竟然也无意识地为自己树立了一个对手。

坐收渔利

当奇艺陷入“剧荒”的同时,优酷却布下一个大大的“局”。现在,优酷推视频搜索,除了想摆脱对百度的依赖外,还有着自己的野心。

早在2011年初,优酷CEO古永锵就提出“只要是视频,优酷什么都做”的野心。作为目前国内唯一拿到视频搜索牌照和唯一专注视频行业的搜索引擎,搜库的推出,意味着视频作为互联网的主流应用,在功能上开始细分。这也是优酷经过近5年的运营,经过对用户行为的全面分析而作出的战略布局。

事实上,视频行业目前正在发生着一些新的变化,特别是在用户获取视频的方式上。以前,用户主要通过视频网站的推荐以及传统的搜索引擎获取视频。随着视频应用的发展,用户对专业视频搜索引擎的需求变得非常迫切,更为专业的视频分类检索以及根据用户喜好推荐相关视频,成为获取视频的重要方式。

对此,姚键认为“搜”与“找”是两个程度不一、应用截然不同的应用习惯。“搜是一个动作,是为实现找的目标而进行的一个短暂行为;而找则是一种途径化的习惯。”姚键说,“优酷更关注用户所处地域带宽环境以及使用感受,因此推出了更贴近用户的产品。”

但无论优酷如何为自己的战略辩解,搜库的推出意味着它与百度之间成为对手。作为搜索领域的新军,优酷在搜索上的征途能否顺利?业内认为,视频网站推出视频搜索能否成功的关键因素在于保持真正的开放、公正。否则,它就会沦落为优酷自家的搜索。

分析人士指出,视频搜索与传统的文字搜索存在着很大的差别。从目前视频搜索的结果来看,几大主流网站提供的内容同质化过于严重,结果呈现出来之时会让用户感觉比较迷茫。“但一旦省去某些网站的视频内容,又会引起‘刻意屏蔽、不良竞争’之类的说法,因此,这成为视频搜索目前遇到的一个比较麻烦的问题。”

对此质疑,姚键解释道,搜库的定位是做一个独立的视频搜索平台,是优酷在视频领域的全面创新。5年前,优酷凭借“快者为王”的产品理念贴近用户需求,全面培养中国互联网用户的视频使用习惯;5年后,借由搜库的推出,优酷将更紧密地结合当下成熟的视频用户需求,为用户创造更优、更酷的视频体验,相信专注视频搜索的搜库,将全面颠覆用户在找视频、搜视频方面的体验。

视频搜索 第5篇

1 三步全搜索运动估计算法设计

1. 1 算法评定

在前一帧搜索区域里寻求与当前模块匹配值最高的点, 就是运动估计。运动估计越准确, 那么相似度就大。这样一来, 相对应就有压缩性愈好, 传输的残差块像素会愈少。从时间和效果的客观角度上可以判定某种算法是否较好, 所以可以从耗费搜索时间的长短进行比较, 以及用直接的人眼感官来判断匹配度是否高。然而人眼所观察的图像是带有人的主观意识的, 显然是不太精确的。依靠人眼判断, 没有说服力。在这里需要采用科学依据的客观标准去判定, 所以采用最常用的峰值信噪比 ( peak signal noise ratio, PSNR ) 来作为衡量匹配效果的判断依据, 其公式为:

通过计算得到的PSNR大, 那么说明其图像质量较高, 相应地其值小, 图像质量就较差。由于PSNR的运算简便且客观, 便于真实反映出图像质量, 所以这种方法运用较为广泛。

1. 2 估计精度

由于运动是连续的, 所以彼此相邻两帧可能是按1 /2 或者1 /4 的像素等亚像素作为运动单位, 而不可能按整像素为基本单位进行运动。视频序列分别以1 /2、1 /4、1 /8 像素精度进行编码, 如图1 所示。在图中可以观察到用1 /4 像素精度时的编码效率, 与1 /2 像素精度相比, 就有了很明显的提高。然而1 /8、1 /4 像素精度的编码效率却没有明显提高。而因1 /8 像素需要的内插公式较为复杂, 于是通常用1 /4 像素精度的运动矢量模型替代。

采用亚像素的运动估计是为提高运动估计的准确度, 这种方法虽然从某种意义上提高了性能, 可是又使得计算量变得很大。亚像素在参考图像中是没有的, 其像素值要凭借邻近已编码点的像素以某种准则内插才能得到。亚像素运动估计一般会在整像素搜索得到的最优匹配点的旁边插值而得到一个虚拟的亚像素块, 把步长以分数的方式开始下一步的搜索。由于实现亚像素运动估计比较困难, 另外作者的能力以及时间都有限, 在这里只能对整像素运动估计进行研究。

1. 3 三步搜索法的改进过程

由于在估计运动不剧烈的的运动里, 三步搜索法 ( TSS, three-step search method) 算法存在缺陷, 所以用新三步搜索法 ( new three-step search method, NTSS) 算法来解决此问题。新的三步法如图2 所示, 在第一步搜索之上添有对中心点8 个领域的测试, 而且运用了提前结束的方式, 假如最小的块失真度 ( block distortion measure, BDM) 在8 邻域的中心, 那么就会结束搜索, 这对估计静止块是十分有效的。其过程分为两步。第一步: 在三步法中的第一步添加对中心点8 个领域的测试。第二步: 提前结束策略对估计静止块、亚静止快的运动矢量有较大的优势。若第一步最小的BDM处于搜索窗口中心, 那么停止搜索。若出现在中心点的8 邻域中, 则以最小BDM为中心计算其8 个邻域, 重复这一步, 一直到最小BDM在中心为止。若最小BDM在w /2上, 然后就按三步搜索法的第二步以及第三步运行, 找到最优运动矢量。完成全部的步骤, NTSS算法需要测试33 个点, 但有时会在第一步或第二步时提前结束, 然而静止的块只用测16 个点, 亚静止的块只用测试20 或21 个点, 因此NTSS与TSS相比下有优化, 大概有19% 的提速。

2 三步全搜索运动估计硬件结构设计及验证

2. 1 整体结构

通过现有的硬件结构特点, 这里首先给出本文的数据流及结构模块, 结构示意如图3 所示。

由图3 中可知, 整个结构分为5 个部分, 独立工作并且配合完成全搜索运动估计算法。开始要把当前帧的数据以分块的大小, 依次写进到片外存储单元c里, 搜索区域中的数据按对应块的顺序, 外存储单元的p里存偶数, p'里存奇数。再接着, 在进行匹配运算后, c里的数据串行到PE ( 处理单元) 里, p和p'的数据由数据选择单元的控制, 在恰当时间里送给对应的PE里做匹配运算。任意一个PE运算时会累加匹配运算结果, 会得到参考块的SAD值, 如果接收到计数满16, 就会计算下一个当前块的匹配运算, 同时把SAD值送入比较器作比较。如果PE0满16, 会把最终累加得到的SAD值送入比较单元, 作为最小的SAD, 同时记录下相应的坐标信息。PE0 的SAD值都和匹配后得到其他15 个块的SAD值都做比较, 并更新最小SAD值和相应的坐标信息, 在所有参考块的SAD值都做完比较以后, 经过控制单元, 输出最小SAD值以及对应的运动矢量。

2. 2 存储单元功能模块

当前块数据以及参考帧搜索区域数据的存取是组成此模块数据的存取。在复位信号发生后, 数据会跟随时钟相继输出, 一直会将所有存在的数据都输出完。根据需要也会将一类无用数据以0 的方式进行填补, 然而在计算过程中, 它们没有参入, 但是方便了数据的管理, 于是就有了这个结构的数据流。一般来说, 用三个存储体将数据流进行存储。把当前帧数据以分块的大小, 写到片外存储单元c里, 在片外存储单元的p、p'分别对应地将偶数、奇数按照搜索区域中的数据以对应块的顺序写入其中。控制片外存储单元c, 如图4 所示。

上述的控制片外存储单元c的Modelsim仿真波形结果如图5 所示。

从波形中可以看出, 复位信号到来后, 每一个时钟的上升沿输出一个数据, 满足设计要求。片外存储单元的p和片外存储单元的p'的控制和片外存储单元的c基本一样, 这里就不再做具体的描述。由图中波形可知, 若复位信号发生, 每一个时钟的上升沿输出一个数据, 符合了设计要求。片外存储单元的p、p'的控制和c基本相同, 具体描述就不再重复。

2. 3 数据选择功能模块

由数据流可知, 当前块数据流c由PE0 起始, 按照串行输入的方式进行, 同时在PE间依次顺序传递, 而数据流p、p', 需在psel信号下, 按需分配到每个PE处理单元, 在其中进行匹配运算。若psel = 0, 那么PE中会有选择数据流p进入, 与数据流c中的数据进行匹配运算。若psel = 1, 那么PE中会有选择数据流p进入, 与数据流c中的数据进行匹配运算。依照表1 数据流可知, 数据选择信号psel具有较强的规律, 同时可进行传递。另外补充说明, psel会在PE运算模块换行时有一次跳变。比如, 若PE3 开始选择为p, 则在下一个时钟psel传到PE4应选择P', 即是psel选择信号在任一PE的内部以及PE之间都是有四个时钟周期, 这样每次PE发生换行时, 就要把上一个PE输出的psel取反后, 才传递给下一个PE, 这就使得数据流较为准确。可知, 运动估计一发生, 最开始的PE能接收到psel信号, 若psel = 0, 则选择数据流p, 在经过四个时钟周期后, 若psel=1, 则选择数据流p', 也过四个时钟周期, 一直重复, 所有的PE都一样。同时psel信号在PE间还有可传递性, 在每次PE换行时, psel信号都会发生一次跳变。可用一个计数器来实现psel信号, 很简单。对表1 中的数据流进行分析后, 实现只需采用8计数器控制就行。PE选通信号psel产生。

上述PE选通信号psel的Modelsim仿真结果如图7 所示。

本结构有16 个PE, 而上述只是一个PE选通信号psel发生, 即是需要16 个相同的选通信号, 这些信号的规律性较强, 可以编写代码。

PE选通信号的Modelsim仿真波形结果如图8所示。

由图中波形可知, 满足设计要求。当PE内部有PE4、PE8、PE12 的选通信号进入, 都做翻转, 验证了符合数据流要求。

3 系统测试

3. 1 波形的结构功能测试

依据图3 的整体结构分析了运动估计的各个功能子模块, 并都通过了功能仿真, 从仿真结果中可以看到, 达到了预期的目的, 设计成功。然后把所有模块综合起来, 进行了仿真。通过分析仿真数据, 证明了本文设计的全搜索运动估计模块能够正常工作, 并且能够实现全搜索算法的功能, 输出正确的运动矢量。从本人的实际情况出发, 采用了简化的数据流, 只要验证该数据流和对应的硬件结构的可行性。将各部分数据按照数据流的要求写到片外存储器中, 供仿真测试。整体仿真结果如图9 所示, 通过对波形分析, 达到了预期的要求, 证实了该整体结构的正确性。前面都一一地分析了运动估计的子模块, 且都进行了功能仿真, 并由其结果验证了设计功能得以实现。再对各个模块组合成整体, 做了仿真实验。由实验得到的数据结果, 可以验证整个系统工作顺利, 成功实现全搜索算法, 从而得到正确的运动矢量。由于实际情况, 在这里对数据流进行了简化, 只用验证数据流以及对应的硬件结构的可行性。根据数据流的要求, 把各部分数据写进片外存储器里, 这样可以进行仿真测试。对波形分析可知, 验证了该整体结构是正确的, 并且能够实现预期功能要求。图9 为整个结构模块的Modelsim仿真波形。

3. 2 FPGA验证

最后, 还要进行该设计的FPGA验证。常见的视频基本上都是25 帧/s, 由此FPGA以50 MHz的时钟进行验证。

此模块是属于整个视频编码中的子模块, 所以不能单以通过最终图像就能验证此结构是否正确。于是采用Quartus II 10. 0 自带的Signal Tap II Logic Analyzer的方式, 通过数据采集的方式对最终的输出SAD和运动矢量采集, 在STP文件配置后, 采集到的波形文件如图11 所示。与功能仿真的结果对比后, 验证了此结构是可行的。

图12 为本次整个测试实验实物图, 本文设计的结构不仅充分利用了搜索区域中数据的重叠, 也大大减小了I/O带宽, 是一种可行的结构。

4 小结

设计硬件结构是依照数据流的特性。要证明此数据流和结构可行, 还进行了仿真实验以验证。由得到的仿真数据, 进行分析后, 可以证明本设计的全搜索运动估计模块工作正常, 并可全搜索算法的功能得以实现, 运动矢量输出正确。相对于整个运动估计系统来说, 本文设计的结构只是其中一个较小的部分。如果要实现整个系统, 就要求更高, 涉及到的很多因素要兼顾到, 如分块的大小, 是否可变, 如何更精确, 范围更大等。本文是研究了固定块大小范围的运动估计, 并证明了结构以及数据流的可行, 若想应用在实际领域中, 则要做更深层次的研究。

摘要:随着H.264标准的确定, 网络传送的阻塞、错码等问题已成为了网络视频传输的研究热点, 与此同时FPGA强大的并行能力实现了巨大复杂的运算, 使得全搜索运动估计成为了急待解决的问题。为了进一步优化H.264视频编码的实时性及改进视频压缩性能的好坏。设计了一种全搜索运动估计模块的算法, 确定了峰值信噪比PSNR值来实现图像质量评定;完成了新的三部全搜索算法设计;通过Modelsim仿真验证完成存储单元功能模块、数据选择功能模块的设计。系统测试表明:波形仿真结构验证了整体结构的正确性;FPGA的结果进一步完成了运动矢量采集成功的验证。对固定块大小范围的运动估计、结构以及数据流的设计研究对于FPGA的进一步大批量应用具有一定的意义。

关键词:运动矢量,视频传输,PSNR值,Modelsim仿真

参考文献

[1] 骆立俊, 邹采荣, 高西奇, 等.视频编码中的块运动估计算法.电视技术, 1997;12:2—8

[2] 胡文浩.H.264视频编码快速运动估计算法研究.科技咨询导报, 2006;20:105—106

[3] Chen Yenkuang, Li E O, Zhou Xiaosong, et al.Implementation of H.264 encoder and decoder on personal computers.Journal of Visual Communication and Image Representation, 2005;172:205—209

[4] Hamidouche W, Olivier C, Pousset Y, et al.Optimal resource allocation for Medium Grain Scalable video transmission over MIMO channels.Journal of Visual Communication and Image Representation, 2013;243:9—14

[5] Hrarti M, Saadane A, Larabi M C, et al.Attentional mechanisms driven adaptive quantization and selective bit allocation scheme for H.264/AVC.Signal Processing:Image Communication, 2013;15:702 —704

[6] 杨虎, 潘红兵, 何书专, 等.H.264视频压缩快速运动估计算法UMHexagons改进.计算机工程与设计, 2013;02:550—555

[7] 初秀琴, 李玉山, 徐善锋.一种快速分类搜索运动估计新方法.中国图象图形学报, 2002;10:85—88

[8] 骆立俊, 邹采荣, 何振亚.一种新的视频编码的块运动估计算法.通信学报, 2000; (02) :55—59

本文来自 99学术网(www.99xueshu.com),转载请保留网址和出处

【视频搜索】相关文章:

搜索引擎搜索技巧07-31

搜索引擎常用搜索技巧04-06

专业搜索在人才搜索中应用的比较分析11-22

搜索软件05-10

视觉搜索07-04

搜索排序07-06

网页搜索07-15

搜索策略07-25

搜索功能08-07

人肉搜索09-05

上一篇:正确良好幼儿家庭教育下一篇:饮食方法