`
king_c
  • 浏览: 214048 次
  • 性别: Icon_minigender_1
  • 来自: 北京
社区版块
存档分类
最新评论

基于内容特征的图像和视频检索系统 笔记1

阅读更多

 

 

1、现有的基于内容的多媒体检索系统有

研究型:Photobook,Cypress,VisualSeek

商用的:QBIC , Virage

 

目前已完成的分镜头技术有:

(1)AVI格式视频文件的分镜头。

(2)MPEC,-I格式视频文件的分镜头。

 

基于内容的图像检索绝不是简单的相似图像的查找,它包括图像分类、图像处理、视觉特征提取、数据库生成与管理、多维度索引、用户接口等许多过程和模块。

 

 

2、视频数据分镜头技术

 

镜头变换是指一段连续图像序列变换到另一段连续视频图像序列,其中包括镜头的突变——镜头切换(Cut)和渐变——淡人/淡出(fade in/fade out)、隐现(Dissolve)、滑人(Wipe)等。它们都是由视频剪辑形成的,镜头变换的最基本任务之一就是将这一类经过剪辑的视频分解为镜头。

 

目前,分镜头技术主要有以下几种。

a、直接像素或直方图比较法,即对全解压缩的帧图像数据通过帧间比较的方法来识别镜头的突变和渐变。

b、利用压缩数据中的某些特征如DCT系数和运动矢量等进行分段,可以大大减小计算量。

c、利用文本识别和视频的相近标题检索。

 

(1)突变镜头的识别:

突变镜头是由镜头的切换引起的,相应的在帧间比较直方图上会出现一个尖峰(Peak)。可以采用两个相邻帧的彩色直方图的差值检测突变镜头,当差值大于某一阈值时判断产生了镜头突变。为了防止大运动引起的误判,采用了改进的方法——改用特定帧数内的直方图差值的最大值与改大值的比作为检测值,取得了较好的效果。外,系统采用镜头最短帧数来避免亮度变化如闪光灯引起的镜头误分;

 

(2)渐变镜头的识别:

渐变镜头有淡人/淡出、隐现、滑入等剪辑技术。由于渐变镜头在帧间差别上并没有一个可检测的尖峰,因此比突变镜头的识别复杂。该系统采用十帧间直方图差值检测渐变镜头,首先分出突变镜头,然后在每个突变镜头的m帧内,对每10帧间的彩色直方图再进行比较,也就是比较m/lO遍,分割出渐变镜头;

 

(3)MPEG-I视频分镜头采用DI(Difference of I-picture)算法:

DI的含义是l图之问的差。首先对MPEG-I文件进行解码,只解出其中的I帧,然后将I帧解压成为256色的bmp图像。在bmp图的基础上以帧间的直方图差值为依据按上述方法检测出突变镜头和渐变镜头。但在—个镜头内有较大的动作时,会引起误判。

 

 

3、 色彩特征参数提取:

 

a.全局色彩特征

全局色彩=全区域的色彩参数值平均。即将区域的像素的红、绿、蓝三个参数值各按全区域取平均,得到一个平均的颜色。此方法实际上实现的是主色查询,忽略了图像的细节特征。

 

b.色彩的分布特性

色彩分布=全区域的色彩分布比例。即将区域的像素按颜色进行统计.得到颜色在该区域中的分布情况,再按各颜色在区域中的分布权重得出所谓主、次色彩。此时代表图像特征的色彩可以在图像中找到。由于人的肉眼分辨率有限,在选择两种以上的颜色作为主色(副主色)的情况下效果就可以接受了。但在这种方案下,色彩数量的选择非常关键,如果可选的数量太少就会有大量颜色无法表示,如果太多.用户可能无所适从。

 

c.色彩的分块特性

色彩分块=选定区域的色彩分布特性。即将区域按图像的具体情况分区,再计算出各分区的色彩平均分布特性,在各色彩参数中加上位置信息。前述两种方案非常直观,但都无法反映图像的空间特性。此种方案所提取的参数最多,颜色加位置可以提供更精确的匹配信鼠。但由于参数过多,导致匹既时的服制条件太多,能匹配的图像太少。

 

 

4、傅立叶描述符、距不变量、小波描述算子

 

分享到:
评论

相关推荐

    基于深度学习技术 的端到端图像搜索引擎基于深度学习技术 的端到端图像搜索引擎_Jupyter_python_代码_下载

    图像搜索引擎允许我们根据查询之一检索相似的图像。 进引擎的步骤! (1) 使用颜色特征作为附加的搜索过滤器 我们可以使用颜色强度来产生额外的特征并改进我们的图像搜索引擎。很好的阅读:Pyimagesearch color ...

    活字格管理信息系统项目

    活字格信息管理系统是一个基于计算机技术的信息管理工具,用于管理和处理各种类型的信息,例如文本、图像、音频和视频等。以下是该系统的内容概要、适用人群、使用场景及目标,以及其他说明: 内容概要: 活字格信息...

    szurubooru:Danbooru风格的图像板引擎

    使用检索网络视频内容的能力 发表评论 发表笔记/注释,包括任意多边形 丰富的JSON REST API() 基于令牌的客户端身份验证 丰富的搜索系统 丰富的特权系统 搜索和编辑标签时自动完成 标签类别 标签建议 标签含义...

    使用筛选方法从手写文档图像中逐行识别脚本-研究论文

    从文档图像中自动识别脚本有助于为字符识别和内容检索选择合适的 OCR。 在本文中,提出了基于尺度不变特征变换(SIFT)的逐行脚本识别。 现实生活中的手写脚本数据是从不同来源收集的,如文章、不同年龄组和职业的人...

    个人项目

    除了文本之外,还可以总结图像和视频。 文本分析(数据清理和可视化)-一种理解单词细微差别的新颖方法 信息检索-信息检索是从这些资源的集合中获取与信息需求相关的信息系统资源的过程。 搜索可以基于全文索引或...

    physics_based_learning:计算成像系统的学习变得简单

    计算成像系统的关键方面(例如实验设计和图像先验)可以通过展开深度网络来优化,这些深度网络是通过展开基于经典模型的重建的迭代而形成的。 这次开源演示的目的是为刚接触物理学习的人们提供一个最低限度的工作...

    无线WIFI覆盖项目设计方案.doc

    我方提供的无线视频监方案基于新型移动IP监控 技术,具有高可靠性、实时传输等特点,可使用无线信号作为回传,因此在快 速布点、特殊场景布点方面具有一般安防系统所没有的优势。此外移动IP监控 技术借用图像识别技术...

    asp.net知识库

    利用反射实现ASP.NET控件和数据实体之间的双向绑定,并且在客户端自动验证输入的内容是否合法 asp.net报表解决方法 SQLDMO类的使用 SQL过程自动C#封装,支持从表到基本存储过程生成 使用SQLDMO控制 SQL Server 使用SQL...

    堆叠去噪自编码器matlab代码-Computer-Vision-Action:计算机视觉学习,包括python机器学习动作;基于深度学习的计

    图像检索/搜索/重新编号 分割 会议 资料集 / Kaggle动作 :中国数据竞赛的解决方案 计算机视觉研究 python学习 图像处理 Opencv的 沃尔夫特 机器学习 斯克莱恩 行动中的机器学习:阅读机器学习并分析代码实现​​。 ...

    2021年春计算机应用基础期末复习.doc

    春计算机应用基本期末复习 一、选取题: 1、第一台数字电子计算机ENIAC诞生于( C )。 A. 19 B.1938年 C.1946年 D。1956年 2、第三代计算机采用逻辑器件是( B )。 A.晶体管 B.中、小规模集成电路 C.大规模集成...

Global site tag (gtag.js) - Google Analytics