您的位置: 首页 > 中文期刊论文 > 详情页

基于颜色聚类和多帧融合的视频文字识别方法

作   者:
易剑彭宇新肖建国
作者机构:
北京大学计算机科学技术研究所
关键词:
基于颜色的聚类视频检索视频文字识别多帧融合噪声去除
期刊名称:
软件学报
基金项目:
机器学习中模型选择问题的研究及其在图像理解中的应用
视频概念标注方法及其在视频语义检索中的应用
i s s n:
1000-9825
年卷期:
2011 年 22 卷 12 期
页   码:
71-85
摘   要:
提出一种基于颜色聚类和多帧融合的视频文字识别方法,首先,在视频文字检测模块,综合考虑了文字区域的两个显著特征:一致的颜色和密集的边缘,利用近邻传播聚类算法,根据图像中边缘颜色的复杂程度,自适应地把彩色边缘分解到若干边缘子图中去,使得在各个子图中检测文字区域更为准确.其次,在视频文字增强模块,基于文字笔画强度图过滤掉模糊的文字区域,并综合平均融合和最小值融合的优点,对在不同视频帧中检测到的、包含相同内容的文字区域进行融合,能够得到背景更为平滑、笔画更为清晰的文字区域图像.最后,在视频文字提取模块,通过自适应地选取具有较高文字对比度的颜色分量进行二值化,能够取得比现有方法更好的二值化结果;另一方面,基于图像中背景与文字的颜色差异,利用颜色聚类的方法去除噪声,能够有效地提高文字识别率.实验结果表明,该方法能够比现有方法取得更好的文字识别结果.
相关作者
载入中,请稍后...
相关机构
    载入中,请稍后...
应用推荐

意 见 箱

匿名:登录

个人用户登录

找回密码

第三方账号登录

忘记密码

个人用户注册

必须为有效邮箱
6~16位数字与字母组合
6~16位数字与字母组合
请输入正确的手机号码

信息补充