您的位置:
首页
>
中文期刊论文
>
详情页
基于颜色聚类和多帧融合的视频文字识别方法
- 作 者:
-
易剑;
彭宇新;
肖建国;
- 作者机构:
-
北京大学计算机科学技术研究所;
- 关键词:
-
基于颜色的聚类;
视频检索;
视频文字识别;
多帧融合;
噪声去除;
- 期刊名称:
- 软件学报
- 基金项目:
-
机器学习中模型选择问题的研究及其在图像理解中的应用
视频概念标注方法及其在视频语义检索中的应用
- i s s n:
- 1000-9825
- 年卷期:
-
2011 年
22 卷
12 期
- 页 码:
- 71-85
- 摘 要:
-
提出一种基于颜色聚类和多帧融合的视频文字识别方法,首先,在视频文字检测模块,综合考虑了文字区域的两个显著特征:一致的颜色和密集的边缘,利用近邻传播聚类算法,根据图像中边缘颜色的复杂程度,自适应地把彩色边缘分解到若干边缘子图中去,使得在各个子图中检测文字区域更为准确.其次,在视频文字增强模块,基于文字笔画强度图过滤掉模糊的文字区域,并综合平均融合和最小值融合的优点,对在不同视频帧中检测到的、包含相同内容的文字区域进行融合,能够得到背景更为平滑、笔画更为清晰的文字区域图像.最后,在视频文字提取模块,通过自适应地选取具有较高文字对比度的颜色分量进行二值化,能够取得比现有方法更好的二值化结果;另一方面,基于图像中背景与文字的颜色差异,利用颜色聚类的方法去除噪声,能够有效地提高文字识别率.实验结果表明,该方法能够比现有方法取得更好的文字识别结果.
相关作者
载入中,请稍后...
相关机构
载入中,请稍后...