专利文献OCR校对方法研究
- 作者机构:
- 中国专利信息中心;
- 关键词:
- OCR校对; 专利文献; 校对词典; HMM模型;
- 期刊名称:
- 情报杂志
- i s s n:
- 1002-1965
- 年卷期:
- 2011 年 30 卷 03 期
- 页 码:
- 186-188+194
- 摘 要:
- 专利文献代码化对于专利无纸化审查、专利分析、专利检索和专利管理都非常重要。本文提出一种以专利文献OCR校对词典和技术领域特征为基础,利用中文分词、隐马尔科夫模型为方法的专利文献OCR校对框架和专利文献OCR中文文本的拼写校对方法,降低了人力成本投入,提高了专利文献代码化效率和代码化质量。本文最后给出了实验系统和实现结果。
相关作者
相关机构
