中文姓名自动识别系统的设计与实现
- 作者机构:
- 大连理工大学计算机系; 北京科技大学;
- 关键词:
- 姓氏优先级; 姓氏用字集; 中文姓名识别; 集合划分;
- 期刊名称:
- 计算机工程与应用
- 基金项目:
-
实用和高准确自动翻译率的机器翻译方法的探索
- i s s n:
- 1002-8331
- 年卷期:
- 2006 年 42 卷 10 期
- 页 码:
- 9-11
- 摘 要:
- 论文在对大规模姓名样本库、姓名语料库进行统计的基础上,将姓氏库中的姓氏按优先级分类,并研究了前300个姓氏作普通单字时其上下文用字规律,将确定真姓氏并识别姓名的过程看作对句子的姓氏用字集进行划分的过程,设计实现了一个中文姓名自动识别试验系统。同时提出多级阈值的概念,即姓名右边界阈值和识别阈值均是优先级的函数。对系统的开放测试召回率和准确率分别为80.62%、89.27%。
相关作者
相关机构
