您的位置: 首页 > 国内项目 > 详情页

维吾尔文不良信息过滤关键技术的研究
基金项目类型:
国家自然科学基金
基金项目编号:
61063043
来源网站:
国家自然科学基金委员会
来源网址:
http://www.nsfc.gov.cn/
负责人:
帕力旦·吐尔逊
完成单位:
新疆大学
中文关键词:
维吾尔文; 语种识别; 过滤; 拼写检查;
其他语种关键词:
uyghur; language identification; filter; spell check
项目类型:
地区科学基金项目
语种:
中文
开始日期:
2011-01-01
结束日期:
2013-12-31
中文摘要:
内容过滤是当前互联网信息安全的研究热点, 也是所面临的挑战之一。互联网迅速普及, 但其内容存在大量不良信息, 内容过滤就是对其进行筛选, 取其精华、去其糟粕, 是对传播的信息进行的审计行为。虽然最近几年维吾尔文信息技术得到了充足的发展空间。但是,维吾尔文不良信息过滤相关的技术未被得到重点研究,给境外不法分子利用互联网进行反动宣传留下了漏洞。本项目针对该问题,以真实网络信息作为研究对象,围绕维吾尔文不良信息过滤技术,对编码统一、被变形的单词、不良文本分类技术、利用敏感词组合过滤不良文本等基础技术进行深入研究,为研发维吾尔文不良信息过滤系统奠定基础。通过本项目构建100万次词人工校对的维吾尔文词法标注网络文本语料库,与公安部门合作构建维吾尔文不良信息语料库,研发维吾尔文不良信息检索过滤实验系统。
相关组织者
应用推荐

意 见 箱

匿名:登录

个人用户登录

找回密码

第三方账号登录

忘记密码

个人用户注册

必须为有效邮箱
6~16位数字与字母组合
6~16位数字与字母组合
请输入正确的手机号码

信息补充