您的位置: 首页 > 中文期刊论文 > 详情页

一种大数据环境下的在线社交媒体位置推断方法

作   者:
王凯余伟杨莎吴敏胡亚慧李石君
作者机构:
空军预警学院武汉大学计算机学院汉口学院计算机科学与技术学院中船重工第七二二研究所
关键词:
位置推断数据稀疏性用户生成内容社交图谱在线社交媒体
期刊名称:
软件学报
基金项目:
面向过时信息自动发现的Web时态一致性研究
面向大数据可用性的Web跨源实体数据不一致自动发现研究
i s s n:
1000-9825
年卷期:
2015 年 26 卷 11 期
页   码:
2951-2963
摘   要:
随着在线社交媒体的快速发展和可定位设备的大量普及,地理位置作为社交媒体大数据中一种质量极高的信息资源,开始在疾病控制、人口流动性分析和广告精准投放等方面得到广泛应用.但是,由于大量用户没有指定或者不能准确指定位置,社交媒体上的地理位置数据十分稀疏.针对此数据稀疏性问题,提出一种基于用户生成内容的位置推断方法 UGC-LI(user generate content driven location inference method),实现对社交媒体用户和生成文本位置的推断,为基于位置的个性化信息服务提供数据支撑.通过抽取用户生成文本中的本地词语,构建一个基于词汇地理分布差异和用户社交图谱的概率模型,在多层次的地理范围内推断用户位置.同时,提出一个基于位置的参数化语言模型,计算用户生成文本发出的城市.在真实数据集上进行的评估实验表明:UGC-LI方法能够在15km偏移距离准确定位64.2%的用户,对用户所在城市的推断准确率达到81.3%;同时,可正确定位32.7%的用户生成文本发出的城市,与现有方法相比有明显的提高.
相关作者
载入中,请稍后...
相关机构
    载入中,请稍后...
应用推荐

意 见 箱

匿名:登录

个人用户登录

找回密码

第三方账号登录

忘记密码

个人用户注册

必须为有效邮箱
6~16位数字与字母组合
6~16位数字与字母组合
请输入正确的手机号码

信息补充