已入深夜,您辛苦了!由于当前在线用户较少,发布求助请尽量完整地填写文献信息,科研通机器人24小时在线,伴您度过漫漫科研夜!祝你早点完成任务,早点休息,好梦!

GazPNE: annotation-free deep learning for place name extraction from microblogs leveraging gazetteer and synthetic data by rules

微博 计算机科学 注释 社会化媒体 人工智能 任务(项目管理) 深度学习 地名学 情报检索 自然语言处理 信息抽取 词(群论) 命名实体识别 地理 万维网 工程类 数学 考古 系统工程 几何学
作者
Xuke Hu,Hussein S. Al-Olimat,Jens Kersten,Matti Wiegmann,Friederike Klan,Yeran Sun,Hongchao Fan
出处
期刊:International Journal of Geographical Information Science [Informa]
卷期号:36 (2): 310-337 被引量:26
标识
DOI:10.1080/13658816.2021.1947507
摘要

Extracting precise location information from microblogs is a crucial task in many applications, particularly in disaster response, revealing where damages are, where people need assistance, and where help can be found. A crucial prerequisite to location extraction is place name extraction. In this paper, we present GazPNE: a hybrid approach to place name extraction which fuses rules, gazetteers, and deep learning techniques without requiring any manually annotated data. The core of the approach is to learn the intrinsic characteristics of multi-word place names with deep learning from gazetteers. Specifically, GazPNE consists of a rule-based system to select n-grams from the microblogs that potentially contain place names, and a C-LSTM model that decides if the selected n-gram is a place name or not. The C-LSTM is trained on 388.1 million examples containing 6.8 million positive examples with US and Indian place names extracted from OpenStreetMap and 381.3 million negative examples synthesized by rules. We evaluate GazPNE against the SoTA on a manually annotated 4,500 tweet dataset which contains 9,026 place names from three foods: 2016 in Louisiana (US), 2016 in Houston (US), and 2015 in Chennai (India). GazPNE achieves SotA performance on the test data with an F1 of 0.84.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
PDF的下载单位、IP信息已删除 (2025-6-4)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
神勇元瑶完成签到,获得积分20
6秒前
7秒前
8秒前
踏实的老四完成签到,获得积分10
8秒前
9秒前
9秒前
pluto应助堃堃boom采纳,获得10
10秒前
nono发布了新的文献求助10
11秒前
王金农发布了新的文献求助10
14秒前
11发布了新的文献求助10
15秒前
陈年人少熬夜完成签到 ,获得积分10
16秒前
18秒前
21秒前
吕佩完成签到,获得积分10
21秒前
hhh完成签到 ,获得积分10
22秒前
甜甜若冰发布了新的文献求助10
24秒前
34秒前
36秒前
科研通AI2S应助47gongjiang采纳,获得10
37秒前
卷卷233611发布了新的文献求助10
39秒前
44秒前
哑巴和喇叭完成签到 ,获得积分10
48秒前
48秒前
49秒前
1234发布了新的文献求助10
49秒前
51秒前
AireenBeryl531应助yooga采纳,获得30
53秒前
头号玩家完成签到,获得积分10
54秒前
NF404发布了新的文献求助10
57秒前
whitesheep完成签到,获得积分10
57秒前
Swater完成签到 ,获得积分10
59秒前
59秒前
焱阳完成签到 ,获得积分10
1分钟前
1分钟前
焱阳关注了科研通微信公众号
1分钟前
搞怪莫茗发布了新的文献求助10
1分钟前
1分钟前
1分钟前
1分钟前
1分钟前
高分求助中
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
Introduction to Early Childhood Education 1000
List of 1,091 Public Pension Profiles by Region 921
Aerospace Standards Index - 2025 800
Identifying dimensions of interest to support learning in disengaged students: the MINE project 800
流动的新传统主义与新生代农民工的劳动力再生产模式变迁 500
Historical Dictionary of British Intelligence (2014 / 2nd EDITION!) 500
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 有机化学 生物化学 物理 纳米技术 计算机科学 内科学 化学工程 复合材料 物理化学 基因 遗传学 催化作用 冶金 量子力学 光电子学
热门帖子
关注 科研通微信公众号,转发送积分 5431945
求助须知:如何正确求助?哪些是违规求助? 4544768
关于积分的说明 14193772
捐赠科研通 4463994
什么是DOI,文献DOI怎么找? 2446920
邀请新用户注册赠送积分活动 1438241
关于科研通互助平台的介绍 1415027