已入深夜,您辛苦了!由于当前在线用户较少,发布求助请尽量完整地填写文献信息,科研通机器人24小时在线,伴您度过漫漫科研夜!祝你早点完成任务,早点休息,好梦!

Knowledge Discovery from Natural Languages: a Linguistic Dataset of 10K Kinship Relations

亲属关系 计算机科学 知识抽取 人工智能 水准点(测量) 集合(抽象数据类型) 数据科学 自然语言处理 K-最优模式发现 领域(数学) 数据挖掘 关联规则学习 任务(项目管理) 机器学习 数学 工程类 地理 大地测量学 系统工程 政治学 纯数学 法学 程序设计语言
作者
Yue Yangming,Chunxiao Li,Chen YeZeng,Zijie Dai,Yi Zhou
标识
DOI:10.1109/bdai59165.2023.10257043
摘要

In the expansive realm of knowledge discovery, this study propels forward the subdomain of rule mining with the inception of a singular synthetic dataset – the Kinship 10K Dataset. This dataset, purpose-built for natural language rule mining, derives from the intricate relationship networks across 20 simulated families. These networks include 1,500 unique characters. The development leverages generative techniques, producing a rich array of kinship rules. Each rule is grounded in one of eight foundational Meta kinship relations. The final ensemble, a comprehensive dataset, comprises 10,526 relationship instances, 234 distinct kinship relations, and 104 learnable rules. In addition, we introduce two evaluation metrics – Rule Coverage (RC) and Directed Rule Mining Capability (DRMC) for examining rule mining algorithms in closed domains. RC quantifies the inclusiveness of rule mining datasets, while DRMC delivers nuanced analysis of algorithmic performance in discerning and extracting precise rules, taking accuracy and precision into account. Additionally, we set a benchmark by utilizing the GPT-3.5 and GPT-4 models as baselines. It is noteworthy that the GPT-4 model attained scores of 0.78 and 0.35 on the RC and DRMC metrics respectively. These scores underscore the inherent challenges of the task and signify the merit in pursuing further research to advance this domain. Collectively, this investigation presents a substantial contribution to knowledge discovery. By introducing an innovative dataset, formulating novel evaluation metrics, and instituting a robust baseline model, it not only highlights the prospects for deeper insights and increased automation in the wider field of knowledge discovery but also sets the stage for upcoming advancements in rule mining research.

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
PDF的下载单位、IP信息已删除 (2025-6-4)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
潇潇鱼发布了新的文献求助10
3秒前
冬日暖阳完成签到,获得积分10
5秒前
6秒前
大羊完成签到 ,获得积分10
7秒前
科研大咖杨某完成签到 ,获得积分10
7秒前
侯锐淇完成签到 ,获得积分10
8秒前
9秒前
罗皮特完成签到 ,获得积分10
10秒前
凉城予梦完成签到,获得积分10
11秒前
11秒前
青柠味薯片完成签到,获得积分10
12秒前
大鼻子的新四岁完成签到,获得积分10
13秒前
weed6发布了新的文献求助10
13秒前
俺是小兰仔完成签到 ,获得积分10
14秒前
14秒前
崔洪瑞完成签到,获得积分10
15秒前
沉静凡松完成签到 ,获得积分10
16秒前
怡然剑成完成签到 ,获得积分10
18秒前
黎明将至发布了新的文献求助10
18秒前
miracle完成签到 ,获得积分10
18秒前
维奈克拉应助Doctor_Mill采纳,获得20
20秒前
淡定的天问完成签到 ,获得积分10
20秒前
小枣完成签到 ,获得积分10
23秒前
语行完成签到 ,获得积分10
24秒前
如寄完成签到 ,获得积分10
25秒前
小蘑菇应助zz采纳,获得10
25秒前
怕黑钢笔完成签到 ,获得积分10
25秒前
25秒前
香蕉觅云应助weed6采纳,获得10
27秒前
FashionBoy应助甜甜若冰采纳,获得10
28秒前
科研通AI6应助高晗采纳,获得10
28秒前
28秒前
illuminate完成签到 ,获得积分10
29秒前
薄荷蓝完成签到,获得积分10
29秒前
大气小天鹅完成签到 ,获得积分10
29秒前
鲁路修发布了新的文献求助30
29秒前
沈澜完成签到 ,获得积分10
29秒前
闪闪的梦柏完成签到 ,获得积分10
30秒前
30秒前
31秒前
高分求助中
(应助此贴封号)【重要!!请各用户(尤其是新用户)详细阅读】【科研通的精品贴汇总】 10000
The Complete Pro-Guide to the All-New Affinity Studio: The A-to-Z Master Manual: Master Vector, Pixel, & Layout Design: Advanced Techniques for Photo, Designer, and Publisher in the Unified Suite 1000
Teacher Wellbeing: A Real Conversation for Teachers and Leaders 500
Synthesis and properties of compounds of the type A (III) B2 (VI) X4 (VI), A (III) B4 (V) X7 (VI), and A3 (III) B4 (V) X9 (VI) 500
Microbially Influenced Corrosion of Materials 500
Die Fliegen der Palaearktischen Region. Familie 64 g: Larvaevorinae (Tachininae). 1975 500
The YWCA in China The Making of a Chinese Christian Women’s Institution, 1899–1957 400
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 有机化学 生物化学 物理 纳米技术 计算机科学 内科学 化学工程 复合材料 物理化学 基因 遗传学 催化作用 冶金 量子力学 光电子学
热门帖子
关注 科研通微信公众号,转发送积分 5401142
求助须知:如何正确求助?哪些是违规求助? 4520145
关于积分的说明 14078789
捐赠科研通 4433229
什么是DOI,文献DOI怎么找? 2434030
邀请新用户注册赠送积分活动 1426180
关于科研通互助平台的介绍 1404792