已入深夜,您辛苦了!由于当前在线用户较少,发布求助请尽量完整的填写文献信息,科研通机器人24小时在线,伴您度过漫漫科研夜!祝你早点完成任务,早点休息,好梦!

Preserve Context Information for Extract-Generate Long-Input Summarization Framework

自动汇总 计算机科学 背景(考古学) 情报检索 集合(抽象数据类型) 上下文模型 多文档摘要 人工智能 自然语言处理 程序设计语言 古生物学 对象(语法) 生物
作者
Renmin Yuan,Zili Wang,Zhigang Cao,Wenjie Li
出处
期刊:Proceedings of the ... AAAI Conference on Artificial Intelligence [Association for the Advancement of Artificial Intelligence (AAAI)]
卷期号:37 (11): 13932-13939
标识
DOI:10.1609/aaai.v37i11.26631
摘要

The Extract-generate framework has been a classic approach for text summarization. As pretrained language models struggling with long-input summarization for their high memory cost, extract-generate framework regains researchers' interests. However, the cost of its effectiveness in dealing with long-input summarization is the loss of context information. In this paper, we present a context-aware extract-generate framework (CAEG) for long-input text summarization. It focuses on preserving both local and global context information in an extract-generate framework with little cost, and can be applied to most of existing extract-generate summarization models. CAEG generates a set of context-related text spans called context prompts for each text snippet and use them to transfer the context information from the extractor and generator. To find such context prompts, we propose to capture the context information based on the interpretation of the extractor, where the text spans having the highest contribution to the extraction decision are considered as containing the richest context information. We evaluate our approach on both long-document and long-dialogue summarization datasets: arXiv and QMSum. The experiment results show that CAEG achieves the-state-of-art result on QMSum and outperforms other extract-generate based models in arXiv.
最长约 10秒,即可获得该文献文件

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
lzlzq完成签到,获得积分10
3秒前
13秒前
奥福少摩完成签到 ,获得积分10
14秒前
上官若男应助雯雯采纳,获得10
16秒前
思源应助就拒绝内耗采纳,获得10
17秒前
cocolu应助猫七采纳,获得30
20秒前
lzlzq发布了新的文献求助10
21秒前
海鲜汤完成签到 ,获得积分10
23秒前
ZYY完成签到,获得积分10
25秒前
26秒前
研友_RLNj6L发布了新的文献求助10
29秒前
31秒前
土豆你个西红柿完成签到 ,获得积分10
31秒前
33秒前
33秒前
大个应助wdj7171采纳,获得10
35秒前
35秒前
gezid完成签到 ,获得积分10
36秒前
雯雯发布了新的文献求助10
37秒前
文文完成签到,获得积分10
38秒前
Jasper应助就拒绝内耗采纳,获得10
38秒前
41秒前
meng完成签到,获得积分10
41秒前
Ron完成签到,获得积分10
41秒前
wdj7171发布了新的文献求助10
46秒前
HJJHJH发布了新的文献求助30
47秒前
48秒前
48秒前
文文发布了新的文献求助10
48秒前
iberis完成签到,获得积分10
49秒前
53秒前
姜姜姜完成签到,获得积分10
53秒前
就拒绝内耗完成签到,获得积分20
54秒前
眼睛大慕卉完成签到 ,获得积分10
55秒前
整齐泥猴桃完成签到 ,获得积分10
1分钟前
隐形曼青应助鱼鱼采纳,获得10
1分钟前
小悦悦完成签到 ,获得积分10
1分钟前
英俊的铭应助新一袁采纳,获得10
1分钟前
在水一方应助一种信仰采纳,获得10
1分钟前
Anyixx完成签到 ,获得积分10
1分钟前
高分求助中
Востребованный временем 2500
Agaricales of New Zealand 1: Pluteaceae - Entolomataceae 1040
Healthcare Finance: Modern Financial Analysis for Accelerating Biomedical Innovation 1000
지식생태학: 생태학, 죽은 지식을 깨우다 600
Mantodea of the World: Species Catalog Andrew M 500
海南省蛇咬伤流行病学特征与预后影响因素分析 500
Neuromuscular and Electrodiagnostic Medicine Board Review 500
热门求助领域 (近24小时)
化学 医学 材料科学 生物 工程类 有机化学 生物化学 纳米技术 内科学 物理 化学工程 计算机科学 复合材料 基因 遗传学 物理化学 催化作用 细胞生物学 免疫学 电极
热门帖子
关注 科研通微信公众号,转发送积分 3463573
求助须知:如何正确求助?哪些是违规求助? 3056883
关于积分的说明 9054780
捐赠科研通 2746905
什么是DOI,文献DOI怎么找? 1507128
科研通“疑难数据库(出版商)”最低求助积分说明 696345
邀请新用户注册赠送积分活动 695916