node2bits: Compact Time- and Attribute-Aware Node Representations for User Stitching

图像拼接 计算机科学 节点(物理) 成对比较 匹配(统计) 个性化 相似性(几何) 情报检索 理论计算机科学 数据挖掘 人工智能 万维网 数学 结构工程 统计 图像(数学) 工程类
作者
Di Jin,Mark Heimann,Ryan A. Rossi,Danai Koutra
出处
期刊:Lecture Notes in Computer Science 卷期号:: 483-506 被引量:19
标识
DOI:10.1007/978-3-030-46150-8_29
摘要

Identity stitching, the task of identifying and matching various online references (e.g., sessions over different devices and timespans) to the same user in real-world web services, is crucial for personalization and recommendations. However, traditional user stitching approaches, such as grouping or blocking, require pairwise comparisons between a massive number of user activities, thus posing both computational and storage challenges. Recent works, which are often application-specific, heuristically seek to reduce the amount of comparisons, but they suffer from low precision and recall. To solve the problem in an application-independent way, we take a heterogeneous network-based approach in which users (nodes) interact with content (e.g., sessions, websites), and may have attributes (e.g., location). We propose node2bits, an efficient framework that represents multi-dimensional features of node contexts with binary hashcodes. node2bits leverages feature-based temporal walks to encapsulate short- and long-term interactions between nodes in heterogeneous web networks, and adopts SimHash to obtain compact, binary representations and avoid the quadratic complexity for similarity search. Extensive experiments on large-scale real networks show that node2bits outperforms traditional techniques and existing works that generate real-valued embeddings by up to $$5.16\%$$ in F1 score on user stitching, while taking only up to $$1.56\%$$ as much storage.

科研通智能强力驱动
Strongly Powered by AbleSci AI
科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
刚刚
1秒前
jacs111完成签到,获得积分10
1秒前
3秒前
4秒前
石头完成签到,获得积分10
5秒前
6秒前
科研打工人完成签到,获得积分10
7秒前
Chen发布了新的文献求助10
7秒前
7秒前
11秒前
11秒前
12秒前
fancy完成签到 ,获得积分10
12秒前
WQY完成签到,获得积分10
14秒前
1231发布了新的文献求助10
14秒前
英姑应助无限的含羞草采纳,获得10
14秒前
15秒前
善学以致用应助joker采纳,获得10
16秒前
17秒前
咩咩咩发布了新的文献求助10
18秒前
Owen应助我爱学习呢采纳,获得10
18秒前
甜甜的冬灵完成签到,获得积分10
18秒前
zzzzzz发布了新的文献求助10
18秒前
CipherSage应助Yile采纳,获得10
19秒前
YANG完成签到 ,获得积分10
20秒前
Chen完成签到,获得积分10
20秒前
20秒前
22秒前
合适的落落完成签到 ,获得积分10
22秒前
石开222完成签到,获得积分10
23秒前
azw完成签到,获得积分10
23秒前
天天快乐应助1231采纳,获得10
24秒前
joker完成签到,获得积分20
24秒前
26秒前
斯文败类应助victorchen采纳,获得10
28秒前
28秒前
TTTTTT发布了新的文献求助10
28秒前
29秒前
称心寒松发布了新的文献求助10
31秒前
高分求助中
All the Birds of the World 4000
Production Logging: Theoretical and Interpretive Elements 3000
Animal Physiology 2000
Les Mantodea de Guyane Insecta, Polyneoptera 2000
Am Rande der Geschichte : mein Leben in China / Ruth Weiss 1500
CENTRAL BOOKS: A BRIEF HISTORY 1939 TO 1999 by Dave Cope 1000
Machine Learning Methods in Geoscience 1000
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 有机化学 物理 生物化学 纳米技术 计算机科学 化学工程 内科学 复合材料 物理化学 电极 遗传学 量子力学 基因 冶金 催化作用
热门帖子
关注 科研通微信公众号,转发送积分 3741065
求助须知:如何正确求助?哪些是违规求助? 3283833
关于积分的说明 10037107
捐赠科研通 3000659
什么是DOI,文献DOI怎么找? 1646647
邀请新用户注册赠送积分活动 783804
科研通“疑难数据库(出版商)”最低求助积分说明 750427