Semi-Supervised Clustering Algorithm Based on Deep Feature Mapping

聚类分析 计算机科学 公制(单位) 人工智能 数据挖掘 相关聚类 样品(材料) 模式识别(心理学) 成对比较 高维数据聚类 嵌入 CURE数据聚类算法 树冠聚类算法 单连锁聚类 数据点 维数之咒 运营管理 化学 色谱法 经济
作者
Xu Xiong,Zhang Chun,Chenggang Wang,Xiaoyan Zhang,Hua Meng
出处
期刊:Intelligent Automation and Soft Computing [Taylor & Francis]
卷期号:37 (1): 815-831
标识
DOI:10.32604/iasc.2023.034656
摘要

Clustering analysis is one of the main concerns in data mining. A common approach to the clustering process is to bring together points that are close to each other and separate points that are away from each other. Therefore, measuring the distance between sample points is crucial to the effectiveness of clustering. Filtering features by label information and measuring the distance between samples by these features is a common supervised learning method to reconstruct distance metric. However, in many application scenarios, it is very expensive to obtain a large number of labeled samples. In this paper, to solve the clustering problem in the few supervised sample and high data dimensionality scenarios, a novel semi-supervised clustering algorithm is proposed by designing an improved prototype network that attempts to reconstruct the distance metric in the sample space with a small amount of pairwise supervised information, such as Must-Link and Cannot-Link, and then cluster the data in the new metric space. The core idea is to make the similar ones closer and the dissimilar ones further away through embedding mapping. Extensive experiments on both real-world and synthetic datasets show the effectiveness of this algorithm. Average clustering metrics on various datasets improved by 8% compared to the comparison algorithm.

科研通智能强力驱动
Strongly Powered by AbleSci AI
更新
PDF的下载单位、IP信息已删除 (2025-6-4)

科研通是完全免费的文献互助平台,具备全网最快的应助速度,最高的求助完成率。 对每一个文献求助,科研通都将尽心尽力,给求助人一个满意的交代。
实时播报
刚刚
一程发布了新的文献求助10
刚刚
踏实啤酒完成签到 ,获得积分10
刚刚
gs19960828应助文件撤销了驳回
1秒前
1秒前
Marvel发布了新的文献求助10
1秒前
Hu发布了新的文献求助30
1秒前
Jasper应助冲冲冲!采纳,获得10
1秒前
2秒前
佐哥完成签到,获得积分10
2秒前
小蘑菇应助leranlily采纳,获得10
2秒前
2秒前
微笑南烟完成签到,获得积分10
3秒前
领导范儿应助hoshi采纳,获得10
4秒前
fffff完成签到,获得积分10
5秒前
zyp发布了新的文献求助10
5秒前
guozizi发布了新的文献求助10
6秒前
chenxuan发布了新的文献求助10
6秒前
yzz完成签到,获得积分20
6秒前
邓桂灿发布了新的文献求助10
6秒前
chen完成签到,获得积分10
7秒前
学术屎壳郎完成签到,获得积分10
7秒前
随风驳回了wanci应助
7秒前
CAOHOU应助小樊同学采纳,获得10
7秒前
wang完成签到,获得积分10
7秒前
8秒前
8秒前
欣慰妙海关注了科研通微信公众号
8秒前
8秒前
9秒前
kkkiku发布了新的文献求助50
10秒前
SHAO应助天晴肖采纳,获得10
10秒前
可爱的函函应助妥协采纳,获得10
11秒前
NexusExplorer应助华生采纳,获得10
11秒前
bb完成签到,获得积分10
12秒前
领导范儿应助小樊同学采纳,获得10
12秒前
认真的成风完成签到,获得积分10
13秒前
莫羽倾尘发布了新的文献求助20
13秒前
13秒前
13秒前
高分求助中
Picture Books with Same-sex Parented Families: Unintentional Censorship 1000
A new approach to the extrapolation of accelerated life test data 1000
ACSM’s Guidelines for Exercise Testing and Prescription, 12th edition 500
Nucleophilic substitution in azasydnone-modified dinitroanisoles 500
Indomethacinのヒトにおける経皮吸収 400
Phylogenetic study of the order Polydesmida (Myriapoda: Diplopoda) 370
基于可调谐半导体激光吸收光谱技术泄漏气体检测系统的研究 310
热门求助领域 (近24小时)
化学 材料科学 医学 生物 工程类 有机化学 生物化学 物理 内科学 纳米技术 计算机科学 化学工程 复合材料 遗传学 基因 物理化学 催化作用 冶金 细胞生物学 免疫学
热门帖子
关注 科研通微信公众号,转发送积分 3979242
求助须知:如何正确求助?哪些是违规求助? 3523187
关于积分的说明 11216570
捐赠科研通 3260615
什么是DOI,文献DOI怎么找? 1800151
邀请新用户注册赠送积分活动 878854
科研通“疑难数据库(出版商)”最低求助积分说明 807099