HEER-Easing Embedding Learning by Comprehensive Transcription of Heterogeneous Information Networks -云博客

HEER-Easing Embedding Learning by Comprehensive Transcription of Heterogeneous Information Networks

# 前端 2024-05-05 15:17 0 58 来源：云博客

来源：KDD 2018 原文：
HEER code：
https://github.com/GentleZhu/HEER 注：若有错误，欢迎指正这篇KDD’18的文章，没有按照常规的方法将所有的node嵌入到同一的空间，因为文章提出 node 因为连接的 edge 类型（type）不同，存在不兼容（incompatibility）的特性，所以最好能够根据不同的edge type来定义不同度量空间（metric space），保持同一个度量空间下，node的兼容性。

1. Abstract

在本文中，作者认为异构信息网络（HIN）中隐含着丰富信息的同时也引入了潜在的不兼容性，为了保留HIN中丰富但可能不兼容的信息，提出对HIN的综合转录问题。还需要提供一种易于使用的方法来有效利用 HIN 中的信息。本文提出HEER方法：通过对 HIN 的边缘表示，与正确学习的异构度量相结合。

2. Introduction

网络嵌入学习节点的低维表示可以在原始网络中编码其语义信息，且容易和机器学习等方法相结合，可用于分类、链路预测。近来，研究人员证明了HIN 嵌入在作者识别等方面的有效性。
图 1 Network Embedding HIN 异构性不仅包含丰富的信息，还有潜在的不兼容的语义。传统的同构网络嵌入不论其类型，均等的处理所有节点和边，不会捕捉 HIN 的异质性。如图1，stan，musical，Ang Lee是不同类型的节点，因为musical和Ang Lee的embedding距离很远，会导致stan无法同时和两个embedding同时很近，因此需要学习两个不同的度量空间，从而stan分别在两个度量空间中与对应的node距离很近。
图 2 异质网络嵌入学习中的不兼容现象为解决该问题，本文在计算相似度 s 时提出度量向量 μ
该度量向量μ是对不同类型的关系来进行embedding，g_{uv}是表示u,v之间的边的embedding。通过定义该相似度函数，能够获得基于不同边类型r的相似度