简介
目的:学习网络中节点的低维表示
将利用节点信息及网络结构识别节点的过程比喻为翻译的过程
论文引用网络中,每个节点代表一篇论文,每条边代表引用关系。每个节点自身属性包括文章的摘要,关键词,研究领域等等。该论文的假设依据是,论文所形成的引用网络与论文自身的属性之间有较强关系
现有方案:
1. 将结构信息和属性信息分别进行embedding之后,组合
2. 考虑短距离/固定邻域范围保留结构信息(第一/二邻近)
(复杂问题中很难确定邻域范围)
创新点(贡献):
提出基于seq2seq 的模型框架(STNE)
利用网络上随机遍历生成的序列,将节点内容信息翻译成结构信息,从而结合两种信息
- 将网络嵌入转化为 seq2seq 任务,从局部建模到序列的全局结构建模,捕获更多语义信息
- 设计了一个异构的seq2seq 模型,嵌入原始输入文本,以端到端的方式学习从节点属性序列到节点指示序列的映射
与传统方法相比, STNE 直接对建模节点序列,从文本序列中自动学习生成函数,将 seq2seq 网络模型与其他文本嵌入模型相结合,通过学习内容序列到节点序列的映射,将内容信息和结构信息无缝融合到隐藏层的潜在向量中,能够高效表示节点
相对于 CANE: 从相邻文本节点感知嵌入
STNE:针对不同序列学习动态的节点嵌入(需要更长范围,更灵活的上下文)
框架
STNE 总体框架
该框架步骤:
1. 给定内容丰富的网络,通过随机游走提取节点序列,并将节点序列分为两个部分
节点属性序列
节点指示序列(由节点指示向量 one-hot 表示)
2. 通过这两个序列学习特定的 seq2seq 模型,该模型可以用于将节点属性“翻译”为节点指示向量
3. 步骤二的目的是得到中间层的潜在转换( 是可用于复杂网络分析 )
更详细的总结