链路预测中精度、召回率、F值的学习记录

在机器学习领域有最常见的三个指标:精度(Precision)、召回率(Recall)、F值(F-Measure)。 那么,这三个指标实际怎么用呢? 假设我们有某指标(如CN),计算出来的节点对相似性 > 0 >0 的边,用res表示。 而实际缺失的测试集的边用gr表示。 res和gr是是两个数组,类似于如下的格式。 res = [(1,3),(2,3)] gr = [(1,3),(1,2)] 好的,我们就举个例子。 那么,预测正确的是几个呢? 显然是1个,[(1,3)]。 也就是: co = len(se...

Continue Reading »
分享到:

Normalized Mutual Information 的Python 实现 (NMI.py)

NMI是Normalized Mutual Information的简称,用于比较社团划分结果与ground-truth之间的接近程度,取值范围为[0, 1],出自2006年 Danon 的论文 [1]。 有两种计算方法,为了方便大家检测结果,写了一个通用的Python版计算函数,当然也可以直接调用库函数计算。代码如下: # -*- coding: utf-8 -*- import math def NMI(c1, c2): ''' Calculate Normalized Mutual Informati...

Continue Reading »
分享到: