-
algs/ 算法的具体实现
-
data/ 用于存放数据文件
-
metrics/ 算法评价方法的具体实现
-
model/ 用于存放保存的模型文件
-
results/ 可以用于保存输出的结果
-
utils/ 工具方法的具体实现
-
run.py 模型训练及测试的脚本
-
执行 python run.py [算法] 即可自动执行整个流程,包括数据预处理,模型训练,测试评价。
示例:运行MNA算法:
python run.py mna -
各种参数的调整可以通过在算法名称之后添加 -参数名 参数 来完成
示例:运行MNA算法,并指定模型存放路径为 model/MNA.pkl :
python run.py mna -model_path model/MNA.pkl -
评价模型的性能采用:
- 分类任务指标
- F1
- Accuracy
- AUC
- 排序任务指标
- MRR
- Precision@1
- Precision@5
- 分类任务指标
目前实现算法包括:
- MNA算法 python run.py -mna
- STUL算法 python run.py -stul
- HYDRA算法 python run.py -hydra
- 目前的实现暂未使用网络结构特征,后续会进行补充
1.MNA: Kong, Xiangnan, Jiawei Zhang, and Philip S. Yu. "Inferring anchor links across multiple heterogeneous social networks." Proceedings of the 22nd ACM international conference on Information & Knowledge Management. 2013.
2.STUL: Chen, Wei, et al. "Exploiting spatio-temporal user behaviors for user linkage." Proceedings of the 2017 ACM on Conference on Information and Knowledge Management. 2017.
3.HYDRA: Liu, Siyuan, et al. "Hydra: Large-scale social identity linkage via heterogeneous behavior modeling." Proceedings of the 2014 ACM SIGMOD international conference on Management of data. 2014.