一种社交网络中行为特征的保护方法
本发明公开了一种社交网络中行为特征的保护方法,其特征是按如下步骤进行:1、对信息参与者总行为集合获得目标参与者的行为特征集合与特征类别集合;2、获得参与者的总特征词语集合以及每一个参与者行为集合所属的特征类别;3、获得目标参与者的相似者集合;4、选取在相似者集合中与目标参与者不在同一特征类别的相似者所对应的行为集合,提取g个相似特征词语所对应的行为作为相似特征行为;5、将相似特征行为推荐给目标参与者。本发明能有效的保护社交网络中信息参与者的行为特征,从而保护各种隐私数据,提高数据安全性。
当前,我们处于一个数据大爆炸的时代,随着互联网、数据库以及计算技术的快速发展,越来越多的信息以数字的形式被记录在数据库中,运用数据挖掘技术能够有效的对这些数据进行分析和处理,从中获得具有潜在使用价值的信息。
然而,这些以数据挖掘知识发现为目的的数据在发布过程中往往都伴随着敏感的行为特征信息的泄露,会对人们生活产生负面影响。数据发布者在发布数据信息前需要对数据集进行行为特征的保护处理工作,虽然利用各种隐私保护手段可以保证个人信息不会公布在公开的平台之上,但是个人的一些行为特征仍然可以通过一些相关的背景知识被攻击者推演而获取,如受信任的朋友圈、社交圈等,这就引出了对数据发布过程中个性行为特征保护问题的研究。
现有的一些行为特征保护方法主要分为在数据挖掘中的行为特征保护和数据发布中的行为特征保护问题。这些方法在实现过程主要是通过对数据拥有者进行匿名处理,破坏了与行为特征的关联关系,会遗漏很多重要的信息,同时提高了时间复杂度。
与已有技术相比,本发明有益效果体现在:
1、本发明利用数据挖掘技术挖掘到的目标参与者的行为特征与真实的数据有差异,通过在目标参与者的行为信息中添加与目标参与者行为信息有差异的特征行为,不仅能够有效地实现在信息发布过程真实行为特征的保护,同时也没有破坏目标参与者的真实数据,和丢失网络中的重要信息,使得本人的真实信息依然存在于网络中,从而克服现有技术中匿名处理的缺点。
2、本发明利用TF-IDF方法将所有信息参与者的行为信息进行统计分析,TF-IDF值高的词被认为是在行为信息集合中最有意义的词,将这些词作为特征词,利用K-means的聚类方法进行聚类,最终得到总特征类别集合,与传统分类方法相比,本发明能够对不同行为信息的分类进行有效融合,提高了个性化分类的精度和准确性,同时也提高了算法的时间效率。
3、本发明根据以每个个体的行为状态信息作为输入,对输入的信息进行聚类分析和判别分析,以与目标参与者特征类别不同的相似特征行为作为输出结果,对于不同的社交网站制定了一个统一的分析框架,不需要手工建立行为状态集合,从而提高算法在分类过程中的准确性。
4、本发明所提出的方法可用于各种社交网站系统中,既可以在应用于电脑网页端,同时也可以在手机App等平台上进行使用,应用范围广泛,使用方便。
联系方式
李磊
17332257308
安徽省合肥市蜀山区丹霞路485号
请填写以下信息
联系人:
手机号:
单位名称:
备注: