本文共 508 字,大约阅读时间需要 1 分钟。
算法主要部分的R语言实现为:
使用等价类的序列模式发现(Sequential Pattern Discovery using Equivalent class,SPADE)算法是应用于序列模式的垂直序列挖掘算法,它采用深度优先策略。算法的特征是:
SPADE算法是Apriori算法的扩展。
算法采用Apriori性质。
需要对初始事务数据集进行多次扫描。
采用垂直数据格式。
算法采用简单的连接运算。
所有序列的发现都需要对数据进行3次扫描。
下面是调用SPADE算法之前的伪代码
F←, ∧k←0, P←{∈∑, support_count(s)≥MIN_SUP}算法主要部分的R语言代码实现是:
序列规则、标签序列规则和类序列规则都可以从序列模式中生成,这些可以从前面的序列模式发现算法中得到。
转载地址:http://yexwl.baihongyu.com/