太阳城集团

  • / 9
  • 下载费用:30 金币  

一种适用于挖掘移动节点移动轨迹关联规则的APRIORI方法.pdf

关 键 词:
一种 适用于 挖掘 移动 节点 轨迹 关联 规则 APRIORI 方法
  专利查询网所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
摘要
申请专利号:

太阳城集团CN201510726496.5

申请日:

2015.10.30

公开号:

CN105224688A

公开日:

2016.01.06

当前法律状态:

授权

有效性:

有权

法律详情: 授权|||实质审查的生效IPC(主分类):G06F 17/30申请日:20151030|||公开
IPC分类号: G06F17/30 主分类号: G06F17/30
申请人: 宁波大学
发明人: 郑紫微; 金涛
地址: 315211 浙江省宁波市江北区风华路818号
优先权:
专利代理机构: 宁波诚源专利事务所有限公司 33102 代理人: 邓青玲
PDF完整版下载: PDF下载
法律状态
申请(专利)号:

太阳城集团CN201510726496.5

授权太阳城集团号:

||||||

法律状态太阳城集团日:

2018.10.19|||2016.02.03|||2016.01.06

法律状态类型:

太阳城集团授权|||实质审查的生效|||公开

摘要

本发明涉及适用于挖掘移动节点移动轨迹关联规则的Apriori方法,使用迭代方法挖掘对象数据集中所有频繁项集,并记录每个频繁项集的日期,计算每个频繁项集的支持度;利用得出的频繁项集,生成移动节点所有可能的关联移动规则,并计算每条移动规则的置信度和移动节点每条关联移动规则的日期,同时,计算每条关联移动规则的日期加权值;根据移动节点当前轨迹及步骤二生成的关联移动规则,预测移动节点下一个移动轨迹。通过将移动节点移动轨迹的太阳城集团属性与空间属性一同作为挖掘对象数据,充分考虑移动轨迹的太阳城集团和空间双重属性。相较于传统Apriori方法,本发明提供的Apriori方法适用用于挖掘移动节点移动轨迹关联规则。

权利要求书

权利要求书
1.  一种适用于挖掘移动节点移动轨迹关联规则的Apriori方法,用于对移动节点移动轨迹的关联移动规则进行挖掘,其特征在于:包含如下步骤:
步骤一、使用迭代方法挖掘对象数据集中所有频繁项集,并记录每个频繁项集的日期,计算每个频繁项集的支持度;
步骤二、利用步骤一得出的频繁项集,生成移动节点所有可能的关联移动规则,并计算每条移动规则的置信度和移动节点每条关联移动规则的日期以及计算每条关联移动规则日期的远近变动因子;同时,根据记录的日期和计算的日期远近变动因子,计算每条关联移动规则的日期加权值TWeight(R),从而得到强关联性移动规则,其中,每条关联移动规则日期对应的远变动因子m和近变动因子n计算公式如下:
m=|MaxDate-1KΣk=1KRuleDatek|Σk=1KRuleDatek,n=|MinDate-1KΣk=1KRuleDatek|Σk=1KRuleDatek;]]>
每条关联移动规则的日期加权值TWeight(R)计算公式如下:
TWeight(R)=RuleDate-MinDatenMaxDatem-MinDaten·MinDaten·MaxDatemMaxDatem+MinDaten×100;]]>
其中,RuleDate、MaxDate以及MinData分别表示移动规则的日期、移动轨迹数据集中最近的记录日期与最远的记录日期;m为移动轨迹数据集中的最近记录日期MaxDate的变动因子,即近变动因子;n为移动轨迹数据集中的最远记录日期MinData的变动因子,即远变动因子;K为该移动规则日期RuleDate所在月的总天数,RuleDatek表示该月中第k天的日期值;
步骤三、根据移动节点当前轨迹及步骤二生成的关联移动规则,预测移动节点下一个移动轨迹:
假定当前移动节点的移动轨迹为T:(cn,tn)→(cm,tm),遍历所有关联移动规则,如果关联移动规则R包含移动轨迹T则说明关联移动规则R是匹配的移动规则,然后根据下式计算关联移动规则R的匹配度,匹配度越高则越有可能是移动节点下一个移动轨迹:
Score(R)=Confidence(R)+TWeight(R)
其中,Score(R)为关联移动规则R的匹配度,Confidence(R)为关联移动规则R的置 信度,TWeight(R)为关联移动规则R的日期加权值;其中,
在步骤一中,将移动节点移动轨迹的太阳城集团属性与空间属性一同作为挖掘对象数据,用事务数据库D表示对象数据集,每条事务条目用p1,p2,…pn-2,pn-1,pn表示,其中pn={(cn,tn)||cn∈C,tn∈T},代表移动节点在太阳城集团点tn接入了路由器cn,集合C代表移动节点日常经过的所有接入路由器,T代表每天划分的X个太阳城集团段集合,X=12或24或48或72。

说明书

说明书一种适用于挖掘移动节点移动轨迹关联规则的Apriori方法
技术领域
本发明涉及一种适用于挖掘移动节点移动轨迹关联规则的Apriori方法。
背景技术
如何在海量的数据中,挖掘其中隐藏的、人们感兴趣的知识,已经成为了一个研究的热点。Agrawal等在1994年提出使用Apriori方法对顾客交易的数据库项之间的关联规则进行挖掘,这种方法分成以下两部分来完成:首先,找出数据库中所有出现频率比最小支持度大或者相等的频繁项集;然后,根据所得到的频繁项集来制定强关联规则,同时这些强关联规则必须要满足最小可信度以及最小支持度这两个基本的条件。
从上面方法实现的两个部分可以看出,Apriori方法的实现分成以下两个步骤:1、首先使用迭代方法对数据集中的所有项集进行扫描,并且设定一个支持度阈值,筛选出数据集中的所有频繁项集,即将支持度低于阈值的项集全部淘汰掉,而将支持度高于这个阈值的项集认为是频繁项集;2、得到所有的频繁项集之后,就可以利用它挖掘出强关联规则,对于每个频繁项集l产生强关联规则的基本步骤可以总结为以下两步:a、生成l所有的非空真子集;b、对于l的每个非空真子集lz,如果l的支持度除以lz的支持度大于或等于min_conf,则输出强关联规则lz→(l-lz)。
传统Apriori方法其挖掘对象的事务数据库中,内部的事务条目只具有空间属性,不适用于挖掘移动节点移动轨迹关联规则。
发明内容
本发明所要解决的技术问题是针对上述现有技术提供一种适用于挖掘移动节点移动轨迹关联规则的Apriori方法。
本发明解决上述技术问题所采用的技术方案为:一种适用于挖掘移动节点移动轨迹关联规则的Apriori方法,用于对移动节点移动轨迹的关联移动规则进行挖掘,其特征在于:包含如下步骤:
步骤一、使用迭代方法挖掘对象数据集中所有频繁项集,并记录每个频繁项集的日期,计算每个频繁项集的支持度;
步骤二、利用步骤一得出的频繁项集,生成移动节点所有可能的关联移动规则, 并计算每条移动规则的置信度;
其中,步骤一中,将移动节点移动轨迹的太阳城集团属性与空间属性一同作为挖掘对象数据,用事务数据库D表示对象数据集,每条事务条目用p1,p2,…pn-2,pn-1,pn表示,其中pn={(cn,tn)|cn∈C,tn∈T},代表移动节点在太阳城集团点tn接入了路由器cn,集合C代表移动节点日常经过的所有接入路由器,T代表每天划分的X个太阳城集团段集合,X=12或24或48或72。
考虑到移动节点每条生活存在一定的规律,比如上班族,每天上下班的线路和太阳城集团都相对固定,而对学生而言,会根据每周课程安排,重复地在某个太阳城集团点到达固定的教室上课。因此移动节点的移动轨迹数据的太阳城集团属性与空间属性之间有着紧密的联系,在挖掘移动节点的关联移动规则时,充分考虑移动轨迹的太阳城集团属性和空间属性,因此挖掘的对象数据是具有太阳城集团和空间双重属性的移动轨迹数据,而pn则能同时表示移动节点的位置与太阳城集团属性。
在大型交互数据库应用中,每条记录的日期字段往往是非常重要的,对于移动轨迹数据集而言,日期较近的移动轨迹记录重要性应该高于日期较远的,作为改进,在所述步骤二中,记录移动节点每条关联移动规则的日期以及计算每条关联移动规则日期的远近变动因子;同时,根据记录的日期和计算的日期远近变动因子,计算每条关联移动规则的日期加权值TWeight(R),从而得到强关联性移动规则,其中,每条关联移动规则日期对应的远变动因子m和近变动因子n计算公式如下:
m=|MaxDate-1KΣk=1KRuleDatek|Σk=1KRuleDatek,n=|MinDate-1KΣk=1KRuleDatek|Σk=1KRuleDatek;]]>
每条关联移动规则的日期加权值TWeight(R)计算公式如下:
TWeight(R)=RuleDate-MinDatenMaxDatem-MinDaten·MinDaten·MaxDatemMaxDatem+MinDaten×100;]]>
其中,RuleDate、MaxDate以及MinData分别表示移动规则的日期、移动轨迹数据集中最近的记录日期与最远的记录日期;m为移动轨迹数据集中的最近记录日期MaxDate的变动因子,即近变动因子;n为移动轨迹数据集中的最远记录日期MinData的变动因子,即远变动因子;K为该移动规则日期RuleDate所在月的总天数,RuleDatek表示该月中第k天的日期值。
再改进,本发明提供的Apriori方法,还包括如下步骤:
步骤三、根据移动节点当前轨迹及步骤二生成的关联移动规则,预测移动节点下一 个移动轨迹:
假定当前移动节点的移动轨迹为T:(cn,tn)→(cm,tm),遍历所有关联移动规则,如果关联移动规则R包含移动轨迹T则说明关联移动规则R是匹配的移动规则,然后根据下式计算关联移动规则R的匹配度,匹配度越高则越有可能是移动节点下一个移动轨迹:
Score(R)=Confidence(R)+TWeight(R)
其中,Score(R)为关联移动规则R的匹配度,Confidence(R)为关联移动规则R的置信度,TWeight(R)为关联移动规则R的日期加权值
与现有技术相比,本发明的优点在于:将移动节点移动轨迹的太阳城集团属性与空间属性一同作为挖掘对象数据,充分考虑了移动轨迹的太阳城集团和空间双重属性,相较于传统Apriori方法,本发明提供的Apriori方法适用用于挖掘移动节点移动轨迹关联规则。
附图说明
图1为本发明实施例中挖掘移动节点移动轨迹关联规则的Apriori方法流程图。
具体实施方式
以下结合附图实施例对本发明作进一步详细描述。
如图1所示的挖掘移动节点移动轨迹关联规则的Apriori方法,用于对移动节点移动轨迹的关联移动规则进行挖掘,其包含如下步骤:
步骤一、使用迭代方法挖掘对象数据集中所有频繁项集,并记录每个频繁项集的日期,计算每个频繁项集的支持度;该步骤中,将移动节点移动轨迹的太阳城集团属性与空间属性一同作为挖掘对象数据,用事务数据库D表示对象数据集,每条事务条目用p1,p2,…pn-2,pn-1,pn表示,其中pn={(cn,tn)|cn∈C,tn∈T},代表移动节点在太阳城集团点tn接入了路由器cn,集合C代表移动节点日常经过的所有接入路由器,T代表每天划分的X个太阳城集团段集合,X=12或24或48或72;使用迭代方法挖掘对象数据集中所有频繁项集的过程与传统Apriori方法相同,即为现有常规技术,此处不再详细描述;
步骤二、利用步骤一得出的频繁项集,生成移动节点所有可能的关联移动规则,并计算每条移动规则的置信度;该步骤中生成移动节点所有可能的关联移动规则过程与传统Apriori方法相同,计算每条移动规则的置信度的方法也与传统Apriori 方法相同,即为现有常规技术,此处不再详细描述现有常规技术;
而该步骤中,同时记录移动节点每条关联移动规则的日期以及计算每条关联移动规则日期的远近变动因子;同时,根据记录的日期和计算的日期远近变动因子,计算每条关联移动规则的日期加权值TWeight(R),从而得到强关联性移动规则,其中,每条关联移动规则日期对应的远变动因子m和近变动因子n计算公式如下:
m=|MaxDate-1KΣk=1KRuleDatek|Σk=1KRuleDatek,n=|MinDate-1KΣk=1KRuleDatek|Σk=1KRuleDatek;]]>
每条关联移动规则的日期加权值TWeight(R)计算公式如下:
TWeight(R)=RuleDate-MinDatenMaxDatem-MinDaten·MinDaten·MaxDatemMaxDatem+MinDaten×100;]]>
其中,RuleDate、MaxDate以及MinData分别表示移动规则的日期、移动轨迹数据集中最近的记录日期与最远的记录日期;m为移动轨迹数据集中的最近记录日期MaxDate的变动因子,即近变动因子;n为移动轨迹数据集中的最远记录日期MinData的变动因子,即远变动因子;K为该移动规则日期RuleDate所在月的总天数,RuleDatek表示该月中第k天的日期值;例如,该移动规则日期RuleDate为2月27日,则K=28;RuleDate25=25;又如,该移动规则日期RuleDate为3月1日,则K=31,RuleDate26=26;通过引入每条关联移动规则日期对应的远变动因子m和近变动因子n,可以对每条关联移动规则所在日期做出准确定位,以消除日期变动对后续计算日期加权值带来的波动影响,提高日期加权值的计算精确度;
步骤三、根据移动节点当前轨迹及步骤二生成的关联移动规则,预测移动节点下一个移动轨迹:
假定当前移动节点的移动轨迹为T:(cx,tx)→(cy,ty),遍历所有关联移动规则,如果关联移动规则R包含移动轨迹T则说明关联移动规则R是匹配的移动规则,然后根据下式计算关联移动规则R的匹配度,匹配度越高则越有可能是移动节点下一个移动轨迹:
Score(R)=Confidence(R)+TWeight(R)
其中,Score(R)为关联移动规则R的匹配度,Confidence(R)为关联移动规则R的置信度,TWeight(R)为关联移动规则R的日期加权值。
下面举一个具体的实例,对本发明做详细的描述,下表是一个具体的事务数据库D, X=48:
日期事务条目2.28(0,t3),(2,t4),(8,t18),(4,t24)3.1(2,t4),(8,t18),(4,t24),(5,t27)3.2(2,t4),(8,t18),(3,t21),(4,t24)3.3(2,t4),(8,t21),(4,t24),(5,t27)daten…pn-2,pn-1,pn
使用迭代方法挖掘事务数据库D中的所有频繁项集,结果如下表所示:
频繁项集支持度日期(2,t4),(8,t18)x2.28(2,t4),(4,t24)y3.1(2,t4),(8,t18),(4,t24)z3.2(8,t18),(4,t24)w3.3…………………Pn-2,Pn-1,Pn>min_suppdate
利用频繁项集生成移动节点所有可能的关联移动规则,并计算每条移动规则的置信度,结果如下表所示:
日期关联移动规则置信度2.28(2,t4)→(8,t18)95%3.1(2,t4)→(4,t24)91%3.2(2,t4)→(8,t18)>(4,t24)87%3.3(8,t18)→(4,t24)90%………………datern-1>rn>min_conf
记录移动节点每条关联移动规则的日期以及计算每条关联移动规则日期的远近变动因子;同时,根据记录的日期和计算的日期远近变动因子,计算每条关联移动规则的日期加权值TWeight(R),从而得到强关联性移动规则,其中,每条关联移动规则日期对应的远变动因子m和近变动因子n计算公式如下:
m=|MaxDate-1KΣk=1KRuleDatek|Σk=1KRuleDatek,n=|MinDate-1KΣk=1KRuleDatek|Σk=1KRuleDatek;]]>
每条关联移动规则的日期加权值TWeight(R)计算公式如下:
TWeight(R)=RuleDate-MinDatenMaxDatem-MinDaten·MinDaten·MaxDatemMaxDatem+MinDaten×100;]]>
其中,RuleDate、MaxDate以及MinData分别表示移动规则的日期、移动轨迹数据集中最近的记录日期与最远的记录日期;m为移动轨迹数据集中的最近记录日期MaxDate的变动因子,即近变动因子;n为移动轨迹数据集中的最远记录日期MinData的变动因子,即远变动因子;K为该移动规则日期RuleDate所在月的总天数,RuleDatek表示该月中第k天的日期值;结果如下表所示:
日期关联移动规则置信度日期权值2.28(2,t4)→(8,t18)95%w13.1(2,t4)→(4,t24)91%w23.2(2,t4)→(8,t18)>(4,t24)87%w33.3(8,t18)→(4,t24)90%w4……………………datern-1→rn>min_confwn
根据移动节点当前轨迹及关联移动规则,预测移动节点下一个移动轨迹:
假定当前移动节点的移动轨迹为T:(2,t4)→(8,t18),遍历所有关联移动规则,如果关联移动规则R包含移动轨迹T则说明关联移动规则R是匹配的移动规则,然后根据下式计算关联移动规则R的匹配度,匹配度越高则越有可能是移动节点下一个移动轨迹:
Score(R)=Confidence(R)+TWeight(R)
其中,Score(R)为关联移动规则R的匹配度,Confidence(R)为关联移动规则R的置信度,TWeight(R)为关联移动规则R的日期加权值;
结果如下表所示:

最后预测输出(4,t24),即移动节点最有可能在太阳城集团点t24接入了4号路由器。

太阳城集团本文
本文标题:一种适用于挖掘移动节点移动轨迹关联规则的APRIORI方法.pdf
链接地址:http://zh228.com/p-6397558.html
太阳城集团我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - - 联系我们

copyright@ 2017-2018 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备17046363号-1 
 


收起
展开
葡京赌场|welcome document.write ('');