- 資訊首頁(yè) > 開(kāi)發(fā)技術(shù) > 編程語(yǔ)言 >
- Python中怎么構建一個(gè)FP-growth算法
本篇文章為大家展示了Python中怎么構建一個(gè)FP-growth算法,內容簡(jiǎn)明扼要并且容易理解,絕對能使你眼前一亮,通過(guò)這篇文章的詳細介紹希望你能有所收獲。
FP算法發(fā)現頻繁項集的過(guò)程是:
(1)構建FP樹(shù);
(2)從FP樹(shù)中挖掘頻繁項集
FP表示的是頻繁模式,其通過(guò)鏈接來(lái)連接相似元素,被連起來(lái)的元素可看成是一個(gè)鏈表
將事務(wù)數據表中的各個(gè)事務(wù)對應的數據項,按照支持度排序后,把每個(gè)事務(wù)中的數據項按降序依次插入到一棵以 NULL為根節點(diǎn)的樹(shù)中,同時(shí)在每個(gè)結點(diǎn)處記錄該結點(diǎn)出現的支持度。
假設存在的一個(gè)事務(wù)數據樣例為,構建FP樹(shù)的步驟如下:
結合Apriori算法中最小支持度的閾值,在此將最小支持度定義為3,結合上表中的數據,那些不滿(mǎn)足最小支持度要求的將不會(huì )出現在***的FP樹(shù)中。
據此構建FP樹(shù),并采用一個(gè)頭指針表來(lái)指向給定類(lèi)型的***個(gè)實(shí)例,快速訪(fǎng)問(wèn)FP樹(shù)中的所有元素,構建的帶頭指針的FP樹(shù)如圖:
結合繪制的帶頭指針表的FP樹(shù),對表中數據進(jìn)行過(guò)濾,排序如下:
在對數據項過(guò)濾排序了之后,就可以構建FP樹(shù)了,從NULL開(kāi)始,向其中不斷添加過(guò)濾排序后的頻繁項集。過(guò)程可表示為:
免責聲明:本站發(fā)布的內容(圖片、視頻和文字)以原創(chuàng )、來(lái)自本網(wǎng)站內容采集于網(wǎng)絡(luò )互聯(lián)網(wǎng)轉載等其它媒體和分享為主,內容觀(guān)點(diǎn)不代表本網(wǎng)站立場(chǎng),如侵犯了原作者的版權,請告知一經(jīng)查實(shí),將立刻刪除涉嫌侵權內容,聯(lián)系我們QQ:712375056,同時(shí)歡迎投稿傳遞力量。
Copyright ? 2009-2022 56dr.com. All Rights Reserved. 特網(wǎng)科技 特網(wǎng)云 版權所有 特網(wǎng)科技 粵ICP備16109289號
域名注冊服務(wù)機構:阿里云計算有限公司(萬(wàn)網(wǎng)) 域名服務(wù)機構:煙臺帝思普網(wǎng)絡(luò )科技有限公司(DNSPod) CDN服務(wù):阿里云計算有限公司 百度云 中國互聯(lián)網(wǎng)舉報中心 增值電信業(yè)務(wù)經(jīng)營(yíng)許可證B2
建議您使用Chrome、Firefox、Edge、IE10及以上版本和360等主流瀏覽器瀏覽本網(wǎng)站