業(yè)務(wù)分析師的目標之一是用數據講述完整的故事,提供有關(guān)業(yè)務(wù)如何進(jìn)行或如何改進(jìn)的見(jiàn)解。這是通過(guò)商業(yè)智能儀表板來(lái)實(shí)現,該儀表板從數據倉庫提取數據。
當嘗試關(guān)聯(lián)數據倉庫中不同儀表板的信息時(shí),企業(yè)用戶(hù)開(kāi)始面臨挑戰。這通常需要求助于數據工程師,數據工程師需要在數據倉庫中創(chuàng )建數據集市–由多個(gè)星形圖組成,而這可能導致數據丟失或數據重復。
這種復雜性促使Francesco Puppini探索可更好地支持最終用戶(hù)的數據倉庫模式設計。他在與Bill Inmon合著(zhù)的《The Unified Star Schema: An Agile and Resilient Approach to Data Warehouse and Analytics Design》一書(shū)中探討了這一問(wèn)題,該書(shū)由Technics Publications出版。
在討論Unified Star Schema之前,讓我們看一下星型模式本身。
星型模式是最簡(jiǎn)單的尺寸建模形式。該模式由事實(shí)和維度組成。事實(shí)以事件為中心,而維度則引用與事實(shí)有關(guān)的信息。維度以類(lèi)似于星型的方式與事實(shí)相關(guān)。
此外,雪花模式將維度與其他維度相關(guān)聯(lián)并繼續分支。Puppini認為,當數據沒(méi)有問(wèn)題時(shí),雪花模式最適合。
他說(shuō):“但數據總是有問(wèn)題?!?/p>
Puppini說(shuō):“當你將數據寫(xiě)入數據庫時(shí)??,它是按某種方式組織。但是當你閱讀它,最好以一種不同的方式組織它?!?/p>
對于最終用戶(hù)而言,星型和雪花模式的主要挑戰是,企業(yè)用戶(hù)在尋找見(jiàn)解方面缺乏獨立性。為了使用此類(lèi)數據倉庫模式設計對數據執行復雜查詢(xún),最終用戶(hù)需要數據工程師手動(dòng)關(guān)聯(lián)數據表。Puppini說(shuō),這就像每次需要一杯水時(shí)都叫水管工一樣。此外,當關(guān)聯(lián)不兼容表時(shí),整合將事實(shí)表與聯(lián)接通常會(huì )導致重復數據。
他說(shuō),數據重復的核心問(wèn)題是扇形陷阱。當兩個(gè)或多個(gè)一對多聯(lián)接鏈接時(shí),就會(huì )發(fā)生扇形陷阱。這會(huì )與數據產(chǎn)生沖突,從而導致數據重復。從歷史上看,這是通過(guò)手動(dòng)重復數據刪除或這些臨時(shí)連接解決。
Unified Star Schema的關(guān)鍵是連接事實(shí)表的橋接。在書(shū)中,Puppini將橋接與電話(huà)總機進(jìn)行比較。在Unified Star Schema中,橋接處于中心位置,所有事實(shí)表和維度表圍繞它,每個(gè)表都連接到該橋接。然后,這限制了對數據的轉換次數。
Puppini說(shuō):“現在的數據倉庫問(wèn)題是它們不堪重負,正在過(guò)度轉換?!?/p>
通過(guò)使用橋接并執行聯(lián)合而不是聯(lián)接,這使用戶(hù)可以訪(fǎng)問(wèn)數據而無(wú)需進(jìn)行轉換。
他說(shuō):“你轉換數據越多,你就越會(huì )陷入混亂。我只是采取最少步驟以將信息整合在一起?!?/p>
請點(diǎn)擊查看由Technics Publications出版的Bill Inmon和Francesco Puppini撰寫(xiě)的《The Unified Star Schema》的摘錄,以了解有關(guān)Unified Star Schema的部署和用例的更多信息。
免責聲明:本站發(fā)布的內容(圖片、視頻和文字)以原創(chuàng )、來(lái)自本網(wǎng)站內容采集于網(wǎng)絡(luò )互聯(lián)網(wǎng)轉載等其它媒體和分享為主,內容觀(guān)點(diǎn)不代表本網(wǎng)站立場(chǎng),如侵犯了原作者的版權,請告知一經(jīng)查實(shí),將立刻刪除涉嫌侵權內容,聯(lián)系我們QQ:712375056,同時(shí)歡迎投稿傳遞力量。
Copyright ? 2009-2022 56dr.com. All Rights Reserved. 特網(wǎng)科技 特網(wǎng)云 版權所有 特網(wǎng)科技 粵ICP備16109289號
域名注冊服務(wù)機構:阿里云計算有限公司(萬(wàn)網(wǎng)) 域名服務(wù)機構:煙臺帝思普網(wǎng)絡(luò )科技有限公司(DNSPod) CDN服務(wù):阿里云計算有限公司 百度云 中國互聯(lián)網(wǎng)舉報中心 增值電信業(yè)務(wù)經(jīng)營(yíng)許可證B2
建議您使用Chrome、Firefox、Edge、IE10及以上版本和360等主流瀏覽器瀏覽本網(wǎng)站