參考數據管理是什麼?
參考數據管理是跨越所有系統和事業線,管理其分類和階層架構的過程,可能包括執行參考數據的分析、追蹤參考數據的變化、發佈參考數據等等。為了有效管理參考數據,公司必須制定方針、框架和標準,以治理及管理內部和外部的參考數據。
參考數據管理(RDM)自 2012 年舉世聞名之後,現已成為主要數據管理( MDM ) 的關鍵要素。 RDM 所提供的程序和技術,用於識別、協調及分享已編碼和相對較靜態的數據集,以便在多個區域(員工、系統和其他主要數據領域)中作為「參考」。這樣的系統藉由掌握參考數據,而能提供治理、程序、安全和稽核控制。此外,RDM 系統也可針對整個企業的各種參考數據呈現方法和各個數據領域,管理它們之間複雜的對應關係。當代大多數 RDM 系統還提供連線功能,通常是服務導向架構(SOA)的服務層(又名微服務),以便分享參考數據給企業應用程式、分析/數據科學和治理應用程式。

為何參考數據管理如此重要?
在商業 RDM 解決方案上市供應之前,機構是使用現有的軟體,例如 RDBMS、試算表、工作流程軟體(業務程序管理或 BPM)和其他工具等,來建立客戶解決方案,但此類系統通常缺乏變更管理、稽核控制以及精細的安全功能/權限。因此,這些傳統解決方案越來越容易成為法規遵循風險。由於主要參考數據用於驅動關鍵業務流程和應用程式邏輯,所以參考數據中的錯誤,可能會產生負面且倍數成長的重大業務影響。參考數據的比對錯誤會導致 (1) 影響數據品質、(2) 影響商業情資報告的完整性;(3) 也是應用程式整合失敗的常見根源。正好現在許多企業已不再建設自己的 CRM、ERP 和 MDM 系統,所以有不少機構開始購買商業 RDM 或 RDG 解決方案,而這些解決方案可以輕鬆客製化或設定,並得到主要軟體供應商的全面持續支援。
參考數據管理有哪些好處?
參考數據管理的好處是,通過集中控制,您可以確保一致性和合規性。它能幫助業務團隊以一致且符合法規的方式,在多個系統之間存取、發佈及更新參考數據,以滿足各項業務需求。有效的參考數據管理,可以讓企業擴大營運和分析程序的規模。無需重組整個企業的數據,即可快速回應新數據需求或市場變化。
參考數據管理可以為您的數據帶來一致性,而透過管理每一版參考數據,並用對應表將它們連接起來,企業可以實現跨時間、跨不同標準的語意一致性。如果沒有這種一致性,機構有可能產生低品質的數據和發生小錯誤,長久之後,這些小錯誤則可能成為代價高昂的大錯誤。

參考數據管理評估標準
- 參考數據的對應能力:除了標準參考數據集(國家代碼、貨幣和語言等)之外,RDM 中樞還必須能夠管理應用程式專屬、產業專屬、使用案例專屬、新版本、本地化(例如外語版本)等調適。此外,也需要管理參考數據集和所有這些排列組合之間的關係。
- 參考數據類型的管理:自製參考數據解決方案的常見問題之一,是單一數據模型無法輕易呈現多種不同類型的參考數據,需要擴展數據模型來支援各個新的參考數據集,然後使用各類參考數據專屬的新屬性來進行管理。
- 參考數據集的管理和使用者體驗:RDM 解決方案的設計應將業務使用者納入考量。透過提供直覺易用的使用者介面和靈活的數據模型,企業可以快速安裝、配置和匯入參考數據,而無需 IT 人員持續參與此過程。
- 架構/效能:由於參考數據具有高度相關性,因此語意模型對於管理各個參考數據集之間和跨時間的關係是有助益的。因為需要記錄參考數據本身,以及參考數據與其他領域的複雜連結,顯然會需要具有強大數據/語意模型的平台。
- 參考數據集階層管理:參考代碼表可以是單層列表或階層式列表,其階層式架構為參考數據的關鍵層面之一,是除了數值和對應關係以外還需要額外管理的部分。
- 連線功能:RDM 解決方案提供多種靈活的連接方式,以提供最大的「可存取性」。參考數據必須很容易提供給下游應用系統和遠端用戶使用,此外,每位 RDM 數據消費者都必須能夠以對他們最方便的方式和格式來存取數據。
- 匯入和輸出:RDM 解決方案應該能夠匯入和匯出多種格式的參考數據。例如以純文字檔或資料庫、以及 CSV 和 XML 等格式,提供用於出/入數據定義、來源和目的地的入站/離埠對應。
- 版本控制支援:RDM 解決方案還應該支援各樣參考數據集和相關對應的版本控制,這類版本控制功能可與生命週期管理結合使用,以隨時間管理對參考數據集和對應關係所做的變更。
- 安全性和存取控制:現代 RDM 解決方案提供以角色為基礎的強大安全功能,例如對特定實體的 CRUD 存取權,應由使用者的角色、使用者所屬的組別、該實體的相關所有權、加上實體本身的生命週期狀態來共同控制。
- 端對端的生命週期管理:RDM 解決方案應該採用治理使用者介面和工作流程等程序,為參考數據的正式治理提供支援,將企業參考數據的端對端(E2E)生命週期管理工作,交到業務使用者的手中,藉此減少 IT 部門的負擔,並提高整個機構使用數據的整體品質。