數據模型,數字化轉型的核心能力

業界數字化轉型已經進入深水區,數據越來越受到大家重視,由于數據中臺等等概念的興起,大家越來越回到數據的根本問題“數據模型”。

一、什么是數據模型

我們可以先看一下生活中的模型的例子,房屋平面圖、地圖等都是很好的模型的示例。

對于下圖的房屋平面圖來說,我們基本看一眼就能知道這是一個三室兩廳兩衛的房子,有一個玄關和一個陽臺,哪里是門,哪里是墻,哪里是窗戶,每個房間的平米數是多少,全部都用各種符號表示得一清二楚。

對于地圖來說,我們也知道綠色的部分一般都表示公園,藍色的部分表示湖,黃色的粗線表示高速公路……

圖 1生活中的“模型”(圖片來源于網絡)

數據模型是用于描繪、溝通數據需求的一組簡單易懂、標準的,并且便于計算機實現的標準符號的集合。

我們都知道數據庫很強大,但數據在其中的關系卻錯綜復雜,成千上萬個表通過各種關系或約 束互連以形成復雜的結構。沒有數據模型,利益相關者很難看到現有數據庫的結構、理解關鍵概念,當需要描述數據需求的時候,也很難準確地表達出來,這也是數據模型很重要的一個最主要的原因。

下圖是一個簡單數據模型的示例:

圖 2一個關于學生-出勤-課程的數據模型(圖片來源:數據建模經典教程,Steve Hoberman)

二、數據模型的幾個關鍵形容詞

1. 數據模型是一組符號集合

與實物模型不同,數據模型不是等比例模擬出來的真實事物,而是一組能表示數據需求、數據結構的符號集合。

在房屋平面圖中,中間有條線的矩形表示窗戶,用直角扇形表示門。在數據模型中,用矩形框或圓角矩形表示實體;用線以及線上的符號表示實體之間的關系、基數或約束;用寫在線上的詞或詞組表示標簽,所有的這些符號組成了各種各樣的數據模型。

2. 數據模型是用來描繪、溝通數據需求的

建筑設計師在蓋房之前通過房屋平面圖描繪建筑需求,建筑工人就可以看著這些平面圖來蓋房子。房子蓋完之后還可以把房屋平面圖展示給客戶,這樣即使客戶不去現場看實體房就可以大概了解房屋結構。數據模型也是專門設計出來描繪數據需求,給技術實現人員來建造數據庫,并且實現數據需求無障礙溝通的“圖紙”。

3. 數據模型是簡單易懂、標準的

模型之所以可以讓人們實現快速溝通,是因為足夠標準并且簡單易懂。

自古以來,無論是蓋房子還是造火箭,都不可能事先把龐大復雜的實物拿過來給大家介紹,相反只需要通過一些簡單標準的符號,就可以表示清楚具體的意思。一旦讀者看到標準的模型語言,他們能馬上能開始討論這個模型是否準確,而不需要浪費任何額外的時間去探討建模用的符號是什么意思。

4. 數據模型是便于計算機實現的

數據模型從一個抽象層次描述了數據的靜態特征、動態行為和約束條件,最終是要通過技術實現人員轉化成能被計算機理解的程序語言,并且在數據庫中實現出來的。所以在設計數據模型的時候,必須將便于計算機實現作為模型設計的原則之一。

三、為什么需要數據模型?

企業中經常會出現以下問題:

1. 不同技術背景和業務經驗的各類人員在討論數據需求時缺少一種有效的溝通工具,在討論中經常因為對各種符號理解不一致,導致溝通效率低下,不同觀點之間很難協調,達成共識。

2. 當系統出現故障或發現數據問題時,沒有可以觀察系統的整體視角,技術人員對當前數據庫內的狀況全然不知,導致系統問題排查困難,數據問題無從下手。

3. 不同部門對業務規則的理解不一致,關于“客戶”、“產品”等關鍵概念含義多種多樣,數據庫中同名不同義,同義不同名現象隨處可見,極大地影響了數據的識別和應用。

4. ……

數據模型作為不同技術背景和業務經驗的各類人員有效溝通數據需求的重要媒介,可以幫助描述與溝通數據需求、增加數據的精確性與易用性、降低系統的維護成本并增加數據可重用性,極大地減少了以上問題出現的頻率。

1. 數據模型可以幫助不同人員描述與溝通數據需求

在企業中,來自不同部門、具有不同技術背景的業務人員、業務分析師、數據分析師、建模人員、架構師、數據庫設計人員、開發人員等各類人員經常需要共同討論數據問題與數據需求。數據模型作為一種理想的溝通工具,可以快速使相關人員達成共識,跳過對符號的理解而直接討論深層需求。

2. 數據模型可以增加數據的精確性與易用性

數據模型中的精確定義為數據提供了一個規范的結構,數據建模過程本身是發現、分析、界定數據需求的過程,可以幫助解釋數據上下文的邊界,減少數據訪問和數據存儲時發生數據異常的可能性。通過說明數據中的結構和關系,數據模型使數據更易于使用。

3. 數據模型可以降低系統維護成本、提升資產可重用性

數據模型有助于我們從整體視角了解業務與數據現狀,并有助于人們分析目前可能存在的業務與數據問題、分析修改現有數據結構是否可行和每次修改可能會帶來的影響,降低維護成本。

另外,數據模型以相對標準精確的形式保留了關于企業系統或項目的記憶,這些記憶可以作為可重用性資產供未來項目使用,從而降低構建新應用程序的成本。

四、總結

作為不同技術背景與業務經驗的各類人員有效溝通數據需求的重要媒介,數據模型越來越成為數字化轉型的核心能力。數據模型有助于人們描述與溝通數據需求、增加數據的精確性與易用性、降低系統的維護成本并增加可重用性。(作者:龔菲,數據領域工作者)

編輯 : 周寶冰

標簽:
來源:中國工業新聞網
編輯:GY653

免責聲明:本網站內容主要來自原創、合作媒體供稿和第三方自媒體作者投稿,凡在本網站出現的信息,均僅供參考。本網站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網站中的網頁或鏈接內容可能涉嫌侵犯其知識產權或存在不實內容時,應及時向本網站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網站在收到上述法律文件后,將會依法盡快聯系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。

  • 相關推薦
坚豆扑克