當前位置:今日智造 > 智造快訊 > 新聞

最新發布的《數據資產管理實踐白皮書4.0》,是學習數據管理的最好框架指引!

2019/6/10 9:10:11 人評論 次瀏覽 來源:與數據同行 分類:新聞



2019 年 6 月 4-5 日,由中國信息通信研究院、中國通信標準化協會主辦,大數據技術標準推進委員會承辦的 2019 大數據產業峰會在北京國際會議中心召開。在 6 月 4 日下午的大會上,《數據資產管理實踐白皮書(4.0 版)》發布。


筆者仔細研讀了一下,雖然自己從事數據管理工作很多年,但還是能從中獲得很多啟示,要感謝中國信息通信研究院大數據技術標準推進委員會的杰出工作。


那么,從這本《白皮書》我們到底能學到什么?這里就從背景、框架和概念三個方面談談我的理解。


注:以下黑色斜體內容直接引用《數據資產管理實踐白皮書4.0》的原話,具體以《數據資產管理實踐白皮書4.0》原版說法為準。


一、背景說明


相對于《DAMA》的數據管理,《白皮書》強調的是數據資產管理,后者增加了資產,更強調數據的資產屬性,要求基于數據資產的價值、成本、收益開展全生命周期的管理,同時增加了數據標準管理、數據價值管理等職能,可以視作數據管理的升級版。


筆者覺得《白皮書》對于數據資產管理的重要性詮釋的特別好,提到了五個痛點,是業界實踐經驗的總結:


1、缺乏統一數據視圖


企業的數據資源散落在多個業務系統中,企業主和業務人員無法及時感知到數據的分布與更新情況,無法快速找到符合自己需求的數據,也無法發現和識別有價值的數據并納入數據資產。


數據資源散落各地是老問題,但讓業務人員感知并找到更是新的問題,比如在完成大數據平臺的數據歸集后,建立統一的高體驗的可視化平臺,建議一套數據的公開發布、宣貫、培訓流程都是對于運營的巨大挑戰。


浙江移動花了多年時間去搞DataMaster敏捷數據發布平臺,花了巨大代價去打通流程讓數據直達一線,都是為了這個目的。


2、數據孤島普遍存在


據統計, 98% 的企業都存在數據孤島問題 。而造成數據孤島的原因既包括技術上的,也包括標準和管理制度上的,這阻礙了業務系統之間順暢的數據共享,降低了資源利用率和數據的可得性。


3、數據質量低下


糟糕的數據質量常常意味著糟糕的業務決策,將直接導致數據統計分析不準確、監管業務難、高層領導難以決策等問題。根據數據質量專家 Larry English 的統計,不良的數據質量使企業額外花費 15% 到 25% 的成本 。


4、缺乏安全的數據環境


根據數據泄露水平指數 (Breach Level) 監測,自2013 年以來全球數據泄露高達 130 億條 ,其中很多都是由于管理制度不完善造成。隨著各個機構數據的快速累積,一旦發生數據安全事件,其對企業經營和用戶利益的危害性將越來越大,束縛數據價值的釋放。


不用多說,現在數據流通和變現最大的挑戰就是安全,比如要基于雙方的數據整合得到一個更好的預測結果,仍未有業界普遍認可的安全解決方法。


5、缺乏數據價值管理體系


大部分企業還沒有建立起一個有效管理和應用數據的模式,包括數據價值評估、數據成本管理等,對數據服務和數據應用也缺乏合規性的指導,沒有找到一條釋放數據價值的最優路徑 。


老板會問元數據的投入能帶來多少顯性的價值呢?《白皮書》與時俱進的提到這一點非常好,數據資產的價值運營才是王道,筆者2年前寫的一篇數據管理的文章《思考|談談數據管理的原則》也思考了這個問題。


數據資產管理嘗試通過解決釋放數據價值過程中面臨的諸多問題,以體系化的方式實現數據的可得、可用、好用,用較小的數據成本獲得較大的數據收益,這就是《白皮書》的指導意義所在。


二、體系框架


要掌握一門學問,雖然自底向上實踐出真知很重要,但自頂向下的看到全貌讓你有擁有全局視野。通過《白皮書》,不僅能看到數據管理的全貌,而且還能理解清楚這些內容之間的邏輯關系,讓你認識到數據資產管理是一門體系化的學問。


這里具體列出《白皮書》的一些框架,包括總體目錄架構、數據資產管理體系架構、數據資產管理的實施步驟等等。


1、目錄框架


編撰者最大的挑戰就是擬定目錄,因為需要對數據管理體系的知識進行歸納,總結和提煉,然后用及其精簡的術語來表達。


讀者不要總是對著目錄一掃而過,而是要帶著問題去看和反思:為什么是這些內容,為什么管理職能是這八個而不是那七個,為什么數據共享管理成為了其中的一個,如果讓你去擬定,你會怎么做。


有經驗的數據管理者是有底氣的,但自己的水平怎么樣,不是說讀懂了就可以了,而是要問自己,讓你寫,能不能寫出來,而且實踐能獲得的真知范圍還是有限的,要懷著謙卑的心態去學習。


數據資產管理實踐白皮書目錄,引自《白皮書》


長長的編委會名單,讓你知道這是各行業專家智慧的結晶,很多地方也許有爭議,但這應是當前最大的行業共識,當然也有我的東家中國移動。


數據資產管理體系架構,引自《白皮書》


順便提下中國移動的經營分析規范系列,可以說是當初最好的由一個企業編撰的數據管理類規范,這里的《白皮書》點到即止,而中國移動的經營分析規范為了能更好的指導項目落地,還有《元數據管理規范》、《數據質量管理規范》、《邏輯模型管理規范》等眾多分冊,其對于相關概念和案例有更詳盡的說明。


2、數據資產管理體系架構


《白皮書》提到的數據資產管理框架如下所示,包含 8個管理職能和 5個保障措施。管理職能是指落實數據資產管理的一系列具體行為,保障措施是為了支持管理職能實現的一些輔助的組織架構和制度體系。


數據資產管理體系架構,引自《白皮書》


數據資產管理框架中的數據模型、元數據、主數據、數據質量、數據安全和數據共享六項管理職能是比較常規的,數據標準管理和數據價值管理特別要提一下:


(1)數據標準管理


數據標準是指保障數據的內外部使用和交換的一致性和準確性的規范性約束,通常可分為基礎類數據標準和指標類數據標準。


基礎類數據標準一般包括參考數據和主數據標準、邏輯數據模型標準、物理數據模型標準、元數據標準、公共代碼和編碼標準等。


指標類數據標準一般分為基礎指標標準和計算指標(又稱組合指標),基礎指標一般不含維度信息,且具有特定業務和經濟含義。


數據標準一般包含3 個要素:標準分類、標準信息項(標準內容)和相關公共代碼和編碼(如國標、行標等)。其中標準分類指按照不同的特點或性質區分數據概念;信息項是對標準對象的特點、性質等的描述集合;公共代碼指某一標準所涉及對象屬性的編碼。


筆者的理解是這里的數據標準是標準的標準,正如元模型相對于元數據一樣,而諸如統一數據模型僅是一個實例,這個概念應該也是首次提出吧。


數據標準管理的目標是通過統一的數據標準制定和發布,推動數據的共享開放,這個意義是很大的。


(2)數據價值管理


《白皮書》提到數據價值管理是對數據內在價值的度量,可以從數據成本和數據應用價值兩方面來開展,下面是它建議的評估維度:


數據成本和價值評估的維度,引自《白皮書》


當然它也提到當前對于數據資產評估的研究還處于早期階段,評估方法手段還不成熟。可能的方法包括市場法、成本法和收益法三種,三種方法的優缺點如表所示。



數據資產價值評估典型方法比較,引自《白皮書》


應該來講,這里的評估是有其局限性的,僅針對純粹的數據交易場景,事實上,我們現實中主要的數據價值呈現形式是以數據產品、數據服務的形式體現的,對外市場定價是筆者較為看好的一個評估方向,對內由于交易成本等問題,活性評估也許是合適的,在筆者的文章《數據的價值到底如何評估?》有所闡述。


數據資產管理框架中的五項保障措施,針對最復雜的制度體系,《白皮書》給出了數據資產管理規范參考,如下所示,大家可以學習借鑒。


一種典型的制度體系架構,引自《白皮書》


當然每個企業要結合自己的實際情況制定,特別強調純粹的自頂向下制定規范往往適得其反,要記住制定的數據管理規范務必在看得到的時間范圍內能促進數據生產力的提升。


3、數據資產管理的實施要點


數據資產管理可參考按照統籌規劃、管理實施、稽核檢查、資產運營四個階段的方法策略執行,每個階段對應的管理職能如圖所示。以業務應用目標為指引,企業可以按照自身數據及管理情況制定不同的實施步驟順序。


數據資產管理實施步驟,引自《白皮書》


三、基本概念


看完《白皮書》后,如果覺得云里霧里,有兩種可能,一個是缺乏實踐,很多東西沒有形象的東西去映射,理解不了,二是對于數據管理的一些基本概念模糊。


在《你真的理解什么是“財富自由”嗎?》的文章里,李笑來老師先說了概念的重要性,絕大多人在追求某個東西的時候,可能連那個東西的定義都不清楚。


如果腦子里的一個概念不準確,或者沒有準確、正確的定義,那么必然沒辦法準確、正確的繼續思考下去,進而產生的連鎖反應是,因為定義的不準確,所以思考范圍模糊,選擇依據缺失,進而行動錯誤.......進而影響整體。


記住,這種《白皮書》的讀法不是那種一目十行的讀法,而是要一個字一個字去細摳,每出現一個術語,就要努力推敲,不僅是理解表意,還要能舉出案例,對于數據管理來講,概念的理解是至關重要的。


首先,要理解清楚基本的概念內涵。


有次看劉晨老師的一篇文章,記得是談數據治理和數據管理的區別,才知道以前的理解是錯誤的,數據治理側重正確的做事,數據管理決定怎么做。



除了數據管理和數據治理,《白皮書》里有很多的概念,包括但不限于元數據管理、主數據管理、數據質量管理、數據資源、數據資產、參考數據、數據字典、數據目錄、血緣分析、影響分析、數據地圖、數據湖、邏輯模型、概念模型、物理模型、領域模型、元模型、數據地圖、ER圖、半結構化數據、數據集成、語義分析、ETL/ELT、數據分析師、數據建模師、數據工程師、算法工程師、數據科學家、數據價值評估、數據成本管理、數據架構、數據倉庫,BI、維度建模、關系建模、數據開放、企業數據模型建設模式、主數據建設模式、統一數據平臺模式、數據集市模式等等。


比如數據湖,上次我參加一個展會,展會上的講師也沒說清楚這是個啥玩意,而他們就貿然的畫在了宣傳手冊上,很多概念也許天天碰到,但你不一定真的理解它,考你一下,半結構化數據的本質是啥?


其次,理解清楚概念的外延和關系。比如元數據的內容就可以用一本書來描述,以前中國移動的經營分析規范就有一本專門的元數據規范,細到各種技術元數據的具體案例,同時元數據跟各類數據管理系統有著千絲萬縷的關系,比如浙江移動的數據開發就完全依賴于元數據的管理,而不是僅僅停留在業務口徑的解釋上。


最后,任何一個概念的理解都要在實踐中去靈活應用和領會,實踐反過來會讓你對這個概念的理解更透徹,可以讓你形成有關于這個概念的形象思維,而這種思維有利于別人更容易理解你講的這個東西。


數據管理的核心是管理,管理就要溝通,而要把這個非常專業的東西跟領導說清楚,沒有實踐你架不住人家的刨根問底,比如CRM的領導問元數據是啥啊,你不要說是數據的數據,應該跟領導說就是類似局數據、代碼解釋的東西。


可以看到,《白皮書》給了我們一個理解數據資產管理相關實踐知識的指引,筆者這里的闡述也是浮光掠影,但無論你是哪一類數據工作者,都建議好好讀一讀,它跟你每天的工作都息息相關,至于哪里下載,自行百度吧。




作者:傅一平 (微信號:fuyipingmnb)





免責聲明:本文系網絡轉載,版權歸原作者所有,如涉及版權,請聯系我們刪除,QQ:1138247081!

共有條評論 網友評論

驗證碼: 看不清楚?
    小学数学公式规律