數(shù)據(jù)質(zhì)量決定了數(shù)據(jù)對業(yè)務(wù)的內(nèi)在價(jià)值。信息技術(shù)只是這個(gè)內(nèi)在價(jià)值的放大鏡。因此,高質(zhì)量的數(shù)據(jù)與有效的技術(shù)相結(jié)合是一項(xiàng)巨大的資產(chǎn),但低質(zhì)量的數(shù)據(jù)與有效的技術(shù)相結(jié)合也是一項(xiàng)巨大的責(zé)任。
數(shù)據(jù)管理需要對數(shù)據(jù)以及相應(yīng)的數(shù)據(jù)定義或元數(shù)據(jù)進(jìn)行適當(dāng)?shù)墓芾?。它旨在確保(元)數(shù)據(jù)質(zhì)量良好,因此是有效和高效管理決策的關(guān)鍵資源。數(shù)據(jù)質(zhì)量(DQ)通常被定義為“適合使用”,這意味著該概念的相對性質(zhì)。
在另一個(gè)決策環(huán)境中,即使是同一個(gè)業(yè)務(wù)用戶,原來其質(zhì)量可接受的數(shù)據(jù)可能被認(rèn)為質(zhì)量較差。例如,分析性銷售預(yù)測任務(wù)的數(shù)據(jù)可能不能滿足會計(jì)任務(wù)數(shù)據(jù)的要求。
數(shù)據(jù)質(zhì)量決定了數(shù)據(jù)對業(yè)務(wù)的內(nèi)在價(jià)值。信息技術(shù)只是這個(gè)內(nèi)在價(jià)值的放大鏡。因此,高質(zhì)量的數(shù)據(jù)與有效的技術(shù)相結(jié)合是一項(xiàng)巨大的資產(chǎn),但低質(zhì)量的數(shù)據(jù)與有效的技術(shù)相結(jié)合也是一項(xiàng)巨大的責(zé)任。這有時(shí)也被稱為GIGO或“無用輸入,無用輸出”原理,即使采用了最好的技術(shù),也會導(dǎo)致獲得錯(cuò)誤數(shù)據(jù)的結(jié)果。
01 信息架構(gòu)師(也稱為信息分析師)
信息架構(gòu)師負(fù)責(zé)設(shè)計(jì)概念數(shù)據(jù)模型,并與業(yè)務(wù)用戶進(jìn)行溝通和對話。其彌合了業(yè)務(wù)流程和IT環(huán)境之間的鴻溝,并與可能有助于選擇概念數(shù)據(jù)模型類型(例如EER或UML)和數(shù)據(jù)庫建模工具的數(shù)據(jù)庫設(shè)計(jì)師密切合作。在數(shù)據(jù)準(zhǔn)確性和數(shù)據(jù)完整性方面,一個(gè)良好的概念數(shù)據(jù)模型是存儲高質(zhì)量數(shù)據(jù)的關(guān)鍵要求。
02 數(shù)據(jù)庫設(shè)計(jì)師
其職責(zé)是將概念數(shù)據(jù)模型轉(zhuǎn)換為邏輯和內(nèi)部數(shù)據(jù)模型,協(xié)助應(yīng)用程序開發(fā)人員定義外部數(shù)據(jù)模型的視圖,從而有助于數(shù)據(jù)安全。為了便于將來對數(shù)據(jù)庫應(yīng)用程序進(jìn)行維護(hù),數(shù)據(jù)庫設(shè)計(jì)人員在創(chuàng)建強(qiáng)制實(shí)現(xiàn)數(shù)據(jù)一致性的各種數(shù)據(jù)模型時(shí),應(yīng)定義公司范圍的統(tǒng)一命名約定。
03 數(shù)據(jù)管理員
數(shù)據(jù)管理員是數(shù)據(jù)質(zhì)量(DQ)專家,負(fù)責(zé)確保實(shí)際業(yè)務(wù)數(shù)據(jù)和相應(yīng)元數(shù)據(jù)的質(zhì)量。他們通過執(zhí)行廣泛和定期的數(shù)據(jù)質(zhì)量檢查來評估數(shù)據(jù)質(zhì)量(DQ)。除其他評估步驟外,這些檢查涉及應(yīng)用或計(jì)算最相關(guān)的數(shù)據(jù)質(zhì)量(DQ)維度的數(shù)據(jù)質(zhì)量指標(biāo)和指標(biāo)。
顯然,他們也需要主動(dòng)采取行動(dòng),并進(jìn)一步處理這些評估的結(jié)果。第一類應(yīng)采取的措施是采取糾正措施。但是,數(shù)據(jù)管理員不負(fù)責(zé)自行更正數(shù)據(jù),因?yàn)檫@通常是數(shù)據(jù)所有者的責(zé)任。對數(shù)據(jù)質(zhì)量評估結(jié)果采取的第二種行動(dòng)涉及深入調(diào)查所發(fā)現(xiàn)數(shù)據(jù)質(zhì)量問題的根本原因。
了解這些原因可能允許設(shè)計(jì)旨在消除數(shù)據(jù)質(zhì)量問題的預(yù)防措施。預(yù)防措施可能包括修改數(shù)據(jù)來源的操作信息系統(tǒng)(例如,使字段成為強(qiáng)制性的,提供可能值的下拉列表,使界面合理化等)。
總體而言,防止錯(cuò)誤數(shù)據(jù)進(jìn)入系統(tǒng)通常比事后糾正錯(cuò)誤更具成本效益。但是,由于輸入數(shù)據(jù)中存在不必要的數(shù)據(jù)質(zhì)量問題,因此應(yīng)注意不要減慢關(guān)鍵流程。
04 數(shù)據(jù)庫管理員(DBA)
其職責(zé)是負(fù)責(zé)實(shí)施和監(jiān)視數(shù)據(jù)庫。其工作內(nèi)容包括:安裝和升級DBMS軟件、備份和恢復(fù)管理、性能調(diào)整和監(jiān)控、內(nèi)存管理、復(fù)制管理、安全性和授權(quán)等。數(shù)據(jù)庫管理員(DBA)與網(wǎng)絡(luò)和系統(tǒng)管理員密切合作。
其還與數(shù)據(jù)庫設(shè)計(jì)人員進(jìn)行交流,以降低運(yùn)營管理成本,并保證達(dá)成一致的服務(wù)水平(例如響應(yīng)時(shí)間和吞吐率)。數(shù)據(jù)庫管理員(DBA)可以提供數(shù)據(jù)可用性和可訪問性,以及其他兩個(gè)關(guān)鍵數(shù)據(jù)質(zhì)量維度。
05 數(shù)據(jù)科學(xué)家
數(shù)據(jù)科學(xué)家在數(shù)據(jù)管理的背景下是一個(gè)相對較新的職位。其負(fù)責(zé)使用最先進(jìn)的分析技術(shù)分析數(shù)據(jù),以提供新的見解,例如客戶行為。數(shù)據(jù)科學(xué)家具有將ICT技能(如編程)與定量建模(例如統(tǒng)計(jì))、業(yè)務(wù)理解、溝通和創(chuàng)造力相結(jié)合的多學(xué)科特征。數(shù)據(jù)科學(xué)家應(yīng)具備的技能(點(diǎn)擊標(biāo)題查看)
一位優(yōu)秀的數(shù)據(jù)科學(xué)家應(yīng)該擁有Java、R、Python、SAS等語言的良好編程能力。編程語言本身并不重要,只要數(shù)據(jù)科學(xué)家熟悉編程的基本概念,并知道如何使用這些來自動(dòng)執(zhí)行重復(fù)任務(wù)或執(zhí)行特定例程即可。
顯然,數(shù)據(jù)科學(xué)家應(yīng)該有統(tǒng)計(jì)學(xué)、機(jī)器學(xué)習(xí)和/或定量建模方面的全面背景。從本質(zhì)上講,數(shù)據(jù)科學(xué)是一項(xiàng)技術(shù)練習(xí)。分析模型和商業(yè)用戶之間往往存在巨大差距。為彌合這一差距,溝通和可視化設(shè)施是關(guān)鍵。數(shù)據(jù)科學(xué)家應(yīng)該知道如何通過使用交通信號燈方法,OLAP(在線分析處理)設(shè)施,如果當(dāng)時(shí)的業(yè)務(wù)規(guī)則等以用戶友好的方式表示分析模型、附帶的統(tǒng)計(jì)數(shù)據(jù)和報(bào)告。
數(shù)據(jù)科學(xué)家至少需要兩個(gè)層面的創(chuàng)造力:在技術(shù)層面上,重要的是在數(shù)據(jù)選擇、數(shù)據(jù)轉(zhuǎn)換和清理方面進(jìn)行創(chuàng)新。在分析層面上,標(biāo)準(zhǔn)分析過程的步驟必須適應(yīng)每個(gè)特定的應(yīng)用,而“正確的猜測”往往可以產(chǎn)生很大的差異。分析是一個(gè)快速發(fā)展的領(lǐng)域。
新的問題、技術(shù)和相應(yīng)的挑戰(zhàn)不斷涌現(xiàn)。數(shù)據(jù)科學(xué)家必須跟上這些新的發(fā)展和技術(shù)發(fā)展的步伐,并且有足夠的創(chuàng)造力來看待他們?nèi)绾文軌騽?chuàng)造新的商業(yè)機(jī)會。這些數(shù)據(jù)科學(xué)家在當(dāng)今的就業(yè)市場很難獲得,這并不奇怪。然而,數(shù)據(jù)科學(xué)家有助于提供新的數(shù)據(jù)和/或見解,這可以讓企業(yè)利用新的戰(zhàn)略商業(yè)機(jī)會。
總而言之,確保高質(zhì)量的數(shù)據(jù)是綜合各種技能的多學(xué)科練習(xí)。在此從數(shù)據(jù)質(zhì)量的角度回顧了以下數(shù)據(jù)管理作業(yè)配置文件:信息架構(gòu)師、數(shù)據(jù)庫設(shè)計(jì)師、數(shù)據(jù)所有者、數(shù)據(jù)管理員、數(shù)據(jù)庫管理員、數(shù)據(jù)科學(xué)家。
-
數(shù)據(jù)管理
+關(guān)注
關(guān)注
1文章
300瀏覽量
19685 -
大數(shù)據(jù)
+關(guān)注
關(guān)注
64文章
8909瀏覽量
137823
原文標(biāo)題:大數(shù)據(jù)5個(gè)熱門崗位是什么?
文章出處:【微信號:WUKOOAI,微信公眾號:悟空智能科技】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
【「具身智能機(jī)器人系統(tǒng)」閱讀體驗(yàn)】+數(shù)據(jù)在具身人工智能中的價(jià)值
可與MES系統(tǒng)集成的數(shù)據(jù)采集監(jiān)控平臺
如何找到適合的大屏數(shù)據(jù)可視化系統(tǒng)
萬里紅構(gòu)建“三醫(yī)”數(shù)據(jù)底座平臺
萬里紅智慧氣象解決方案,以高質(zhì)量數(shù)據(jù)推進(jìn)高價(jià)值氣象服務(wù)
![萬里紅智慧氣象解決方案,以高<b class='flag-5'>質(zhì)量數(shù)據(jù)</b>推進(jìn)高<b class='flag-5'>價(jià)值</b>氣象服務(wù)](https://file1.elecfans.com/web1/M00/F5/C8/wKgZoWdEM9GAb5znAAASKnkHOPw654.jpg)
AMD數(shù)據(jù)中心業(yè)務(wù)收入超越Intel
ALVA的AI+AR應(yīng)用助力企業(yè)實(shí)現(xiàn)數(shù)據(jù)價(jià)值轉(zhuǎn)化
如何搭建企業(yè)數(shù)據(jù)中臺,為設(shè)備監(jiān)控與數(shù)據(jù)分析打造堅(jiān)實(shí)基礎(chǔ)
加速釋放數(shù)據(jù)資產(chǎn)價(jià)值,助力數(shù)字經(jīng)濟(jì)高質(zhì)量發(fā)展
![加速釋放<b class='flag-5'>數(shù)據(jù)</b>資產(chǎn)<b class='flag-5'>價(jià)值</b>,助力數(shù)字經(jīng)濟(jì)高<b class='flag-5'>質(zhì)量</b>發(fā)展](https://file1.elecfans.com//web2/M00/EF/CD/wKgZomZxJGmAJRZNAAEGUmfgnHQ117.jpg)
浪潮信息存儲平臺的“南征北戰(zhàn)”:釋放數(shù)據(jù)價(jià)值的核心力量
![浪潮信息存儲平臺的“南征北戰(zhàn)”:釋放<b class='flag-5'>數(shù)據(jù)</b><b class='flag-5'>價(jià)值</b>的核心力量](https://file1.elecfans.com/web2/M00/E4/EA/wKgZomZBbn-AfPppAAAow-vBaCo587.png)
評論