大數(shù)據(jù)(Big data)和區(qū)塊鏈等新興技術(shù)被吹捧為下一件將徹底改變企業(yè)經(jīng)營方式的大事。我們大多數(shù)人的印象是,這些技術(shù)是相互排斥的——每一種技術(shù)都有自己獨特的路徑,并且是單獨使用的。然而,事實并非這樣。
當(dāng)數(shù)據(jù)科學(xué)處理使用數(shù)據(jù)進(jìn)行適當(dāng)?shù)墓芾頃r,區(qū)塊鏈通過其分散的分類賬確保了數(shù)據(jù)的安全性。
這些技術(shù)具有巨大的未開發(fā)潛力,可以提高效率和生產(chǎn)力。問題是,這些技術(shù)是否可以結(jié)合到一起?當(dāng)區(qū)塊鏈和數(shù)據(jù)科學(xué)同時應(yīng)用時,將會實現(xiàn)什么?為什么說區(qū)塊鏈?zhǔn)菙?shù)據(jù)科學(xué)的未來?
在回答這些問題之前,讓我們先單獨研究一下這些技術(shù),以便更好地理解它們。
什么是區(qū)塊鏈?
區(qū)塊鏈基本上是一個記錄每筆交易的數(shù)字分類賬。由于它是分散的,沒有一個單一的權(quán)力機構(gòu),這意味著沒有人能夠操縱發(fā)生在這個分類賬上的交易。存儲在區(qū)塊鏈數(shù)據(jù)結(jié)構(gòu)中的信息不能被篡改,因為更改一個塊意味著更改它后面的所有其他塊。如果更改了一個過去的塊,則會更改所有下面的塊。因此,即使一個塊中的更改也不可能不被注意到。
隨著人們對加密貨幣和比特幣等數(shù)字貨幣的興趣日益濃厚,區(qū)塊鏈技術(shù)開始嶄露頭角。然而,今天,它不僅發(fā)現(xiàn)了記錄加密貨幣交易的相關(guān)性,而且還發(fā)現(xiàn)了記錄任何有價值東西的相關(guān)性。
Upwork進(jìn)行的一項研究發(fā)現(xiàn),區(qū)塊鏈技能是自由職業(yè)市場上最熱門的商品之一。該報告還強調(diào),區(qū)塊鏈的招聘職位近年來呈指數(shù)級增長。
區(qū)塊鏈的應(yīng)用遠(yuǎn)遠(yuǎn)超出了比特幣等貨幣用例。區(qū)塊鏈中的塊可以容納不同種類的信息,因此使區(qū)塊鏈非常的通用??梢源鎯υ趨^(qū)塊鏈中的東西包括醫(yī)療記錄、地契、汽車所有權(quán)等等。簡而言之,區(qū)塊鏈在任何情況下都是有價值的,在這種情況下,以透明、分散、安全和無篡改的方式記錄東西都是必不可少的。區(qū)塊鏈的更多用例如下:
· 創(chuàng)建數(shù)字身份系統(tǒng)
· 保存實體產(chǎn)品的記錄
· 開發(fā)各種金融工具
· 使投票更加透明
什么是數(shù)據(jù)科學(xué)?
數(shù)據(jù)科學(xué)是當(dāng)今技術(shù)發(fā)展的趨勢產(chǎn)業(yè)之一。該領(lǐng)域在預(yù)測分析、診斷分析和描述分析等子領(lǐng)域有很多創(chuàng)新。
數(shù)據(jù)科學(xué)的目標(biāo)是從結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)中提取見解和其他信息。數(shù)據(jù)科學(xué)領(lǐng)域包括機器學(xué)習(xí)、數(shù)據(jù)分析、統(tǒng)計和其他高級方法,這些方法用于了解使用數(shù)據(jù)的實際過程。
Facebook、谷歌、蘋果和亞馬遜等企業(yè)巨頭每天都在挖掘海量數(shù)據(jù)。數(shù)據(jù)科學(xué)的廣闊領(lǐng)域刺激了對數(shù)據(jù)科學(xué)家的需求,他們的任務(wù)是從數(shù)據(jù)中獲得意義,并幫助解決現(xiàn)實世界的問題。這一需求還來自大數(shù)據(jù)領(lǐng)域,這是數(shù)據(jù)科學(xué)的一個先進(jìn)領(lǐng)域,處理的是傳統(tǒng)數(shù)據(jù)處理技術(shù)無法處理的海量數(shù)據(jù)。
區(qū)塊鏈和數(shù)據(jù)科學(xué)——它們是相關(guān)的嗎?
區(qū)塊鏈和數(shù)據(jù)科學(xué)之間的關(guān)系,如果有的話,還沒有太多的研究。簡單地看一下,這兩種技術(shù)的中心都有數(shù)據(jù)。當(dāng)區(qū)塊鏈驗證和記錄數(shù)據(jù)時,數(shù)據(jù)科學(xué)專注于從數(shù)據(jù)中獲得有意義的見解,以解決問題。這兩種技術(shù)都使用算法來控制與不同數(shù)據(jù)段的交互。在crux中,數(shù)據(jù)科學(xué)用于預(yù)測,而區(qū)塊鏈用于驗證數(shù)據(jù)。
區(qū)塊鏈如何幫助大數(shù)據(jù)?
可以說,如果大數(shù)據(jù)是指數(shù)據(jù)的數(shù)量,那么區(qū)塊鏈就是指數(shù)據(jù)的質(zhì)量。
使用區(qū)塊鏈,實現(xiàn)一種處理數(shù)據(jù)的新方法是可能的。它消除了將數(shù)據(jù)集中在一起的需要,并為一種分散式的結(jié)構(gòu)鋪平了道路,在這種結(jié)構(gòu)中,數(shù)據(jù)分析可以直接從單個設(shè)備的邊緣進(jìn)行。此外,通過區(qū)塊鏈生成的數(shù)據(jù)是經(jīng)過驗證的、結(jié)構(gòu)化的和不可變的。區(qū)塊鏈提供的數(shù)據(jù)保證了數(shù)據(jù)的完整性,增強了大數(shù)據(jù)。
如今,隨著數(shù)據(jù)變得更容易訪問和更健壯,大多數(shù)企業(yè)都在尋求更深入、更先進(jìn)的分析方法。目前,業(yè)務(wù)使用的數(shù)據(jù)大多是分散式的,需要幾周或幾個月的時間來整理。任何類型的人為錯誤都可能極大地影響數(shù)據(jù)的完整性,從而影響最終的分析。當(dāng)數(shù)據(jù)存儲在一個集中的位置時,它還面臨著被破壞的風(fēng)險。數(shù)據(jù)中心也有可能被篡改并向公眾公布。每個人都想要需求,但要確保它是準(zhǔn)確和安全的,這是一項艱巨的任務(wù)。為了執(zhí)行數(shù)據(jù)分析和預(yù)測建模,數(shù)據(jù)科學(xué)需要一個功能強大的數(shù)據(jù)集。通過分散化的區(qū)塊鏈,數(shù)據(jù)科學(xué)家可以增強他們管理數(shù)據(jù)的能力,并設(shè)置一個堅實的基礎(chǔ)設(shè)施。
你知道嗎,最近一個由47家日本銀行組成的財團與一家名為Ripple的區(qū)塊鏈創(chuàng)業(yè)公司簽約,使用區(qū)塊鏈便利銀行賬戶間的轉(zhuǎn)賬。此舉背后的動機是在執(zhí)行實時傳輸?shù)耐瑫r大幅降低成本。如你所知,傳統(tǒng)的實時轉(zhuǎn)賬在成本方面有點高,因為潛在的風(fēng)險因素是巨大的。實時轉(zhuǎn)賬的問題之一是雙重支出。這可以通過使用區(qū)塊鏈技術(shù)加以控制。傳統(tǒng)的實時傳輸成本高昂的原因之一是潛在的風(fēng)險因素。雙重支出(這是交易失敗的一種形式,同一安全代幣被使用兩次)是實時傳輸?shù)囊粋€真正問題。
除了銀行業(yè),許多行業(yè)也在考慮安全性的情況下采用了區(qū)塊鏈。從零售、醫(yī)療到公共管理,各行各業(yè)的公司都已開始了他們的區(qū)塊鏈之旅,以防止數(shù)據(jù)泄露和黑客攻擊。區(qū)塊鏈?zhǔn)菙?shù)據(jù)科學(xué)的未來。
區(qū)塊鏈將如何增強數(shù)據(jù)科學(xué)
使數(shù)據(jù)可追溯
區(qū)塊鏈促進(jìn)了對等關(guān)系。例如,如果發(fā)布的帳戶沒有正確地解釋任何方法,任何同行都可以檢查整個過程并確定結(jié)果是如何獲得的。
有了賬本透明的渠道,任何人都可以知道哪些數(shù)據(jù)是可靠的,如何存儲,如何更新,從哪里來,以及如何正確使用。總之,區(qū)塊鏈技術(shù)將使用戶能夠跟蹤從入口到出口的數(shù)據(jù)。
使實時分析成為可能
實時數(shù)據(jù)分析是非常困難的。能夠?qū)崟r監(jiān)控變化被認(rèn)為是識別騙子最熟練的方法。然而,長期以來,實時分析是不可能的。今天,由于區(qū)塊鏈的分布式特性,公司能夠從一開始就檢測數(shù)據(jù)庫中的任何異常。
實時查看數(shù)據(jù)變化的能力是電子表格中的一個特性。就像區(qū)塊鏈也能讓兩個或更多的人同時處理同一種信息。
保證數(shù)據(jù)質(zhì)量
區(qū)塊鏈的數(shù)字分類賬中的信息存儲在不同的節(jié)點中,包括私有節(jié)點和公共節(jié)點。在添加到其他塊之前,在入口點本身對信息進(jìn)行交叉檢查和分析。這個過程本身就是驗證數(shù)據(jù)的一種方法。
讓數(shù)據(jù)共享更容易
對于組織來說,如果有一個平穩(wěn)而容易的數(shù)據(jù)流,就會有很多優(yōu)勢。紙質(zhì)記錄非常困難。當(dāng)在其他地方需要其中的數(shù)據(jù)時,這種困難就更加復(fù)雜了。這些文件確實會到達(dá)另一個部門,但這可能需要很長時間,而且還可能面臨在傳輸過程中丟失的風(fēng)險。
如今,大多數(shù)數(shù)據(jù)科學(xué)家對區(qū)塊鏈非常著迷,因為它可以讓兩個人或更多的人同時實時訪問數(shù)據(jù)。
因此,當(dāng)信息不受任何限制地流動時,管理過程就會變得精簡。
確保信任
你必須意識到,當(dāng)只有一個權(quán)威時,偏見往往是一個問題。過分信任一個人可能會被證明是危險的。由于信任問題,許多公司不允許任何第三方訪問它們的數(shù)據(jù)。這使得信息共享幾乎是不可能的。使用區(qū)塊鏈技術(shù),信任問題不會妨礙信息共享。組織能夠通過共享他們所擁有的信息來有效地合作。
提高了數(shù)據(jù)的完整性
過去十年,各機構(gòu)的主要工作重點是提高數(shù)據(jù)存儲能力。在2017年底,這個問題得到了解決?,F(xiàn)在,大多數(shù)組織關(guān)心的新問題是保護和驗證數(shù)據(jù)的完整性。
這主要是因為組織從不同的中心收集數(shù)據(jù)。甚至從政府辦公室或內(nèi)部獲取的數(shù)據(jù)也可能容易出錯。此外,社交媒體等其他數(shù)據(jù)來源也可能被證明是不準(zhǔn)確的。
如今,數(shù)據(jù)科學(xué)家正在使用區(qū)塊鏈技術(shù)來確保數(shù)據(jù)的真實性,并跟蹤數(shù)據(jù)鏈上的每一點。其大規(guī)模采用的原因之一是其不可變的安全性。通過區(qū)塊鏈的分散式分類賬,數(shù)據(jù)在每一步都通過多個簽名得到保護。為了讓任何人都能訪問數(shù)據(jù),必須提供準(zhǔn)確的簽名。這樣做的結(jié)果是大大減少了數(shù)據(jù)入侵和泄漏的情況。
以下是區(qū)塊鏈的一些安全特性,對數(shù)據(jù)科學(xué)來說是無價的:
交易編碼
區(qū)塊鏈?zhǔn)褂脧?fù)雜的數(shù)學(xué)算法對發(fā)生在其分類賬中的每筆交易進(jìn)行加密。這些交易作為不可變和不可逆轉(zhuǎn)的雙方之間的數(shù)字合約而存在。
數(shù)據(jù)湖
數(shù)據(jù)科學(xué)家通常在數(shù)據(jù)湖中記錄他們組織的細(xì)節(jié)。當(dāng)區(qū)塊鏈用于跟蹤數(shù)據(jù)的起源時,它被記錄在具有特定加密密鑰的特定塊中。這意味著,任何使用這些數(shù)據(jù)的人都擁有來自原始數(shù)據(jù)者的正確密鑰,這意味著這些信息是準(zhǔn)確的、高質(zhì)量的和真實的。
結(jié)論
數(shù)據(jù)科學(xué)是一個不斷發(fā)展的領(lǐng)域。隨著區(qū)塊鏈技術(shù)的集成,透明的記錄保存和健壯的安全性將成為現(xiàn)實,因此,數(shù)據(jù)科學(xué)家將能夠?qū)崿F(xiàn)一些以前認(rèn)為不可能實現(xiàn)的里程碑。雖然區(qū)塊鏈?zhǔn)且豁椣鄬^新的技術(shù),但一些已經(jīng)在其上進(jìn)行試驗的公司的初步結(jié)果證明,它們可以有效地使用。
目前,區(qū)塊鏈還處于萌芽階段;由于圍繞它的大肆宣傳,這一點并不十分明顯。隨著技術(shù)的成熟和更多的創(chuàng)新的發(fā)生,將會出現(xiàn)更多的具體用例,而數(shù)據(jù)科學(xué)將會是一個從中受益良多的領(lǐng)域。盡管如此,關(guān)于其在數(shù)據(jù)科學(xué)領(lǐng)域的影響,特別是在需要處理大量數(shù)據(jù)的大數(shù)據(jù)領(lǐng)域,還是有人提出了一些問題。一個主要的擔(dān)憂是在這方面實現(xiàn)區(qū)塊鏈應(yīng)用程序?qū)⑹前嘿F的。這是因為與傳統(tǒng)的數(shù)據(jù)存儲方式相比,在區(qū)塊鏈中存儲數(shù)據(jù)的成本更高。相對較小的數(shù)據(jù)量可以存儲在塊中,這可能會造成一些障礙,因為大數(shù)據(jù)和數(shù)據(jù)分析任務(wù)每秒需要收集大量數(shù)據(jù)。
區(qū)塊鏈將如何演變,以解決這些問題,并繼續(xù)顛覆數(shù)據(jù)科學(xué)領(lǐng)域,還有待觀察??梢钥隙ǖ氖牵@項技術(shù)在改變數(shù)據(jù)處理和使用方式方面具有巨大的潛力。
來源: 區(qū)塊網(wǎng)
評論