時常聽創(chuàng)業(yè)者說自己的公司每天會生產(chǎn)/記錄很多的數(shù)據(jù),雖然他們暫時還沒想明白怎么用這些數(shù)據(jù),但把這些數(shù)據(jù)都先存起來了。他們經(jīng)常還說,通過這些數(shù)據(jù)他們的產(chǎn)品/服務(wù)將得到很大的提升,仿佛這些數(shù)據(jù)就是公司的救世主一樣。本文不想討論這種觀點正確與否,但想在這里解釋兩個關(guān)于大數(shù)據(jù)的常見誤解:
一、數(shù)據(jù)不等于信息
經(jīng)常有人把數(shù)據(jù)和信息當(dāng)作同義詞來用。其實不然,數(shù)據(jù)指的是一個原始的數(shù)據(jù)點(無論是通過數(shù)字,文字,圖片還是視頻等等),信息則直接與內(nèi)容掛鉤,需要有資訊性(informative)。數(shù)據(jù)越多,不一定就能代表信息越多,更能不能代表信息就會成比例增多。我們來看兩個簡單的例子:
備份。很多人如今已經(jīng)會定期的對自己的硬盤進(jìn)行備份。這個沒什么好多解釋的,每次備份都會創(chuàng)造出一組新的數(shù)據(jù),但信息并沒有增多。
多個社交網(wǎng)站上的信息。我們當(dāng)中的很多人在多個社交網(wǎng)站上活躍,隨著我們上的社交網(wǎng)站越多,我們獲得的數(shù)據(jù)就會成比例的增多,我們獲得的信息雖然也會增多,但卻不會成比例的增多。不單單因為我們會互相轉(zhuǎn)發(fā)好友的微博(或者其他社交網(wǎng)站上的內(nèi)容),更因為很多內(nèi)容會十分類似,有些微博雖然具體文字不同,但表達(dá)的內(nèi)容十分相似。
二、信息不等于智慧(Insight)
好吧,現(xiàn)在我們?nèi)コ藬?shù)據(jù)中所有重復(fù)的部分,也整合了內(nèi)容類似的數(shù)據(jù),現(xiàn)在我們剩下的全是信息了,這對我們就一定有用嗎?不一定,信息要能轉(zhuǎn)化成智慧,至少要滿足以下三個標(biāo)準(zhǔn):
可破譯性。這可能是個大數(shù)據(jù)時代特有的問題,越來越多的企業(yè)每天都會生產(chǎn)出大量的數(shù)據(jù),卻還沒想好怎么用,因此,他們就將這些數(shù)據(jù)暫時非結(jié)構(gòu)化(unstructured)的存儲起來。這些非結(jié)構(gòu)化的數(shù)據(jù)卻不一定可破譯。比如說,你記錄了某客戶在你網(wǎng)站上三次翻頁的時間間隔:3秒,2秒,17秒,卻忘記標(biāo)注這三個時間到底代表了什么,這些數(shù)據(jù)是信息(非重復(fù)性),卻不可破譯,因此不可能成為智慧。
關(guān)聯(lián)性。我們曾經(jīng)對關(guān)聯(lián)性的重要性進(jìn)行過解釋。這里不再贅述了,無關(guān)的信息,至多只是噪音。
新穎性。這個和我前文舉的那個社交網(wǎng)站的例子類似,不同的是,這里的新穎性很多時候無法僅僅根據(jù)我們手上的數(shù)據(jù)和信息進(jìn)行判斷。舉個例子,某電子商務(wù)公司通過一組數(shù)據(jù)/信息,分析出了客戶愿意為當(dāng)天送貨的產(chǎn)品多支付10塊錢,然后又通過另一組完全獨立的數(shù)據(jù)/信息得到了同樣的內(nèi)容,這樣的情況下,后者就不具備新穎性。不幸的是,很多時候,我們只有在處理了大量的數(shù)據(jù)和信息以后,才能判斷它們的新穎性。
大數(shù)據(jù)時代來襲
那么大數(shù)據(jù)到底有什么用?到底會帶來怎樣的變化呢?
隨著社交網(wǎng)絡(luò)、云服務(wù)、網(wǎng)上購物、數(shù)字閱讀等各種新的線上消費(fèi)和生活模式的流行和普及,可以預(yù)見的是人們和互聯(lián)網(wǎng)之間的聯(lián)系程度在將來越來越緊密。
用戶和消費(fèi)者的消費(fèi)習(xí)慣、興趣愛好、關(guān)系網(wǎng)絡(luò)以及整個互聯(lián)網(wǎng)的趨勢、潮流都將成為互聯(lián)網(wǎng)從業(yè)者關(guān)注的重點和熱點,而這一切的獲取和分析都離不開大數(shù)據(jù)。
所以,所謂的大數(shù)據(jù)意味著一種新的信息建構(gòu)模式和商業(yè)模式,意味著數(shù)據(jù)背后往往就潛藏著商業(yè)利益和經(jīng)濟(jì)增長點,意味著凌亂紛繁的數(shù)據(jù)背后就是更符合用戶興趣和習(xí)慣的產(chǎn)品和服務(wù),意味著廠商可以更好地自己的產(chǎn)品和服務(wù)進(jìn)行針對性地調(diào)整和優(yōu)化。
所以,IBM才會以超過140億美元的代價在過去收購大量與數(shù)據(jù)處理和分析有關(guān)的企業(yè),而惠普也會在2011年以67億英鎊收購Autonomy,而Google也不遺余力地先后收購數(shù)據(jù)分析公司Record Future和Postrank。
由于大數(shù)據(jù)所需要的非常的技術(shù)和經(jīng)濟(jì)背景,它往往是和微軟、Google、Facebook以及IBM這樣的大公司聯(lián)系在一起的,但是這并不意味著大數(shù)據(jù)就和我們的日常生活沒有關(guān)系,事實上,大數(shù)據(jù)已經(jīng)滲入到我們生活的方方面面,從方方面面影響、改變著我們的生活。
隨之而來的問題就是,大數(shù)據(jù)究竟和我們的生活有怎樣的關(guān)系?
當(dāng)我們每次用Google進(jìn)行搜索,在Gmail中出現(xiàn)的關(guān)鍵字;iPhone用戶和Siri互動所產(chǎn)生的所有信息都會被蘋果公司收集并進(jìn)行整理分析;Facebook一直對用戶信息進(jìn)行著收集。甚至連NFL、NBA和奧運(yùn)會等各種體育賽事中都已經(jīng)開始熟稔地運(yùn)用大數(shù)據(jù)對球員和球隊進(jìn)行分析。
盡管國內(nèi)的大數(shù)據(jù)起步晚而且發(fā)展遲緩,但如阿里巴巴、淘寶等也同樣對平臺上的用戶數(shù)據(jù)進(jìn)行著收集和整理。
現(xiàn)在大數(shù)據(jù)所形成的市場規(guī)模在51億美元左右,而到2017年此數(shù)據(jù)預(yù)計會上漲到530億美元。
實際上我們就已經(jīng)和大數(shù)據(jù)發(fā)生里密不可分的關(guān)系,生活中各種各樣的大數(shù)據(jù)應(yīng)用一方面使得用戶體驗不斷被優(yōu)化,另一方面又使得各種應(yīng)用者從中尋找到新的商機(jī)。
大數(shù)據(jù)時代已經(jīng)來臨,大數(shù)據(jù)的海洋正波濤洶涌地涌向人們,那么諸位那么準(zhǔn)備好乘風(fēng)破浪迎接大數(shù)據(jù)的洗禮了嗎?
大數(shù)據(jù)已成紅海?!全球十四個大數(shù)據(jù)公司全面盤點!
在本文中,我整理了當(dāng)今世界上在大數(shù)據(jù)領(lǐng)域最具話語權(quán)的企業(yè),它們有的是計算機(jī)或者互聯(lián)網(wǎng)領(lǐng)域的巨頭,有的是剛剛創(chuàng)辦不久的初創(chuàng)企業(yè)。但它們有一個共同點,那就是它們都看到了大數(shù)據(jù)帶來的大機(jī)會于是毫不猶豫地挺進(jìn)了這個領(lǐng)域。
雖然大數(shù)據(jù)是比云計算還要新興的一個術(shù)語,但是通過我在這篇文章里列舉的一些公司你就可以發(fā)現(xiàn),在此領(lǐng)域已有很多外國企業(yè)深耕已久,但是國內(nèi)企業(yè)在這個領(lǐng)域還幾乎是空白。
傳統(tǒng)巨頭:
企業(yè)名稱:IBM
網(wǎng)址:http://www.ibm.com/
上線時間:2011年5月
公司地址:美國紐約州阿蒙克市
融資狀況:IBM業(yè)務(wù)
業(yè)務(wù)方向:主要面向大企業(yè)等市場
IBM這個藍(lán)色巨人現(xiàn)如今雖已經(jīng)沒有上世紀(jì)名號響亮,但是在如今企業(yè)市場的各個領(lǐng)域卻具有無可爭議的話語權(quán),自然它也不會放過大數(shù)據(jù)這塊肥肉,現(xiàn)在它是全球最大的信息技術(shù)和業(yè)務(wù)解決方案公司。
2011 年5月,IBM正式推出InfoSphere大數(shù)據(jù)分析平臺。InfoSphere大數(shù)據(jù)分析平臺包括 BigInsights和Streams,二者互補(bǔ),Biglnsights基于Hadoop,對大規(guī)模的靜態(tài)數(shù)據(jù)進(jìn)行分析,它提供多節(jié)點的分布式計算,可以隨時增加節(jié)點,提升數(shù)據(jù)處理能力。Streams采用內(nèi)存計算方式分析實時數(shù)據(jù)。InfoSphere大數(shù)據(jù)分析平臺還集成了數(shù)據(jù)倉庫、數(shù)據(jù)庫、數(shù)據(jù)集成、業(yè)務(wù)流程管理等組件。
企業(yè)名稱:亞馬遜
網(wǎng)址:http://www.amazon.com/
上線時間:2009年
公司地址:美國華盛頓州西雅圖
融資狀況:亞馬遜業(yè)務(wù)
業(yè)務(wù)方向:主要面向大企業(yè)等市場
對于云計算和大數(shù)據(jù),亞馬遜絕對具有先見之明,早在2009年就推出了亞馬遜彈性MapReduce(Amazon Elastic MapReduce),亞馬遜對Hadoop的需求和應(yīng)用可謂了若指掌,無論是中小型企業(yè)還是大型組織。彈性MapReduce是一項能夠迅速擴(kuò)展的 Web服務(wù),運(yùn)行在亞馬遜彈性計算云(Amazon EC2)和亞馬遜簡單存儲服務(wù)(Amazon S3)上。這可是貨真價實的云:面對數(shù)據(jù)密集型任務(wù),比如互聯(lián)網(wǎng)索引、數(shù)據(jù)挖掘、日志文件分析、機(jī)器學(xué)習(xí)、金融分析、科學(xué)模擬和生物信息學(xué)研究,用戶需要多大容量,立即就能配置到多大容量。
除了數(shù)據(jù)處理外,用戶還可以使用Karmasphere Analyst的基于服務(wù)的版本,Karmasphere Analyst是一種可視化工作區(qū),用于在亞馬遜彈性MapReduce上分析數(shù)據(jù)。用戶還可以提取結(jié)果文件,以便在數(shù)據(jù)庫或者微軟Excel或 Tableau等工具中使用。
企業(yè)名稱:甲骨文
網(wǎng)址:http://www.oracle.com/
上線時間:2010年
公司地址:美國加州紅木城
融資狀況:甲骨文業(yè)務(wù)
業(yè)務(wù)方向:主要面向大企業(yè)等市場
甲骨文在近期發(fā)布的Oracle大數(shù)據(jù)機(jī)(Oracle Big Data Appliance)為許多企業(yè)提供了一種處理海量非結(jié)構(gòu)化數(shù)據(jù)的方法。在2011年10月初召開的Oracle OpenWorld 2011大會上甲骨文正式推出了Oracle大數(shù)據(jù)機(jī)。對于那些正在尋求以更高效的方法來采集、組織和分析海量非結(jié)構(gòu)化數(shù)據(jù)的企業(yè)而言,該產(chǎn)品具有很大的吸引力。
與甲骨文近期推出的其他一體化產(chǎn)品一樣,Oracle大數(shù)據(jù)機(jī)集成了硬件、存儲和軟件,包括Apache Hadoop軟件的開源代碼分發(fā)、新的甲骨文NoSQL數(shù)據(jù)庫和用于統(tǒng)計分析的R語言開源代碼分發(fā)。該產(chǎn)品被設(shè)計為能夠與甲骨文Database 11g、Oracle Exadata數(shù)據(jù)庫云服務(wù)器,以及針對商業(yè)智能應(yīng)用的新的Oracle Exalytics商業(yè)智能云服務(wù)器一起協(xié)同工作。
企業(yè)名稱:谷歌
網(wǎng)址:http://www.google.com/
上線時間:2011年
公司地址:美國加州山景城
融資狀況:谷歌業(yè)務(wù)
業(yè)務(wù)方向:面向各類企業(yè)市場
谷歌一直是科技行業(yè)的領(lǐng)軍者,近年來幾乎在任何一項互聯(lián)網(wǎng)科技項目你都能看到谷歌的身影,大數(shù)據(jù)時代谷歌自然不會錯過。何況如果對其擁有的海量數(shù)據(jù)進(jìn)行深入挖掘,這對于提升谷歌搜索乃至所有谷歌服務(wù)的價值無可估量。
BigQuery 是Google推出的一項Web服務(wù),用來在云端處理大數(shù)據(jù)。該服務(wù)讓開發(fā)者可以使用Google的架構(gòu)來運(yùn)行SQL語句對超級大的數(shù)據(jù)庫進(jìn)行操作。 BigQuery允許用戶上傳他們的超大量數(shù)據(jù)并通過其直接進(jìn)行交互式分析,從而不必投資建立自己的數(shù)據(jù)中心。Google曾表示BigQuery引擎可 以快速掃描高達(dá)70TB未經(jīng)壓縮處理的數(shù)據(jù),并且可馬上得到分析結(jié)果。大數(shù)據(jù)在云端模型具備很多優(yōu)勢,BigQuery服務(wù)無需組織提供或建立數(shù)據(jù)倉庫。而BigQuery在安全性和數(shù)據(jù)備份服務(wù)也相當(dāng)完善。
去年底該服務(wù)只向一小部分開發(fā)者開放,現(xiàn)在任何人都可以注冊這項服務(wù)。免費(fèi)帳號可以讓你每月訪問高達(dá)100GB的數(shù)據(jù),你也可以付費(fèi)使用額外查詢和存儲空間。
企業(yè)名稱:微軟
網(wǎng)址:http://www.microsoft.com/
上線時間:2011年
公司地址:美國華盛頓州雷德蒙市
融資狀況:微軟業(yè)務(wù)
業(yè)務(wù)方向:面向各類企業(yè)市場
微軟研究部門從2006年起就一直致力于某種非常類似于Hadoop的項目,被稱為“Dryad”。今年年初,該計劃通過與SQL Server和Windows Azure云的集成實現(xiàn)了Dryad的產(chǎn)品化。雖然現(xiàn)在微軟還沒有更新,但看上去Dryad似乎將成為在SQL Server平臺上影響大數(shù)據(jù)愛好者的有力競爭者。
微軟進(jìn)入這一市場可謂“姍姍來遲”,而且在一定程度上說,數(shù)據(jù)倉庫分析和內(nèi)存分析計算市場落下了后腿。2011年初微軟發(fā)布的SQL Server R2 Parallel Data Warehouse(PDW,并行數(shù)據(jù)倉庫),PDW使用了大規(guī)模并行處理來支持高擴(kuò)展性,它可以幫助客戶擴(kuò)展部署數(shù)百TB級別數(shù)據(jù)的分析解決方案。微軟目前已經(jīng)開始提供Hadoop Connector for SQL Server Parallel Data Warehouse和Hadoop Connector for SQL Server社區(qū)技術(shù)預(yù)覽版本的連接器。 該連接器是雙向的,你可以在Hadoop和微軟數(shù)據(jù)庫服務(wù)器之間向前或者向后遷移數(shù)據(jù)。
微軟在去年推出了基于Azure云平臺的測試版 Hadoop服務(wù),今年它承諾會推出與Windows兼容的基于Hadoop的大數(shù)據(jù)解決方案(Big Data Solution),這是微軟SQL Server 2012版本(首發(fā)日期還不知道)的一部分,現(xiàn)在也不清楚微軟是否會與其他硬件合作伙伴或者相關(guān)大數(shù)據(jù)設(shè)備廠商合作。
企業(yè)名稱:EMC
網(wǎng)址:http://www.emc.com/
上線時間:不詳
公司地址:美國麻州Hopkinton市
融資狀況:EMC業(yè)務(wù)
業(yè)務(wù)方向:面向各類企業(yè)市場
EMC 于1979年成立于美國麻州Hopkinton市,1989年開始進(jìn)入企業(yè)數(shù)據(jù)儲存市場。 EMC公司是全球信息存儲及管理產(chǎn)品、服務(wù)和解決方案方面的領(lǐng)先公司。EMC是每一種主要計算平臺的信息存儲標(biāo)準(zhǔn),而且,世界上最重要信息中的 2/3 以上都是通過EMC的解決方案管理的。
面對大數(shù)據(jù)時代,EMC公司推出用于支持大數(shù)據(jù)分析的下一代平臺――EMC Greenplum統(tǒng)一分析平臺(UAP)。Greenplum UAP是一個唯一的統(tǒng)一數(shù)據(jù)分析平臺,可擴(kuò)展至其他工具,其獨特之處在于,它將對大數(shù)據(jù)的認(rèn)知和分享貫穿整個分析過程,實現(xiàn)比以往更高的商業(yè)價值。
企業(yè)名稱:Teradata
網(wǎng)址:http://www.teradata.com/
上線時間:2011年
公司地址:美國俄亥俄州邁阿密斯堡
融資狀況:Teradata業(yè)務(wù)
業(yè)務(wù)方向:面向各類企業(yè)市場
Teradata 公司(Teradata Corporation,紐約證券交易所交易代碼TDC)是全球領(lǐng)先的數(shù)據(jù)倉庫,大數(shù)據(jù)分析和整合營銷管理解決方案供應(yīng)商,專注于數(shù)據(jù)庫軟件,數(shù)據(jù)倉庫專用平臺及企業(yè)分析方案。 不久前宣布推出一款集硬件、軟件和服務(wù)于一體的全面產(chǎn)品組合——Teradata分析生態(tài)系統(tǒng) (Teradata Analytical Ecosystem),使不同的 Teradata 系統(tǒng)實現(xiàn)無縫協(xié)作,為企業(yè)客戶提供分析和更深入的洞察力,幫助其預(yù)測商業(yè)機(jī)會和加速實現(xiàn)商業(yè)價值。Teradata Unity 將確保整個Teradata Analytical Ecosystem的同步和統(tǒng)一。為了增強(qiáng)在大數(shù)據(jù)分析領(lǐng)域的優(yōu)勢, Teradata還收購Aster Data公司,以增強(qiáng)其非傳統(tǒng)數(shù)據(jù)分析的能力,突破了SQL分析的限制,協(xié)助企業(yè)從全部數(shù)據(jù)中獲取更多價值。
企業(yè)名稱:NetApp
網(wǎng)址:http://www.netapp.com
上線時間:2011年
公司地址:美國加利福尼亞州森尼韋爾
融資狀況:NetApp業(yè)務(wù)
業(yè)務(wù)方向:面向各類企業(yè)市場
Network Appliance,Inc.(NetApp,美國網(wǎng)域存儲技術(shù)有限公司)是IT存儲業(yè)界的佼佼者,自1992年創(chuàng)業(yè)以來,不斷以創(chuàng)新的理念和領(lǐng)先的技術(shù)引領(lǐng)存儲行業(yè)的發(fā)展。Network Appliance, Inc. (NetApp) 是向目前的數(shù)據(jù)密集型企業(yè)提供統(tǒng)一存儲解決方案的居世界最前列的公司。
NetApp StorageGRID 是一個久經(jīng)驗證的對象存儲軟件解決方案,設(shè)計用于管理 PB 級、全球分布的存儲庫,這些存儲庫包含企業(yè)和服務(wù)提供商的圖像、視頻和記錄。通過消除數(shù)據(jù)塊和文件中數(shù)據(jù)容器的典型約束,NetApp StorageGRID 提供了強(qiáng)大的可擴(kuò)展性。它支持單個全局命名空間內(nèi)的數(shù)十億個文件或?qū)ο蠛?PB 級容量。
NetApp StorageGRID 實現(xiàn)了智能的數(shù)據(jù)管理和安全的內(nèi)容保留。它通過一個具有內(nèi)置安全性的全局策略引擎來優(yōu)化數(shù)據(jù)存放、元數(shù)據(jù)管理和效率,該引擎管理數(shù)據(jù)的存儲、放置、保護(hù)和檢索的方式。此外,使用數(shù)字指紋和加密等技術(shù)防止內(nèi)容受到篡改。
NetApp StorageGRID 有助于隨時隨地提供數(shù)據(jù),以便于不間斷地運(yùn)營。該解決方案被設(shè)計為允許靈活進(jìn)行部署配置,以滿足全球的多站點組織的不同需要。
企業(yè)名稱:Sybase
網(wǎng)址:www.sybase.com
上線時間:2011年
公司地址:美國加州Dublin市
融資狀況:Sybase業(yè)務(wù)
業(yè)務(wù)方向:面向各類企業(yè)市場
Sybase公司成立于1984年11月,總部設(shè)在美國加州的Emeryville(現(xiàn)為美國加州的Dublin市)。作為全球最大的獨立軟件廠商之一,Sybase公司致力于幫助企業(yè)等各種機(jī)構(gòu)進(jìn)行應(yīng)用、內(nèi)容及數(shù)據(jù)的管理和發(fā)布。
Sybase IQ是Sybase公司推出的特別為數(shù)據(jù)倉庫設(shè)計的關(guān)系型數(shù)據(jù)庫。 相比于傳統(tǒng)的“行式存儲”的關(guān)系型數(shù)據(jù)庫, Sybase IQ 使用了獨特的列式存儲方式,在進(jìn)行分析查詢時,僅需讀取查詢所需的列,其垂直分區(qū)策略不僅能夠支持大量的用戶、大規(guī)模數(shù)據(jù),還可以提交對商業(yè)信息的高速訪問,其速度可達(dá)到傳統(tǒng)的關(guān)系型數(shù)據(jù)庫的百倍甚至千倍。“隨著 Sybase IQ 不斷地在分析應(yīng)用 POC 測試中拔得頭籌,有時甚至超過其他對手 100 倍之多”, Gartner 評價道,“ Sybase IQ 逐漸成為從數(shù)據(jù)集市到企業(yè)數(shù)據(jù)倉庫架構(gòu)最令人渴望的 DBMS (數(shù)據(jù)庫管理系統(tǒng))?!?/p>
自 2009 年推出以來, Sybase 陸續(xù)發(fā)布了 Sybase IQ 15.1 、 15.2 、 15.3 以至最新的 Sybase IQ 15.4 版本,每個版本都著力于增加新的核心能力以促進(jìn)更深入的高級分析。Sybase IQ 15.4是面向大數(shù)據(jù)的高級分析平臺,將大數(shù)據(jù)轉(zhuǎn)變成可指揮每個人都行動的情報信息,從而在整個企業(yè)的用戶和業(yè)務(wù)流程范圍內(nèi)輕松具備大數(shù)據(jù)的分析能力。
因此,有人說Sybase IQ15.4正在徹底改變“大數(shù)據(jù)分析”。
企業(yè)名稱:惠普
網(wǎng)址:www.hp.com
上線時間:2011年
公司地址:美國加州帕羅奧多市
融資狀況:惠普業(yè)務(wù)
業(yè)務(wù)方向:面向各類企業(yè)市場
大數(shù)據(jù)時代來臨,老牌巨頭惠普也不甘落后。不久前惠普企業(yè)服務(wù)事業(yè)部宣布推出全新服務(wù),幫助客戶更快部署惠普子公司Vertica的Vertica Analytics Platform ,從而迅速洞悉關(guān)鍵的業(yè)務(wù)信息,輔助決策過程。
Vertica Analytics Platform 讓用戶能夠大規(guī)模實時分析物理、虛擬和云環(huán)境中的結(jié)構(gòu)化、半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù),從而深入洞悉“大數(shù)據(jù)”。
Advanced Information Services for Vertica 幫助客戶最大化實現(xiàn) Vertica 分析平臺性能,并構(gòu)建企業(yè)分析專用環(huán)境?;萜仗峁脑u估到實施的一系列服務(wù),與客戶共同定義多種交付方式組合,并找出匹配其現(xiàn)有基礎(chǔ)設(shè)施的最佳解決方案。
Advanced Information Services for Vertica已在全球上市,將為實現(xiàn)“瞬捷”企業(yè)構(gòu)建靈活的智能環(huán)境。
企業(yè)名稱:沃爾瑪
網(wǎng)址:http://www.walmart.com/
上線時間:2011年
公司地址:本頓維爾
融資狀況:沃爾瑪業(yè)務(wù)
業(yè)務(wù)方向:未知
在這里看到沃爾瑪?shù)纳碛?,可能很多人會有疑問,全球最大的傳統(tǒng)零售業(yè)巨頭沃爾瑪怎么就跟大數(shù)據(jù)扯上關(guān)系了?看了下面的介紹你就會明白了。
沃爾瑪是最早通過利用大數(shù)據(jù)而受益的企業(yè)之一,曾經(jīng)擁有世界上最大的數(shù)據(jù)倉庫系統(tǒng)。通過對消費(fèi)者的購物行為等非結(jié)構(gòu)化數(shù)據(jù)進(jìn)行分析,沃爾瑪成為最了解顧客購物習(xí)慣的零售商,并創(chuàng)造了“啤酒與尿布”的經(jīng)典商業(yè)案例。早在2007年,沃爾瑪就已建立了一個超大的數(shù)據(jù)中心,其存儲能力高達(dá)4Pb以上?!督?jīng)濟(jì)學(xué)人》在2010年的一篇報道中指出,沃爾瑪?shù)臄?shù)據(jù)量已經(jīng)是美國國會圖書館的167倍。
沃爾瑪實驗室計劃將沃爾瑪?shù)?0個不同的網(wǎng)站整合成一個,同時將一個10個節(jié)點的Hadoop集群擴(kuò)展到250個節(jié)點的Hadoop集群。目前實驗室正在設(shè)計幾個能將當(dāng)前像Oracle、Neteeza這樣的開放資源的數(shù)據(jù)庫進(jìn)行遷移、整合的工具。
沃爾瑪曾進(jìn)行了一些列的收購,包括Kosmix(沃爾瑪實驗室前身)、Small Society、Set Direction、OneRiot、Social Calenda、Grabble等多家中小型創(chuàng)業(yè)公司,這些創(chuàng)業(yè)公司要么精于數(shù)據(jù)挖掘和各種算法,要么在移動社交領(lǐng)域有其專長,從此我們就可以看出沃爾瑪進(jìn)軍移動互聯(lián)網(wǎng)和挖掘大數(shù)據(jù)的決心。相信在沃爾瑪?shù)膸ьI(lǐng)下,傳統(tǒng)行業(yè)也會慢慢意識到大數(shù)據(jù)的重要性,加速步入大數(shù)據(jù)時代。
初創(chuàng)企業(yè):
除了這些傳統(tǒng)的大企業(yè)已經(jīng)開始進(jìn)入大數(shù)據(jù)領(lǐng)域之外,還有不少的創(chuàng)業(yè)企業(yè)也瞄準(zhǔn)了大數(shù)據(jù)帶來的機(jī)會,紛紛推出自己的產(chǎn)品,以期抓住大數(shù)據(jù)時代的機(jī)會。
企業(yè)名稱:Clustrix
網(wǎng)址:www.clustrix.com
創(chuàng)辦時間:2005年
公司地址:美國加州舊金山
融資狀況:1200萬美元
業(yè)務(wù)方向:面向各類企業(yè)市場等
Clustrix 創(chuàng)立于2005年,是Y Combinator 2006年冬季班的成員。Clustrix可以為SQL數(shù)據(jù)庫提供專利數(shù)據(jù)應(yīng)用方法,幫助人們處理大量的數(shù)據(jù),使SQL數(shù)據(jù)庫無限擴(kuò)容成為可能。最近 Clustrix從Sequoia Capital、USVP和 ATA Ventures三家風(fēng)險投資公司處再次獲得價值675萬美元的風(fēng)險投資,至今已獲融資1200萬美元。Clustrix總部設(shè)在美國舊金山,研發(fā)中心設(shè)在西雅圖。為打開歐洲市場,公司計劃將總部遷至荷蘭的阿姆斯特丹,并將于年底前在印度設(shè)立辦公室。
企業(yè)名稱:Cloudera
網(wǎng)址:http://www.cloudera.com/
創(chuàng)辦時間:2009年
公司地址:美國加州帕洛阿爾托
融資狀況:4000萬美元
業(yè)務(wù)方向:面向各類企業(yè)市場等
Cloudera 是一家專業(yè)從事基于Apache Hadoop的數(shù)據(jù)管理軟件銷售和服務(wù)的公司,總部位于加州帕洛阿爾托,2009年3月發(fā)布了第一款商業(yè)產(chǎn)品,當(dāng)時獲得由AccelPartners領(lǐng)投的500萬美元投資。該公司于2010年6月正式推出Cloudera企業(yè)產(chǎn)品。 2011年11月募集到4000萬美元風(fēng)險投資資金,此輪融資由風(fēng)險投資機(jī)構(gòu)Ignition Partners的合伙人弗蘭克·阿泰勒(Frank Artale)領(lǐng)投。Cloudera之前的投資者頂尖風(fēng)投機(jī)構(gòu)Accel Partners、Greylock Partners、Meritech Capital Partners 和In-Q-Tel也參與本輪投資。
除以上企業(yè)以外,包括MapR、HStreaming、Hadapt、DataStax、Datameer這些與Hadoop以及大數(shù)據(jù)相關(guān)的新公司都已經(jīng)獲得投資,新一輪熱潮正在興起。
看到以上這么多的國外企業(yè)已經(jīng)開始走上大數(shù)據(jù)之路,我們不禁想知道國內(nèi)有哪些企業(yè)在大數(shù)據(jù)方面有所建樹,但遺憾的是,與國外大數(shù)據(jù)的熱火朝天相比,國內(nèi)企業(yè)參與這一領(lǐng)域的并不多。
國內(nèi)企業(yè)在數(shù)據(jù)庫、數(shù)據(jù)倉庫、商業(yè)智能等領(lǐng)域基礎(chǔ)薄弱,IT尤其是軟件企業(yè)在布局大數(shù)據(jù)方面,已經(jīng)遠(yuǎn)遠(yuǎn)落后于國外先進(jìn)企業(yè)。對于哪些企業(yè)將來有可能成功進(jìn)入大數(shù)據(jù)領(lǐng)域,挑起大數(shù)據(jù)利用國產(chǎn)化的重?fù)?dān),不少人表示看好百度、阿里巴巴、騰訊等國內(nèi)互聯(lián)網(wǎng)巨頭,因為它們不僅具有資金、技術(shù)等方面的實力,而且一直在與數(shù)據(jù)打交道方面具有先發(fā)優(yōu)勢,其本身業(yè)務(wù)的發(fā)展趨勢與大數(shù)據(jù)發(fā)展趨勢相符。
實際上,作為中國最大的電子商務(wù)公司阿里巴巴已經(jīng)在利用大數(shù)據(jù)技術(shù)提供具體服務(wù),主要內(nèi)容就是阿里信用貸款與淘寶數(shù)據(jù)魔方這兩部分業(yè)務(wù)。
以阿里信用貸款為例,阿里巴巴通過掌握的企業(yè)交易數(shù)據(jù),借助大數(shù)據(jù)技術(shù)自動分析判定是否給予企業(yè)貸款,全程不會出現(xiàn)人工干預(yù)。據(jù)透露,截至目前阿里巴巴已經(jīng)放貸300多億元,壞賬率約0.3%左右,大大低于商業(yè)銀行。
淘寶數(shù)據(jù)魔方則是淘寶平臺上的大數(shù)據(jù)應(yīng)用方案。通過這一服務(wù),商家可以了解淘寶平臺上的行業(yè)宏觀情況、自己品牌的市場狀況、消費(fèi)者行為情況等,并可以據(jù)此作出經(jīng)營決策。
除了互聯(lián)網(wǎng)企業(yè)以外,也許還有一家不可忽略的企業(yè)極有可能在大數(shù)據(jù)領(lǐng)域異軍突起,那就是華為。盡管華為公司在大數(shù)據(jù)領(lǐng)域一直保持低調(diào)狀態(tài),但仍有相當(dāng)一部分中國用戶期待華為產(chǎn)品和方案,這主要得益于多年來華為精心打造的“國產(chǎn)IT網(wǎng)絡(luò)通信產(chǎn)品、方案領(lǐng)導(dǎo)者”的品牌形象。
近年來,尤其是進(jìn)入2012年以來,大數(shù)據(jù)漸漸地開始成為一個人們耳熟能詳?shù)男g(shù)語。有許多人認(rèn)為2012年應(yīng)該是大數(shù)據(jù)元年,更有甚者預(yù)測,下一個Facebook會誕生在大數(shù)據(jù)領(lǐng)域,不管這些看法有沒有道理,但至少我們可以看到大數(shù)據(jù)時代的帷幕已經(jīng)開啟。
如何發(fā)掘大數(shù)據(jù)的潛力?
下面向大家介紹一個數(shù)字,可能大家不常見到:百萬的5次方或一萬兆,即1,000,000,000,000,000,000(1后邊18個0)。IBM曾經(jīng)估算過一萬兆這個概念,即人類每天所產(chǎn)生的新的數(shù)據(jù)量為2.5萬兆。做個對比,地球五大洋里的海水總量為352萬兆加侖,如果一字節(jié)的數(shù)據(jù)量相當(dāng)于一桶水的話,只需要5個月左右所產(chǎn)生的“水”就可以填滿整個五大洋。
對于企業(yè)來說,面對并管理這些浩如煙海的數(shù)據(jù)時真的感覺無能為力。Oracle今年6月份發(fā)出報告稱,300家美國和加拿大企業(yè)中93%的承認(rèn)因為沒法處理他們身邊的數(shù)據(jù)而損失了一些盈利的機(jī)會。
某 “大數(shù)據(jù)”公司的首席營銷系統(tǒng)專員Pete Elliott可以幫助大小企業(yè)從浩如煙海的數(shù)據(jù)(比如博客、推特、Facebook中的贊、鏈接、圖像、視頻、評論、文本文件、回復(fù),甚至集裝箱貨單)中找到可以利用的信息。Elliott說,數(shù)據(jù)越多,搜索速度越快,客戶越喜歡。
首先我們要理清一個概念:大數(shù)據(jù),并不意味著大生意。數(shù)據(jù)分析才是帶來利潤和提高利潤的途徑。不管是大企業(yè)還是小企業(yè),都需要在市場中保持競爭力,這就需要根據(jù)大數(shù)據(jù)來做相應(yīng)的市場、競爭分析,因為競爭對手也很有可能會做這種類型的數(shù)據(jù)分析。雖然說每天產(chǎn)生2.5萬兆的數(shù)據(jù),如果不對這些信息加以整理,沒法正常使用和理解的話,也是沒有意義的。然而隨著計算機(jī)技術(shù)的發(fā)展,編程人員開發(fā)出了效率更高的軟件,可以幫助企業(yè)更好地搜集、篩選、整理,最終將數(shù)據(jù)轉(zhuǎn)換成對未來發(fā)展的分析,成為企業(yè)競爭的有利條件。
IBM 企業(yè)營銷管理副總裁Yuchun Lee建議企業(yè)先從“企業(yè)網(wǎng)站”開始進(jìn)行大數(shù)據(jù)分析。他說,“只要有人登陸網(wǎng)站,就有利用大數(shù)據(jù)的機(jī)會?!睂τ陔娮由虅?wù)企業(yè)來說,企業(yè)網(wǎng)站就是一種營銷工具。Elliott也說,“使用大數(shù)據(jù)最好先從簡單的方面開始入手,慢慢測試,最終擴(kuò)大適用范圍?!?/p>
McKee Wallwork Cleveland公司的主席Steve McKee(本文作者)最近做了一次大數(shù)據(jù)服務(wù),服務(wù)范圍已經(jīng)超過了網(wǎng)站流量。我們跟蹤了客戶的媒體消耗時間、網(wǎng)站瀏覽、客戶詢價,購買了相應(yīng)的數(shù)據(jù),最終發(fā)現(xiàn)了以上幾者的關(guān)系。我們還根據(jù)結(jié)果跟蹤了人們購買產(chǎn)品之后廣告營銷的漲跌情況。這里利用大數(shù)據(jù)分析的結(jié)果幫助McKee Wallwork Cleveland的客戶提高了媒體投資效率,預(yù)計2013年將提高9個百分點。
數(shù)據(jù)也會對消費(fèi)者滿意度有非常重要的影響。Verint Systems公司的資深營銷副總裁Ryan Hollenbeck講了一個消費(fèi)者打電話給客服中心問詢的故事??蛻舭l(fā)現(xiàn)企業(yè)的廣告中有誤導(dǎo)行為(非有意而為之)。另一位客戶利用語音分析發(fā)現(xiàn)客服對話中有客戶想取消賬號,他們根據(jù)關(guān)鍵詞、關(guān)鍵句來判斷這些可能流失的客戶,這位企業(yè)客戶通過大數(shù)據(jù)分析挽救了600多位風(fēng)險客戶,避免了1200萬美元的損失。
或許大數(shù)據(jù)最令人興奮的地方就是幫助企業(yè)預(yù)測未來。許多警察局利用歷史數(shù)據(jù)來預(yù)測“何時何地”可能發(fā)生犯罪,企業(yè)利用消費(fèi)者在線行為數(shù)據(jù)開發(fā)他們想要的產(chǎn)品。對于營銷人員來說,社交媒體之前曾經(jīng)是企業(yè)與客戶實時互動的地方,現(xiàn)在有了大數(shù)據(jù),可以更深入地挖掘消費(fèi)者信息,由此來改進(jìn)產(chǎn)品,發(fā)現(xiàn)消費(fèi)者的需求。Hollenbeck說:“社交媒體上人們的對話交流或許有進(jìn)一步發(fā)展的巨大潛力!”(TECH2IPO注:對話中人們會直接提到自己的購買意向)
如何發(fā)掘大數(shù)據(jù)的潛力?不試試怎么知道。企業(yè)需要做的就是去試一下大數(shù)據(jù)服務(wù),領(lǐng)略一下它能企業(yè)帶來的飛一般地進(jìn)步。Elliott說,基于云服務(wù)的復(fù)雜數(shù)據(jù)分析未來可能會非常廉價,低至1000美元/次。
十年前,人們面對面做生意,企業(yè)要和客戶打交道只能從很窄的層面了解客戶。如今網(wǎng)絡(luò)上隨意的交談都有可能變成發(fā)生產(chǎn)品交易的前提。企業(yè)如果依舊不認(rèn)同大數(shù)據(jù),看不清大數(shù)據(jù)和消費(fèi)者的關(guān)系,依舊不能利用大數(shù)據(jù),很有可能喪失一個寶貴的機(jī)會。
?
評論