2012年維克托·邁爾-舍恩伯格及肯尼斯·庫克耶編寫的《大數(shù)據(jù)時(shí)代》指出,大數(shù)據(jù)或稱巨量資料,指的是所涉及的資料量規(guī)模巨大到無法通過目前主流軟件工具,在合理時(shí)間內(nèi)達(dá)到擷取、管理、處理、并整理成為幫助企業(yè)經(jīng)營決策更積極目的的資訊;維基百科中指出,大數(shù)據(jù)是指利用常用軟件工具捕獲、管理和處理數(shù)據(jù)所耗時(shí)間超過可容忍時(shí)間限制的數(shù)據(jù)集;
全球著名的管理咨詢公司McKinsey則將數(shù)據(jù)規(guī)模超出傳統(tǒng)數(shù)據(jù)庫管理軟件的獲取、存儲(chǔ)、管理以及分析能力的數(shù)據(jù)集稱為大數(shù)據(jù);研究機(jī)構(gòu)Gartner將大數(shù)據(jù)歸納為需要新處理模式才能增強(qiáng)決策力、洞察發(fā)現(xiàn)力和流程優(yōu)化能力的海量、高增長率和多樣化的信息資產(chǎn);以上所有關(guān)于大數(shù)據(jù)的定義都是建立在大數(shù)據(jù)的特征之上,即大數(shù)據(jù)的5V特征:Volume(大量)、Velocity(高速)、Variety(多樣)、Value(價(jià)值)、Veracity(真實(shí)性)。
通過這些權(quán)威機(jī)構(gòu)發(fā)布的大數(shù)據(jù)概念,讓我們對(duì)于大數(shù)據(jù)有了全新的了解,與此同時(shí)隨著大數(shù)據(jù)時(shí)代的到來,大數(shù)據(jù)應(yīng)用的爆發(fā),大數(shù)據(jù)的概念是否也需要重新描述呢?
其實(shí)早在幾年前,數(shù)據(jù)的海量增長就引起了人們的關(guān)注,海量數(shù)據(jù)的發(fā)生、使用、儲(chǔ)存伴隨著云計(jì)算的發(fā)展等都成為了現(xiàn)實(shí),“大數(shù)據(jù)”已經(jīng)走入了我們的生活。
最早將大數(shù)據(jù)用于IT環(huán)境的是知名咨詢公司麥肯錫,麥肯錫在研究報(bào)告中指出:如果云計(jì)算為數(shù)據(jù)資產(chǎn)提供了保管、訪問的場所和渠道,那么如何盤活數(shù)據(jù)資產(chǎn)使其為國家治理、企業(yè)決策乃至個(gè)人生活服務(wù),則是大數(shù)據(jù)的核心議題,也是云計(jì)算內(nèi)在的靈魂和必然的升級(jí)方向。
從信息安全角看,大數(shù)據(jù)是指規(guī)模和格式前所未有而又相互關(guān)聯(lián)的大量數(shù)據(jù),搜集自企業(yè)的各個(gè)部分,技術(shù)人員可以對(duì)它們進(jìn)行高速分析。
就像電影《黑客帝國》中的感知機(jī)器人或者《終結(jié)者》電影中的天網(wǎng)一樣,現(xiàn)在的大數(shù)據(jù)環(huán)境由大規(guī)模并行處理數(shù)據(jù)庫產(chǎn)品(不過所幸的是,它們沒有自我感知能力)組成,這些產(chǎn)品通過處理PB級(jí)(1015)到ZB級(jí)(1021)看似不同的數(shù)據(jù)來創(chuàng)建趨勢(shì)和數(shù)據(jù)映射。
通過建立這種宏觀層面的信息,大數(shù)據(jù)可以讓企業(yè)了解到他們的產(chǎn)品是如何以前所未有的經(jīng)濟(jì)理解水平在運(yùn)行。也就是說,通過以新方式來結(jié)合和分析海量數(shù)據(jù),我們可以實(shí)現(xiàn)新的業(yè)務(wù)洞察力.