首先,“大規模”,這種規模可以從兩個維度來衡量,一是時間序列累積大量的數據,二是在深度上更加細化的數據。
其次,“多樣化”,可以是不同的數據格式,如文字、圖片、視頻等,可以是不同的數據類別,如入口數據,經濟數據等,還可以有不同的數據來源,如互聯網、傳感器等。
最后,“動態化”,數據是不停變化的,可以隨著時間快速增加大量數據,也可以是在空間上不斷移動變化的數據。
這三 個關鍵詞對大數據從形象上做了界定。
但是還需要一個關鍵能力,就是“處理速度快”。如果這么大規模、多樣化又動態變化的數據有了,但需要很長的時間去處理分析,那不叫大數據。從另一個角度,要實現這些數據快速處理,靠人工肯定是沒辦法實現的,因此,需要借助于機器實現。
最終,我們借助機器,通過對這些數據進行快速的處理分析,獲取想要的信息或者應用的整套體系,才能稱為大數據。
合作熱線:0971-8452030