大資料介紹

2022-06-29 02:39:11 字數 1302 閱讀 7613

一、 什麼是大資料?

大資料:指指資料集的大小超過了現有典型的資料庫軟體和工具的處理能力

的資料。

二、大資料的特點

1、海量化(volume)

資料量從tb到pb級別

2、多樣化(variety)

資料型別複雜,超過80%的資料是非結構化的

3、快速化(velocity)

資料量在持續增加(兩位數的年增長率)

資料的處理速度要求高

4、**值(value)

在海量多樣資料的快速分析下能夠發揮出更高的資料價值

三、大資料能做什麼

海量資料背景下

1、快速查詢 - 全量查詢

例如:每個使用者查詢上月手機流量記錄或上月通話明細。都是在海量使用者

中查詢某乙個人的記錄,三秒內出結果。

2、資料儲存 - 量大、檔案大、

傳統資料計算特點:

資料量小(基本單位是mb、gb)、

資料種類少(大都為結構化資料)、

增長速度慢

海量資料儲存

a:大資料能夠儲存海量資料

大資料時代資料量巨大,

1tb=10241g 約26萬首歌(一首歌4m)

1pb=102410241g 約2.68億首歌 (一首歌4m)

b:大資料能夠儲存單個大檔案。

目前市面上最大的單個硬碟大小約為10t左右。若有乙個檔案20t,將 無法儲存。大資料可以儲存單個20t檔案,甚至更大。

3、快速計算 - 對比傳統方案

例如:計算全國移動使用者(全國資料量大),全年內通話總時間(每個人 一年通話總和)大於1萬分鐘的人,按照從多到少順序。

4、實時計算 - 最新資料

例如:欠費的手機充話費,充值完成後,手機幾秒鐘後就能使用、雙十一實時交易大屏

5、資料探勘 - 新價值

例如:通過資料探勘演算法計算花的種類。

通過演算法識別出這些花是玫瑰花?百合?茉莉花?菊花?桂花?

大資料前景也是非常不錯且國家大力支援

大資料也是一種趨勢

趨勢之一:

5g就是一場革命,它以技術為驅動,從人與人的連線延伸到萬物互聯,從個人和家庭延伸到社會各個領域,進而為社會經濟、生活帶來革命性的影響。

5g時代 資料傳輸速度更快,延時更低,資料量也將n個數量級增長,資料量將更大。

趨勢之二:

與雲計算、人工智慧等前沿創新技術深度融合。

趨勢之三:針對製造業的大資料解決方案不斷公升級,助力智慧型製造。

大資料介紹

大資料技術的戰略意義不在於掌握龐大的資料量,而在於對這些資料進行專業化處理。資料一直都在以每年50 的速度增長,也就是說每兩年就增長一倍。大資料是由結構化和非結構化資料組成的 10 的結構化資料,儲存在資料庫中 90 的非結構化資料,它們與人類資訊密切相關 資料結構 參閱c語言資料結構 資料結構是計...

大資料介紹

一 什麼是大資料 大資料是指無法在一定時間內用常規軟體工具對其內容進行抓取 管理和處理的資料集合。大資料技術,是指從各種各樣型別的資料中,快速獲得有價值資訊的能力。適用於大資料的技術,包括大規模並行處理 mpp 資料庫,資料探勘電網,分布式檔案系統,分布式資料庫,雲計算平台,網際網路,和可擴充套件的...

1,大資料介紹

資料量很大 一台機器存不下 我們以後要面對的不是一台機器,而是一堆機器。儲存 資料量太多,一台機器存不下,需要很多機器一起存。計算 資料量太多,一台機器算不過來,需要很多機器一起算。乙個檔案太大,一台機器存不下。使用 hadoop 管理多台機器。把乙個檔案拆開存放。主節點 負責集群的管理。從節點 負...