說起大資料,估計大家都覺得只聽過概念,但是具體是什麼東西,怎麼定義,沒有乙個標準的東西,因為在我們的印象中好像很多公司都叫大資料公司,業務形態則有幾百種,感覺不是很好理解,所以我建議還是從字面上來理解大資料,在維克托邁爾-捨恩伯格及肯尼斯庫克耶編寫的《大資料時代》提到了大資料的4個特徵:
1.大量
大資料的特徵首先就體現為「大」,從先map3時代,乙個小小的mb級別的map3就可以滿足很多人的需求,然而隨著時間的推移,儲存單位從過去的gb到tb,乃至現在的pb、eb級別。只有資料體量達到了pb級別以上,才能被稱為大資料。1pb等於1024tb,1tb等於1024g,那麼1pb等於1024*1024個g的資料。隨著資訊科技的高速發展,資料開始爆發性增長。社交網路(微博、推特、臉書)、流動網路、各種智慧型工具,服務工具等,都成為資料的**。**網近4億的會員每天產生的商品交易資料約20tb;臉書約10億的使用者每天產生的日誌資料超過300tb。迫切需要智慧型的演算法、強大的資料處理平台和新的資料處理技術,來統計、分析、**和實時處理如此大規模的資料。
2.高速
就是通過演算法對資料的邏輯處理速度非常快,1秒定律,可從各種型別的資料中快速獲得**值的資訊,這一點也是和傳統的資料探勘技術有著本質的不同。大資料的產生非常迅速,主要通過網際網路傳輸。生活中每個人都離不開網際網路,也就是說每天個人每天都在向大資料提供大量的資料。並且這些資料是需要及時處理的,因為花費大量資本去儲存作用較小的歷史資料是非常不划算的,對於乙個平台而言,也許儲存的資料只有過去幾天或者乙個月之內,再遠的資料就要及時清理,不然代價太大。基於這種情況,大資料對處理速度有非常嚴格的要求,伺服器中大量的資源都用於處理和計算資料,很多平台都需要做到實時分析。資料無時無刻不在產生,誰的速度更快,誰就有優勢。
3.多樣
4.價值
這也是大資料的核心特徵。現實世界所產生的資料中,有價值的資料所佔比例很小。相比於傳統的小資料,大資料最大的價值在於通過從大量不相關的各種型別的資料中,挖掘出對未來趨勢與模式**分析有價值的資料,並通過機器學習方法、人工智慧方法或資料探勘方法深度分析,發現新規律和新知識。你如果有1pb以上的全國所有20-35年輕人的上網資料的時候,那麼它自然就有了商業價值,比如通過分析這些資料,我們就知道這些人的愛好,進而指導產品的發展方向等等。如果有了全國幾百萬病人的資料,根據這些資料進行分析就能**疾病的發生,這些都是大資料的價值。大資料運用之廣泛,如運用於農業、金融、醫療等各個領域,從而最終達到改善社會治理、提高生產效率、推進科學研究的效果。
大資料的四大特點
說起大資料,估計大家都覺得只聽過概念,但是具體是什麼東西,怎麼定義,沒有乙個標準的東西,因為在我們的印象中好像很多公司都叫大資料公司,業務形態則有幾百種,感覺不是很好理解,所以我建議還是從字面上來理解大資料,在維克托邁爾 捨恩伯格及肯尼斯庫克耶編寫的 大資料時代 提到了大資料的4個特徵 在這裡相信有...
事務的四大特點
事務 transaction 是併發控制的單位,是使用者定義的乙個操作序列。這些操作要麼都做,要麼都不做,是乙個不可分割的工作單位。通過事務,sql server能將邏輯相關的一組操作繫結在一起,以便伺服器保持資料的完整性。事務通常是以begin transaction開始,以commit或roll...
大資料的四大維度深度解析
數量也許是與大資料最相關的特徵,指企業為了改進企業中的決策而試圖利用的大量資料。資料量持續以前所未有的速度增加涵蓋這四個維度有助於定義和區分大資料 數量 資料量。數量也許是與大資料最相關的特徵,指企業為了改進企業中的決策而試圖利用的大量資料。資料量持續以前所未有的速度增加。然而,真正造成資料量 巨大...