大資料時代亟需消除八大「疑雲」

2021-09-23 02:07:56 字數 1560 閱讀 4385

文章講的是大資料時代亟需消除八大「疑雲」

大資料這個詞現在已經被大多數人所熟知,慢慢成為一種常態化的it及企業生產變革,徹底改變了資訊保安行業、資訊科技、企業和社會的方式,對於大多數企業來說,大資料已經成為左右戰局的決定性力量,然而其安全風險也隨之凸顯。像所有的科學技術一樣,大資料也是一把雙刃劍,能否合理利用成了其劍鋒所向的分界點。 

「當事情變得很常見,那它就開始正常化了,我們的工作,作為it專業人士,就是在2023年前使大資料變得正常化。」

gartner分析師markbeyer認為:企業cio們如果想在2023年實現大資料常態化,那麼就要從消除關於大資料的八個神話開始。

讓十位首席資訊官去定義大資料,你會得到十個不同的答案。gartner分析師markbeyer說,這是因為大資料對企業的it專業人員來說仍然並不規範。

beyer在今年gartner的symposium/itxpo會議上說。「當事情變得很常見,那它就開始正常化了,我們的工作,作為it專業人士,就是在2023年前使大資料變得正常化。」

首席資訊官們可以通過從大資料謊言中區分出事實,來幫助他們的企業一步步走向正常。「神話有助於緩解焦慮,而無益於實際情況,」他說。

這裡是beyer提出的八個大資料疑雲:

1.大資料起始於100tb。不要再去尋覓大資料標準尺寸了,因其並沒有標準尺寸。「大資料是對資料的處理,而不是資料的大小,」beyer說。

2.想要大資料就必須更換基礎設施。「如果我因為有新的需求就決定改變整個基礎架構,那我是把之前所有的東西都當做了賭注,」beyer說。他的經驗教訓是什麼?「你要搞清楚,(基礎設施)成熟度犧牲的風險是否值得。」

3.百分之八十的資料是非結構化的。這可能是最經常被引用的大資料統計了,但根據beyer所說,其並不準確。「世界上最大的資訊資產是機器資料。因為其並未相互關聯就說它們非結構化絕對是個謊言。機器資料是結構化的資料。」順便說一句,這些大量的機器資料,往往是重複的資訊,確認了一切的正常。 「這就是機器資料通常所表達的,」他說。

4.工具將取代資料科學家。放心,所有花在吸引,拉攏,獲取資料科學家上的錢都不會白花,beyer說。「工具是一種工程,工程是對已經發現的事實的重複利用。而科學是去發現新的事實。」工具不會取代資料科學家-至少在工具可以自行複製和發展之前不會。

6.實時只是速度更快而已。實時操作,並不意味著加快了當前資料的攝入清理和分析過程,beyer說。而是「確保資料收集和決策之間的間隔越短越好,」他說。此外,大多數企業資料是不需要實時操作的。

7.資料量優於專業知識。那些認為可以簡單地不再管業務流程的人,請再想一想。這是因為,「一位好的資料科學家必須在某一時刻被叫停」,beyer說。如果沒有業務流程,資料科學家將不斷不斷不斷的進行下去而不能提供商業價值。需要有人幫忙劃清界線。

8.資料模型沒有用。這一論斷很絕對。不過,beyer澄清說,任何數字資產裡的東西都有其數字模型。「我們不會因為大資料就捨棄模型,」他說。

大資料時代的到來給企業帶來了重大的機遇,同時也帶來了嚴峻的挑戰。跨越資料安全的鴻溝,相信這些新的it技術變革將為企業的發展插上騰飛的翅膀。

八大資料結構

八大資料型別 public class demo04 布林值拓展 boolean flag true if flag true 新手 if flag 老手 lsee is more 要精簡易讀轉義字元 t 製表符 n 換行 system.out.println hello nworld 字元轉義為數...

資料變革時代八大熱門IT崗位

新的想法誕生新的技術,從而造出許多新詞,雲計算 大資料 byod 社交 3d印表機 物聯網 在網際網路時代,各種新詞層出不窮,令人應接不暇。這些新的技術 新興應用和對應的it發展趨勢,使得it人必須了解甚至掌握最新的it技能。另一方面,雲計算和大資料乃至其他助推各個行業發展的it基礎設施的新一輪部署...

Python學習 八大資料結構

樹是一種資料結構,它是由n n 1 個有限節點組成乙個具有層次關係的集合,把它叫做 樹 是因為它看起來像一棵倒掛的樹,根朝上,葉子向下。樹的特點 每個節點都有零個或多個子節點 沒有父節點的節點稱為根節點 每乙個非根節點有且僅有乙個父節點 除了根節點外,每個子節點可以分為多個不相交的子樹 二叉樹是樹的...