全球最大的資料探勘資訊**kdnuggets現在正進行著乙個調查。調查者需要填寫annual income(in us$)/ status and region。共有122份年薪結果和114份工作區域結果(截至2006.3.6 16:32:00)調查結果見下圖。
從區域調查結果可以顯示現有的資料探勘從業人員大多集中在北美和西歐(填寫區域資訊一共114人次,其中北美和西歐一共87人次,佔76.3%;北美63人次,佔55.3%;其他地區的都不到10%。圖中顯示的結果與這裡的計算有些不同),其他地區的從業人員比較少。資料探勘起源於美國,現有的研究比其他地方都要先進很多年,到現在國內的一些研究比以前有很大改觀,國內的資料探勘研究者在高檔國際會議上文章的發表量在逐年在增加,但是相比而言還是有很大差距。國內的應用更加滯後。美國fbi,cia已經使用這種技術來進行反恐(
cia wins control of terrorist data mining program,fbi plans to track suspects with data-mining techniques
),美國民眾都在為資料探勘發現他們的隱私而反抗的,最搞笑的是竟然出現datamining病毒。什麼時候我們的資料探勘發展到國民都在擔心自己隱私被「資料探勘」暴露時,中國的資料探勘也就發展的差不多了。(這個結果還有另外乙個原因就是,它是只有英文/日文網,要有中文的,那也許結果會不同,姚明的票數就是明證)
調查還顯示年薪結果,資料探勘在中國算是乙個門檻比較高的行業,所以中國的資料探勘從業人員工資相對其他行業來說比較高。但是上圖中調查結果可以顯示這個行業的年薪基本上符合乙個正態分佈。這說明這個行業現在已經是系統的結構,幹什麼的都有。有年薪超過$120k的高階資料探勘人員,有失業人員……
總之,我們還要走一段路,究竟多長,我不知道。
大資料 資料探勘 機器學習三者的區別和聯絡
大資料就是許多資料的聚合 大資料的特徵 1 資料量大 2 結構複雜 3 資料更新速度快 機器學習方法在大型資料庫中的應用稱為資料探勘 data mining 資料探勘就是把大資料的價值發掘出來,比如根據過去30年的氣象資料,通過資料探勘,幾乎可以 明天的天氣是怎麼樣的,有較大概率是正確的 零售業分析...
資料探勘學習筆記 資料探勘的方法和技術
分類 先給類別特點,再做判斷 可用於離散變數的取值 用來預報某些未知的或丟失的數字值 通過對具有類別的物件的資料集進行學習,概括其主要特徵,構建分類模型,根據該模型 物件的類別的一種資料探勘和機器學習技術。聚類 沒有類別的情況下,根據物件特徵自己聚類 自己總結各種特徵,得出結論 準確率可能沒有分類高...
Juniper推出基於雲的全球攻擊者資料庫
本文講的是 juniper推出基於雲的全球攻擊者資料庫,it168 資訊 2月26日訊息,rsa2013大會第一天,瞻博網路就推出了一款全球型資料庫用於追蹤單獨裝置上的攻擊行為。瞻博網路的這款產品旨在保護一切,包括個人裝置和資料中心。首先推出的這款spotlight secure是基於雲計算的攻擊者...