每次談到資料探勘都讓人很興奮,但是真正的應用有幾個是資料探勘演算法支撐起來的呢:大家哈哈一笑,」除了尿布和啤酒「還有什麼拿的出的例子嗎。傳統的統計學方法可以解決大多數知識發現問題。資料探勘實際上是一組在人類高階智慧型和計算機低階智慧型間的抽象演算法:分類(聚類,智慧型是基礎)、關聯(和專家系統的規則有區別嗎)。個人認為資料探勘的幾個演算法其本質類似於資料庫領域的」sql「語句。用幾個基本的運算元盡量組織成複雜的邏輯,解決現實的問題。
因此,個人認為從出現的新應用入手,看資料探勘那幾個工具,能辦好哪些事情。然後對工具修改一下,以適應新的環境。
1、圖挖掘(網際網路,社交網路等新應用);
3、時空資料探勘(gps,wifi,網路定位的發展);
4、非結構資料,高維資料探勘(文字、都是高維資料);
5、轉業領域資料探勘(比如生物資訊學領域)。
針對新的應用模式,擴充幾種工具的功能,加快其執行速度(包括並行化——集群計算是個熱點)就成了未來幾年的研究熱點。
另外,我們想知道知識,但是總有些資訊是需要保密的,因此隱私問題也是乙個研究熱點。
資料探勘面臨的科學和工程的新問題
每次談到資料探勘都讓人很興奮,但是真正的應用有幾個是資料探勘演算法支撐起來的呢 大家哈哈一笑,除了尿布和啤酒 還有什麼拿的出的例子嗎。傳統的統計學方法可以解決大多數知識發現問題。資料探勘實際上是一組在人類高階智慧型和計算機低階智慧型間的抽象演算法 分類 聚類,智慧型是基礎 關聯 和專家系統的規則有區...
資料探勘面臨的科學和工程的新問題
每次談到資料探勘都讓人很興奮,但是真正的應用有幾個是資料探勘演算法支撐起來的呢 大家哈哈一笑,除了尿布和啤酒 還有什麼拿的出的例子嗎。傳統的統計學方法可以解決大多數知識發現問題。資料探勘實際上是一組在人類高階智慧型和計算機低階智慧型間的抽象演算法 分類 聚類,智慧型是基礎 關聯 和專家系統的規則有區...
資料探勘之面臨的主要問題
資料探勘的主要問題 本書強調資料探勘的主要問題,考慮挖掘技術 使用者介面 效能和各種資料型別。這些問題介紹如下 資料探勘技術和使用者介面問題 這反映所挖掘的知識型別 在多粒度上挖掘知識的能力 領域知識的使用 特定的挖掘和知識顯示。1在資料庫中挖掘不同型別的知識 由於不同的使用者可能對不同型別的知識感...