資料探勘面向什麼型別的應用?

2021-08-10 17:54:03 字數 1347 閱讀 6246

作為乙個應用驅動的學科,資料探勘已經在許多應用中獲得巨大成功。我們不可能一一枚舉資料探勘扮演關鍵角色的所有應用。在知識密集的應用領域,如生物資訊學和軟體工程,資料探勘的表現更需要深人處理,這已經超出本書的範圍。應用作為資料探勘研究與開發的主要方面,其重要性不言而喻,為了解釋這一點,我們簡略討論兩個資料探勘非常成功和流行的應用例子:商務智慧型和搜尋引擎

對於商務而言,較好地理解它的諸如顧客、市場、**和資源以及競爭對手等商務背景是至關重要的。商務智慧型(bi)技術提供商務運作的歷史、現狀和**檢視,例子包括報告、聯機分析處理、商務業績管理、競爭情報、標桿管理和**分析。

「 商務智慧型有多麼重要?」沒有資料探勘,許多任務商企業都不能進行有效的市場分析,比較類似產品的顧客反饋,發現其競爭對手的優勢和缺點,留住具有**值的顧客,做出聰明的商務決策。

顯然,資料探勘是商務智慧型的核心。商務智慧型的聯機分析處理工具依賴於資料倉儲和多維資料探勘。分類和**技術是商務智慧型**分析的核心,在分析市場、**和銷售方面存在許多應用。此外,在客戶關係管理方面,聚類起主要作用,它根據顧客的相似性把顧客分組。使用特徵挖掘技術,可以更好地理解每組顧客的特徵,並開發定製的顧客獎勵計畫。

web搜尋引擎是一種專門的計算機伺服器,在web上搜尋資訊。通常,使用者查詢的搜尋結果用一張表返給使用者(有時稱做取樣(hit ) )。取樣可以包含網頁、影象和其他型別的檔案。有些搜尋引擎也搜尋和返回公共資料庫中的資料或開放的目錄。搜尋引擎不同於網路目錄,因為網路目錄是人工編輯管理的,而搜尋引擎是按演算法執行的,或者是演算法和人工輸人的混合。

web搜尋引擎本質上是大型資料探勘應用。搜尋引擎全方位地使用各種資料探勘技術,包括爬行。(例如,決定應該爬過哪些頁面和爬行頻率)、索引(例如,選擇被索引的頁面、和決定構建索引的範圍)和搜尋(例如,確定如何排列各個頁面、載入何種廣告、如何把搜尋結果個性化或使之「環境敏感」)。

搜尋引擎對資料探勘提出了巨大挑戰。首先,它們必須處理大量並且不斷增加的資料。通常,這種資料不可能使用一台或幾台機器處理。搜尋引擎常常需要使用由數以千計甚至數以萬計的計算機組成的計算機雲,協同挖掘海量資料。把資料探勘方法公升級到計算機雲和大型分布資料集上是乙個需要進一步研究的領域。

另乙個挑戰是在快速增長的資料流上維護和增量更新模型。例如,查詢分類器可能需要不斷地增量維護,因為新的查詢不斷出現,並且預先定義的類別和資料分布可能已經改變。大部分已有的模型訓練方法都是離線的和靜態的,因而不能用於這種環境。

第三,web搜尋引擎常常需要處理出現次數不多的查詢。假設搜尋引擎想要提供環境敏感的推薦。也就是說,當使用者提交乙個查詢時,搜尋引擎試圖使用使用者的簡況和他的查詢歷史推斷查詢的環境,以便快速地返回更加個性化的回答。然而,儘管整個查詢數量是巨大的,但是大部分查詢都只是提問一次或幾次。對於資料探勘和機器學習方法而言,這種嚴重傾斜的資料都是乙個挑戰。

資料探勘應用

b 資料探勘解決的典型商業問題 b 需要強調的是,資料探勘技術從一開始就是面向應用的。目前,在很多領域,資料探勘 data mining 都是乙個很時髦的詞,尤其是在如銀行 電信 保險 交通 零售 如超級市場 等商業領域。資料探勘所能解決的典型商業問題包括 資料庫營銷 database market...

什麼是資料探勘

當今資料庫的容量已經達到上萬億的水平 t 1,000,000,000,000個位元組。在這些大量資料的背後隱藏了很多具有決策意義的資訊,那麼怎麼得到這些 知識 呢?也就是怎樣通過一顆顆的樹木了解到整個森林的情況?電腦科學對這個問題給出的最新回答就是 資料探勘,在 資料礦山 中找到蘊藏的 知識金塊 幫...

什麼是資料探勘

簡單地說,資料探勘是指從大量資料中提取或 挖掘 知識。該術語實際上有點用詞不當。注意,從礦石或砂子挖掘 稱作 挖掘,而不是砂石挖掘。因此,資料探勘應當更正確地命名為 從資料中挖掘知識 遺憾的是這個詞有點長。圖1 3 資料探勘 在你的資料中搜尋知識 有趣的模式 圖1 4 資料探勘作為知識發現過程的乙個...