第一種是由使用者提供的顯式資訊。第二種是隱式資訊,這些資訊是應用內或應用外的資訊,這些通常是非結構化格式的資訊。最後的是由分析集合資料所推導出的智慧型。第三種是建立在第一種和第二種之上的。
資料兩種格式:結構化資料和非結構化資料。結構化資料有個很好的格式,十分方便儲存和查詢。使用者的評級,文章的檢視,購買的物品都是結構化資料。非結構化資料格式往往是未處理的文字。評測,論壇發帖,部落格的記錄,會話都是無結構資料。
接下來讓我們看看智慧型的三種形式,顯性,隱性,推導的。
這一節將介紹處理使用者提供的顯性資訊。下面是幾個怎樣利用顯性資訊的例子。
這一節介紹處理使用者提供的間接的資訊。下面是幾個使用者提供這些資訊的方式。
一般這些資訊都出現在非結構資料裡,如評測,訊息,部落格等等。使用者可以在網上表達自己的想法。可以在你的應用裡,也可以在應用外。在社群裡使用者可以發表部落格,提出解答問題。感謝強大的搜尋引擎和部落格跟蹤引擎。這些應用都可以幫助其他人發現這些內容。
部落格在網上一般是按時間排序的。部落格圈是一些部落格的集合,而且在隨時的增長之中。在2008的8月,technorati,乙個致力於部落格跟蹤應用的公司,大概跟蹤了上億的部落格了。部落格圈對應用來說是個重要的資料來源。
接下來看看第三種,是由分析資料推導而成的。
這一節介紹處理推導資料,這資料是分析從使用者收集而來的資料而衍生出來的。 下面是一些例子
聚集和**分析:聚集和**分析是資料探勘兩個主要的元件。聚集技術可以讓你分類物品如使用者或內容,把他們分組。**分析是個數學模型。是基於輸入的資料進行**。
推薦引擎:乙個推薦引擎為使用者提供相關的資訊。通過分析內容,分析使用者互動行為或者把這兩個結合起來的方法來建立推薦引擎。推薦引擎利用使用者輸入提供乙個推薦物品的列表。輸入到推薦引擎可能是在使用者的購物車裡的物品,可能是以前她所購買的物品,或者是要考慮購買的物品,或者是使用者資料如年齡,標籤或使用者檢視的文章,或者是來自使用者提供其他有用的資訊。對於大的購物站點如亞馬遜,乙個目錄裡有上百萬的物品,提供乙個快速的推薦是個很大的挑戰。
集體智慧型程式設計 第1章 集體智慧型導言
集體智慧型通常是指為了創造新的想法,而將一群人的行為 偏好或思想結合在一起。完成這項工作的最基礎的方法便是使用調查問卷或普查。從一大群人中搜尋的答案可以使我們得到關於群主的統計結論 組中的個體成員將會被忽視。從獨立的資料提供者那裡得到新的結論,是集體智慧型所真正關注的。機器學習是人工智慧領域中與演算...
集體智慧型程式設計學習
集體智慧型程式設計學習 概要 文章主要討論一些我遇到的問題,學習到的方法,總結一些演算法的實現過程。注 所參考的版本為2009年出版。書中packages與現在有變化,但是可以通過查閱相關packages文件來找到相關功能 3.相似度排序 4.相似人群加權排名及歸一化 6.構建基於 del.icio...
什麼是集體智慧型
什麼是集體智慧型 what is collective intelligence?人們使用 集體智慧型 這一術語已有十多年之久,隨著新型通訊技術的出現,這一術語也變得日趨流行和重要。儘管這樣的表達也許會讓人聯想到群體意識或超自然現象,但當技術人員使用這一詞彙時,其含義通常是指 為了創造新的想法,而將...