《tagging: people-powered metadata for the social web》出版於2023年,中文版譯為《標籤:標記系統設計實踐》.tag,rss都是web 2.0時代的標誌性建築.這本書就tag的方方面面做了比較全面的分析,但是有些章節內容組織邏輯上有點問題,瑕不掩瑜.筆記如下:
"繽紛色彩閃出的美麗,是因它沒有分開每種色彩",黃家駒歌裡唱出世界因為差異不同而豐富多彩;每個人認知世界的方式也不同,分類也好,各種榜單也好,本質上講都是偏見而已;我們在圖書館裡面按照中圖分類法進行文獻檢索,但是如果做乙個實驗讓一群人圍100部電影進行分類,一模一樣的分類方式估計會很少;人與人不同, 資訊的分類組織方式其實也是一種自我表達的方式.
我們現在計算機上使用的資料夾方式組織檔案;這種組織方式其實就是把傳統資訊目錄組織方式在計算機中的實現,但是這種組織的方式就是把資訊按照層次結構進行組織,但是沒有解決乙個事物屬於多個分類的問題;雖然,快捷方式可以作為乙個解決方案;
比如:我電腦上所有的羅大佑的歌曲,我想按照曲風,時間,演唱會,詞曲作者,等方式組織,可實際上我只能按照****的方式組織;更不要說,我還想把這些**歸入"滾石**","國語粵語雙版","電影原聲"等突發奇想的分類了;
分面分類法允許從不同的維度去描述同乙個事物;像上面,我們可以從不同的角度對同乙個**作品進行分類;這是符合我們認知規律的.在網際網路產品中,這種解放了個人話語權的應用方式就是:tag
tag本質上是資源的元資料(metadata),元資料是用來描述,解釋,定位資訊源,或者使其易於獲取,使用,管理的結構化資訊.下圖是tag系統的構成:
這裡作者提到的兩點是不能成立的:(1)標記很流行 (2)標記是靈活的 "流行"是結果不是原因,因為需要所以重要,因為需要的多,所以流行;而靈活只是標籤的自身屬性,不能成為其重要的理由;下面幾條是成立的:
[1] 同乙個事物可以在不同的位置,不同的概念中存在;
[2] 使用者新增tag的最主要目的就是為了方便找到 個人資訊管理 社會化資訊管理
[3] 我們正在經歷資訊**需要新的工具適應新的資訊環境;微博,g+等流資訊的傳播形式,適用預定義的結構組織資訊幾乎不可能,tag標記可以對流資訊進行實時分類標註,不必考慮分類的層次關係;tag在這種應用場景中給予我們最大的組織能力和最小的認知負荷;
[1] 管理個人資訊
使用者新增tag是有其本身需要的,不要割裂使用者和tag之間的關係;
[2] 自我表達
[3] 協作與分享
使用者標記了乙個東西希望與其他人產生互動的原因是:
(1) 拋磚引玉 希望其他使用者發布同樣的內容,其他使用者可能是專家,獲得專業意見
(2) 坐享其成 使用其他使用者的標籤,省去了收集整理分類的過程
(3) 尋找趣味相投的人
這裡作者說使用者新增tag的動機中"易用性"是不成立的:乙個功能容易用就會有吸引力驅動使用者去用麼?乙個簡單的例子,指紋打卡機再易用,也沒有多少人願意打卡;這個不成立;易用性只是在使用者需要用的前提下,降低了使用者使用的難度;換個角度,"易用性"這明顯是乙個比較概念,是和誰比較呢?
[1] 利用使用者認知盈餘低成本建立公共知識庫
[2] 獲得描述性元資料
[3] 識別模式 了解你的內容,使用者,需求
[4] 補充現有分類(中文版譯為"強化",補充和強化還是兩回事)
[1] 系統建立之初的冷啟動問題
解決方法:(1)內測預熱 (2)引導積極使用者 (3)激勵:虛擬或實物獎勵
[2] 標籤質量良莠不齊
解決方法: (1) 改進介面 (2)建立社群規則 (3)人工介入或自動處理隱藏低質量內容
[3] 少數人的聲音主導系統
解決方法:(1)調整熱度演算法:去掉最高 最低, 高頻降權 (2)防止自動提交
"少數元素高頻出現,大多數低頻出現"的冪律曲線在生活中的例子就是二八定律,而且還有乙個馬太效應會強化這種規律.
[4] 標籤審查
解決方法: 自動過濾 使用者舉報
個人資訊管理比如gmail中的lable;
社會化標記:豆瓣的標記系統
電子商務為產品新增標記,增加產品的可尋性;
tagview more
presentations from
ligaoren.
[1] metadata 維基百科資料:
[2] tag與tagging
《標籤 標記系統設計實踐》讀書筆記
tagging people powered metadata for the social web 出版於2008年,中文版譯為 標籤 標記系統設計實踐 tag,rss都是web 2.0時代的標誌性建築.這本書就tag的方方面面做了比較全面的分析,但是有些章節內容組織邏輯上有點問題,瑕不掩瑜.筆記...
推薦系統實踐讀書筆記
最近大概複習了一下這本書,了解了較早的推薦系統的一些方法,記錄如下,以便大家對本書內容有個快速地了解。略去了第一張,詳細的 和細節可以參考其他部落格。需要關注的地方直接標出了頁碼。書裡面的 不是很完整,用來學習還可以。第八章介紹了一些svd等機器學習的演算法,在2020年的今天可以回顧一下。推薦系統...
《推薦系統實踐》讀書筆記4
為什麼要研究系統的時間特性?不同系統有不同的時效性,有的系統物品的時效性很短,熱起來,很快會冷下去 而有的系統物品的時效性長,具有比較長的生命週期。研究系統的時間特性,能增強系統的有效性推薦。比如推薦新聞,會主要選擇最近時間段發生的新聞事件進行推薦 而推薦旅遊景點,時效性較長 有些也有季節性變化 則...