《標籤 標記系統設計實踐》讀書筆記

2021-09-22 13:20:07 字數 2258 閱讀 9830

《tagging: people-powered metadata for the social web》出版於2023年,中文版譯為《標籤:標記系統設計實踐》.tag,rss都是web 2.0時代的標誌性建築.這本書就tag的方方面面做了比較全面的分析,但是有些章節內容組織邏輯上有點問題,瑕不掩瑜.筆記如下:

"繽紛色彩閃出的美麗,是因它沒有分開每種色彩",黃家駒歌裡唱出世界因為差異不同而豐富多彩;每個人認知世界的方式也不同,分類也好,各種榜單也好,本質上講都是偏見而已;我們在圖書館裡面按照中圖分類法進行文獻檢索,但是如果做乙個實驗讓一群人圍100部電影進行分類,一模一樣的分類方式估計會很少;人與人不同, 資訊的分類組織方式其實也是一種自我表達的方式.

我們現在計算機上使用的資料夾方式組織檔案;這種組織方式其實就是把傳統資訊目錄組織方式在計算機中的實現,但是這種組織的方式就是把資訊按照層次結構進行組織,但是沒有解決乙個事物屬於多個分類的問題;雖然,快捷方式可以作為乙個解決方案;

比如:我電腦上所有的羅大佑的歌曲,我想按照曲風,時間,演唱會,詞曲作者,等方式組織,可實際上我只能按照****的方式組織;更不要說,我還想把這些**歸入"滾石**","國語粵語雙版","電影原聲"等突發奇想的分類了;

分面分類法允許從不同的維度去描述同乙個事物;像上面,我們可以從不同的角度對同乙個**作品進行分類;這是符合我們認知規律的.在網際網路產品中,這種解放了個人話語權的應用方式就是:tag

tag本質上是資源的元資料(metadata),元資料是用來描述,解釋,定位資訊源,或者使其易於獲取,使用,管理的結構化資訊.下圖是tag系統的構成:

這裡作者提到的兩點是不能成立的:(1)標記很流行 (2)標記是靈活的 "流行"是結果不是原因,因為需要所以重要,因為需要的多,所以流行;而靈活只是標籤的自身屬性,不能成為其重要的理由;下面幾條是成立的:

[1]  同乙個事物可以在不同的位置,不同的概念中存在;

[2]  使用者新增tag的最主要目的就是為了方便找到 個人資訊管理 社會化資訊管理

[3]  我們正在經歷資訊**需要新的工具適應新的資訊環境;微博,g+等流資訊的傳播形式,適用預定義的結構組織資訊幾乎不可能,tag標記可以對流資訊進行實時分類標註,不必考慮分類的層次關係;tag在這種應用場景中給予我們最大的組織能力和最小的認知負荷;

[1] 管理個人資訊 

使用者新增tag是有其本身需要的,不要割裂使用者和tag之間的關係;

[2] 自我表達

[3] 協作與分享

使用者標記了乙個東西希望與其他人產生互動的原因是:

(1) 拋磚引玉 希望其他使用者發布同樣的內容,其他使用者可能是專家,獲得專業意見

(2) 坐享其成 使用其他使用者的標籤,省去了收集整理分類的過程

(3) 尋找趣味相投的人

這裡作者說使用者新增tag的動機中"易用性"是不成立的:乙個功能容易用就會有吸引力驅動使用者去用麼?乙個簡單的例子,指紋打卡機再易用,也沒有多少人願意打卡;這個不成立;易用性只是在使用者需要用的前提下,降低了使用者使用的難度;換個角度,"易用性"這明顯是乙個比較概念,是和誰比較呢?

[1] 利用使用者認知盈餘低成本建立公共知識庫

[2] 獲得描述性元資料

[3] 識別模式 了解你的內容,使用者,需求

[4] 補充現有分類(中文版譯為"強化",補充和強化還是兩回事)

[1] 系統建立之初的冷啟動問題

解決方法:(1)內測預熱 (2)引導積極使用者 (3)激勵:虛擬或實物獎勵

[2] 標籤質量良莠不齊

解決方法: (1) 改進介面 (2)建立社群規則 (3)人工介入或自動處理隱藏低質量內容

[3] 少數人的聲音主導系統

解決方法:(1)調整熱度演算法:去掉最高 最低, 高頻降權 (2)防止自動提交

"少數元素高頻出現,大多數低頻出現"的冪律曲線在生活中的例子就是二八定律,而且還有乙個馬太效應會強化這種規律.

[4] 標籤審查 

解決方法: 自動過濾 使用者舉報

個人資訊管理比如gmail中的lable;

社會化標記:豆瓣的標記系統

電子商務為產品新增標記,增加產品的可尋性;

tagview more 

presentations from 

ligaoren.

[1] metadata 維基百科資料:

[2] tag與tagging  

《標籤 標記系統設計實踐》讀書筆記

tagging people powered metadata for the social web 出版於2008年,中文版譯為 標籤 標記系統設計實踐 tag,rss都是web 2.0時代的標誌性建築.這本書就tag的方方面面做了比較全面的分析,但是有些章節內容組織邏輯上有點問題,瑕不掩瑜.筆記...

推薦系統實踐讀書筆記

最近大概複習了一下這本書,了解了較早的推薦系統的一些方法,記錄如下,以便大家對本書內容有個快速地了解。略去了第一張,詳細的 和細節可以參考其他部落格。需要關注的地方直接標出了頁碼。書裡面的 不是很完整,用來學習還可以。第八章介紹了一些svd等機器學習的演算法,在2020年的今天可以回顧一下。推薦系統...

《推薦系統實踐》讀書筆記4

為什麼要研究系統的時間特性?不同系統有不同的時效性,有的系統物品的時效性很短,熱起來,很快會冷下去 而有的系統物品的時效性長,具有比較長的生命週期。研究系統的時間特性,能增強系統的有效性推薦。比如推薦新聞,會主要選擇最近時間段發生的新聞事件進行推薦 而推薦旅遊景點,時效性較長 有些也有季節性變化 則...