之前做筆記一直使用的是evernote,後來聽說 windows上自帶一款onenote很厲害,最近準備嘗試。
關於最近這段時間的課外學習,幾乎是沒有,期間有 兩個週末,這兩個週末基本都是在打比賽(遊戲),班級內或者班級間,打得挺累的,但是事實上我每天有一小段時間可以抽出來自學的,總之決定現在開始每天稍微學一些,做一些筆記,然後在週末之類的時候整理到一起。
今天突然發現自己居然那麼久沒做筆記,頓時覺得人總是容易被**,就算只有自己乙個人,也應該嚴格要求自己。小時候看過一篇文章,叫做慎獨,最近想找到那篇文章,結果一搜這個詞,居然發現慎獨這個詞由來已久,以後我要多多 得記得慎獨這一品質,記得時刻監督自己,從而能夠更加的完善自己,加油!咯咯噠!
近似最近鄰演算法 annoy解析
annoy是高維空間求近似最近鄰的乙個開源庫。annoy構建一棵二叉樹,查詢時間為o logn annoy通過隨機挑選兩個點,並使用垂直於這個點的等距離超平面將集合劃分為兩部分。如圖所示,圖中灰色線是連線兩個點,超平面是加粗的黑線。按照這個方法在每個子集上迭代進行劃分。依此類推,直到每個集合最多剩餘...
最近鄰搜尋和近似最近鄰搜尋(NN和ANN)和庫
這樣查詢返回的前k個向量並不一定是最相似的k個向量,衡量ann演算法好不好的乙個依據是召回,每次ann請求返回的k個結果與使用暴力查詢的k個結果去比較,如果完全一致,說明是最好的。因為省了搜尋時間卻沒有影響效果。目前的ann演算法有基於圖 hnswlib 的,基於樹 pysparnn 的,基於雜湊 ...
近似最近鄰搜尋的QALSH方法 閱讀筆記
lsh和它的變體是解決高維歐氏空間下c 近似最近鄰 c ann 搜尋問題的著名索引方法。傳統上,lsh函式在某種意義上是以未知查詢的方式構建,即在任何查詢到達之前劃分桶。然而,距離乙個查詢越近的目標可能被劃分在不同的桶中是令人不快的。由於利用yi遺忘查詢桶劃分,針對外存的最先進的lsh方案,即c2l...