早在一年前,美國國防部先進研究專案局(darpa)曾透漏過乙個秘密專案——一款新型搜尋引擎,通過深度挖掘暗網(dark web),獲取google搜尋和其他商業搜尋引擎未能涉及到的所有隱秘資訊。現在,它已經悄然問世。
2cto科普:什麼是暗網
暗網並非十分龐大,甚至沒有想象中那樣特別的神秘。事實上,所謂「暗網」都是公共可見的**,但卻將真實的伺服器ip隱藏了而已。這意為著,任何人都可以訪問暗網,但「暗」就暗在這些**隱藏極深,難以調查的幕後。
神秘的「暗網搜尋引擎」
暗網搜尋引擎專案被命名為「memex」,測試顯示專案運營效果良好。
上週日晚,memex首度亮相於公眾,我們有幸搶先一睹這款特別的搜尋引擎的風采——這是一款以打擊犯罪為目的搜尋引擎,美國國防部五角大樓的研究機構批准scientific american新聞網預睹其真容,然後讓60分鐘節目組獨家對這款新技術的結晶進行了**報道。
memex這個單詞來自於記憶(memory)與索引(index)的組合,它基於開源的數字視覺化搜尋分析程式,通過與後端伺服器軟體互動,完成複雜的計算和資料分析。
通過使用者搜尋的資訊,memex搜尋引擎會對相關內容進行抓取。經過爬蟲對頁面內容的遞迴獲取,有效地識別不同資料塊之間的關係。研究人員能夠利用搜尋到的空間和時間的資料構建資料圖,進行視覺化分析。
暗網是乙個遍布婦女兒童綁架、.資訊、毒品交易、網路犯罪和人口販賣的**聚集地,但是由於暗網的隱秘性極高,所以它能輕易躲避主流引擎的搜尋。
當然,隨著暗網搜尋引擎的誕生,相信它們的好運也就到此為止了。
設計理念
暗網搜尋引擎memex用於保護網路免受黑客、人販子或者其他型別罪犯的的侵害。它的設計理念即:擴充套件搜尋引擎的能力,根據特定人物的興趣迅速進行資訊的全面整合。
memex搜尋引擎的研究發起者chris white等人詳談了整個暗網搜尋引擎的工作原理,以及它是如何幫助執法機構進行調查的。
white表示:「網際網路比人們想得要複雜得多。據統計分析,google、微軟bing以及雅虎搜尋,只收錄了網路上大約5%的web內容。」很明顯,這給網路犯罪留下了很大的潛在發展空間。
在上述有關memex搜尋引擎的**片段裡,大家還能看到美國國防部先進研究專案局的dan kaufman。這位主管在**裡表示:「memex的理念簡化來說就是——如何挖掘不易被發現的東西。」
white嚴肅地說:「大多數網民都是守法公民,但是也肯定會存在一些網路寄生蟲。我們會剝奪其利用網路侵害我們的能力,創造乙個更加美好的網路環境。」
專案進度
memex如今還處於beta階段,現有乙個**機構和乙個非**組織負責測試。當然,在幾周後的下一測試階段,memex還會擴大內測範圍。
「這一輪的測試,其中乙個主要目標就是分析**。比如對於毒販面部的匹配,或者是根據背景中電視螢幕映出影象,進行模糊搜尋匹配。另乙個目標,則是嘗試用不同使用者介面,嘗試使用流**結構來評估時間敏感的資料。」這意味著在暗網搜尋引擎memex的幫助下,美國國防部先進研究專案局(darpa)有可能會根據中電視螢幕的上的倒影影象,通過影象模糊匹配技術進行分析定位,在使用一定手段確認後對罪犯實施抓捕。
這聽起來似乎如好萊塢電影一般富有奇幻色彩,不過memex團隊強調,這一切「黑科技」本意只是降低犯罪率,而不是侵犯大多數人的隱私。
網盤搜尋引擎
推薦 盤多多 bdsola 潛力股 保持更新與收錄 探索雲盤搜尋 bdy搜 盤窩窩 網盤007 其他胖次 盤搜搜 去轉盤網 番茄搜尋 微友搜尋 西林街 凌風雲 盤優搜 soso雲盤 pan115 鴕鳥搜尋 我的盤 搜網盤 51菜場 網盤之家 及搜盤 眾人搜尋 行笑網 史萊姆搜尋 3百搜 58網盤搜尋...
網盤搜尋引擎
國內和諧了,一片安靜,大家需要的技術資料也和諧了。最令我不忿的事情,jquery也招惹誰了,難道static.jquery.com是個毒瘤嗎?寧可錯殺一千不能放過乙個,歷史總是驚人的相似,變的只是我們和我們身邊的事。廢話少說,上圖 從介面看,清晰整潔,分模擬較詳細,想要搜尋的類別分類還是比較人性化的...
搜尋引擎 索引
正排索引 文件編號,單詞編號,單詞的數量,單詞出現的位置。倒排索引 1,單詞詞典,儲存單詞以及統計資訊,單詞在記錄表中的便宜,可常駐記憶體,用雜湊表儲存。2,記錄表,單詞對應的文件集合,記錄單詞出現的數目 位置。文件採用差分變長編碼。其中文件可按編號公升序排列 可利用差分編碼 也可按出現次數排列,可...