sqlserver的一次堵塞分析(2010-08-27)
今天工作人員突然報告說某個介面無法正常開啟了,第乙個想到的便是sqlserver又發生堵塞了。
在sqlserver中,做了乙個5分鐘執行一次的定時任務,定期掃瞄堵塞情況;不過五分鐘有些太久了。
就執行了一下查詢堵塞的指令碼,看看目前系統裡正在發生的堵塞情況。
select
blocked_query.session_id as blocked_session_id,
blocking_query.session_id as blocking_session_id,
blocking_sql_text.text as blocking_sql_text,
blocked_sql_text.text as blocked_sql_text,
waits.wait_type as blocking_resource,
blocked_query.command as blocked_command,
blocking_query.command as blocking_command,
blocked_query.wait_type as blocked_wait_type,
blocked_query.wait_time as blocked_wait_time,
blocking_query.total_elapsed_time as blocking_elapsed_time,
getdate()
from sys.dm_exec_requests blocked_query
join sys.dm_exec_requests blocking_query on
blocked_query.blocking_session_id = blocking_query.session_id
(select *
from sys.dm_exec_sql_text(blocking_query.sql_handle)
) blocking_sql_text
(select *
from sys.dm_exec_sql_text(blocked_query.sql_handle)
) blocked_sql_text
join sys.dm_os_waiting_tasks waits on
waits.session_id = blocking_query.session_id
查詢結果很簡單,
被堵塞的是乙個select語句,堵塞的是乙個觸發器;兩者操作的是同乙個表,blocking_resource為lck_m_s,很明顯是乙個讀寫的相互堵塞。
分析步驟理應優先從堵塞程序開始分析,然後再分析select語句
觸發器的業務邏輯比較複雜,大概有600多行,其中有一二十個select、update語句
只能按順序乙個個來分析相關的select和update語句了,看看哪條sql可能出了問題
主要是看sql的where條件是否滿足索引和高選擇性要求,很快便定位到一條sql語句
select top 1 @var1=field1 from tablename where field2=@var2 and field1 is not null and primarykey<>@primarykey
該錶將近10萬條記錄,而執行該查詢,等待了1分鐘卻看不到執行結果。理論上是不應該的,先標記下來吧,繼續往下跟蹤。
很快又發現一條帶資料庫鏈結的查詢
select top 1 primarykey from dblink.dbname.username.tablename where cond1
先試著執行一下吧,該sql也是半天沒有響應。
問題應該出現在這兩個地方,需要再了解一下相應的業務邏輯再進行sql優化,當務之急是先把該session殺掉
執行kill sessionid後,卻還是無法開啟程式介面,繼續執行查詢堵塞指令碼,發現blocking_command變成了killed/rollback,也 就是說一直處於rollback狀態,沒有殺成功,很奇怪。而且整個資料庫似乎已經全部癱瘓了,所有應用程式均無法執行。
於是系統工程師就把資料庫重啟了一下,又重新開啟該程式介面進行資料處理,結果很快又出現之前的症狀。
後來想是不是dblink出現了問題,繼續執行基於該dblink的查詢試一下,發現基本上全部無法執行;還是先檢查一下網路吧
系統工程師登陸到伺服器上檢視windows的日誌,果然發現了很多網路故障,緊急處理一下網路。
再次執行查詢堵塞指令碼,發現堵塞已經自動消除,而那條看似很慢的sql也很快執行出結果了。
至此堵塞問題已解決。
鑑於sqlserver的鎖的隔離機制被設定為read_committed_snapshot,讀和寫會導致衝突,問題的根源也就不難理解了,但造成問題的最終原因卻可能是多方面的。
一次sql server實戰
前言 朋友在做授權專案的時候,遇到乙個sql server資料庫的注入點,沒辦法解決,讓我幫忙看看,因為是授權專案,所以就可以幫助測試下。內容如下 單引號,很明顯的錯誤,因為是時間格式 2020 6 2,所以這裡肯定是字元型的。接著測試 還是語法錯誤,那麼可能因為有括號的原因,接著測試 這裡出現了關...
一次清除SQL SERVER錯誤日誌的體會!
之前在uat環境搭建的sql server 2008 r2資料庫一直用得比較正常,但最近發現在sharepoint中不能進行任何操作了,開始以為是什麼配置出了問題 因為一直在研究一些新的應用和整合,需要不斷地測試 但後來發現是資料庫硬碟沒用一點空間了,那麼自然是不能存任何資料了,所以最先開始清理一些...
一次清除SQL SERVER錯誤日誌的體會!
之前在uat環境搭建的sql server 2008 r2資料庫一直用得比較正常,但最近發現在sharepoint中不能進行任何操作了,開始以為是什麼配置出了問題 因為一直在研究一些新的應用和整合,需要不斷地測試 但後來發現是資料庫硬碟沒用一點空間了,那麼自然是不能存任何資料了,所以最先開始清理一些...