對於一些資料量較大的系統。資料庫面臨的問題除了查詢效率低下,還有就是資料入庫時間長。特別像報表系統,每天花費在資料匯入上的時間可能會長達幾個小時或十幾個小時之久。因此。優化資料庫插入效能是非常有意義的。
經過對mysql innodb的一些效能測試,發現一些能夠提高insert效率的方法。供大家參考參考。
經常使用的插入語句如:
insert
into
`insert_table` (`datetime`, `uid`, `content`, `type`)
values ('0', 'userid_0', 'content_0', 0);
insert
into
`insert_table` (`datetime`, `uid`, `content`, `type`)
values ('1', 'userid_1', 'content_1', 1);
改動成:
insert
into
`insert_table` (`datetime`,`uid`,`content`,`type`)
values ('0','userid_0','content_0',0),('1','userid_1','content_1',1);
改動後的插入操作能夠提高程式的插入效率。這裡另外一種sql執行效率高的主要原因是合併後日誌量(mysql的binlog和innodb的事務讓日誌)降低了。降低日誌刷盤的資料量和頻率。從而提高效率。通過合併sql語句。同一時候也能降低sql語句解析的次數,降低網路傳輸的io。
這裡提供一些測試對照資料。各自是進行單條資料的匯入與轉化成一條sql語句進行匯入,分別測試1百、1千、1萬條資料記錄。
把插入改動成:
start
transaction;
insert
into
`insert_table` (`datetime`, `uid`, `content`, `type`)
values ('0', 'userid_0', 'content_0', 0);
insert
into
`insert_table` (`datetime`, `uid`, `content`, `type`)
values ('1', 'userid_1', 'content_1', 1);
...commit;
使用事務能夠提高資料的插入效率,這是因為進行乙個insert操作時,mysql內部會建立乙個事務,在事務內才進行真正插入處理操作。通過使用事務能夠降低建立事務的消耗,全部插入都在執行後才進行提交操作。
這裡也提供了測試對照,各自是不使用事務與使用事務在記錄數為1百、1千、1萬的情況。
資料有序的插入是指插入記錄在主鍵上是有序排列,比如datetime是記錄的主鍵:
insert
into
`insert_table` (`datetime`,`uid`,`content`,`type`)
values('1','userid_1','content_1',1);
insert
into
`insert_table`(`datetime`,`uid`,`content`,`type`)
values('0','userid_0','content_0',0);
insert
into
`insert_table`(`datetime`,`uid`,`content`,`type`)
values('2','userid_2','content_2',2);
改動成:
insert
into
`insert_table` (`datetime`,`uid`,`content`,`type`)
values('0','userid_0','content_0',0);
insert
into
`insert_table` (`datetime`,`uid`,`content`,`type`)
values('1','userid_1','content_1',1);
insert
into
`insert_table`(`datetime`,`uid`,`content`,`type`)
values('2','userid_2','content_2',2);
因為資料庫插入時。須要維護索引資料,無序的記錄會增大維護索引的成本。我們能夠參照innodb使用的b+tree索引,假設每次插入記錄都在索引的最後面,索引的定位效率非常高,而且對索引調整較小。假設插入的記錄在索引中間,須要b+tree進行**合併等處理。會消耗比較多計算資源,而且插入記錄的索引定位效率會下降,資料量較大時會有頻繁的磁碟操作。
以下提供隨機資料與順序資料的效能對照,各自是記錄為1百、1千、1萬、10萬、100萬。
從測試結果來看。該優化方法的效能有所提高,可是提高並非非常明顯。
這裡提供了同一時候使用上面三種方法進行insert效率優化的測試。
從測試結果能夠看到,合併資料+事務的方法在較小資料量時,效能提高是非常明顯的,資料量較大時(1千萬以上)。效能會急劇下降,這是因為此時資料量超過了innodb_buffer的容量,每次定位索引涉及較多的磁碟讀寫操作。效能下降較快。而使用合併資料+事務+有序資料的方式在資料量達到千萬級以上表現依然是良好,在資料量較大時。有序資料索引定位較為方便,不須要頻繁對磁碟進行讀寫操作,所以能夠維持較高的效能。
1、sql語句是有長度限制,在進行資料合併在同一sql中務必不能超過sql長度限制。通過max_allowed_packet
配置能夠改動,預設是1m,測試時改動為8m。
2、事務須要控制大小。事務太大可能會影響執行的效率。mysql有innodb_log_buffer_size
配置項,超過這個值會把innodb的資料刷到磁碟中。這時,效率會有所下降。
所以比較好的做法是,在資料達到這個這個值前進行事務提交。
MySQL批量SQL插入各種效能優化
對於一些資料量較大的系統。資料庫面臨的問題除了查詢效率低下,還有就是資料入庫時間長。特別像報表系統,每天花費在資料匯入上的時間可能會長達幾個小時或十幾個小時之久。因此。優化資料庫插入效能是非常有意義的。經過對mysql innodb的一些效能測試,發現一些能夠提高insert效率的方法。供大家參考參...
批量插入SQL
sql語句是有長度限制,在進行資料合併在同一sql中務必不能超過sql長度限制,通過max allowed packet配置可以修改,預設是1m,測試時修改為8m。事務需要控制大小,事務太大可能會影響執行的效率。mysql有 innodb log buffer size 配置項,超過這個值會把inn...
sql批量插入
批量插入 第一種 insert into mytable id,name values 1,123 insert into mytable id,name values 2,456 insert into mytable id,name values 3,789 第二種方法,使用union all來...