魚還是熊掌:**多程序多執行緒的選擇
關於多程序和多執行緒,教科書上最經典的一句話是「程序是資源分配的最小單位,執行緒是cpu排程的最小單位」,這句話應付考試基本上夠了,但如果在工作中遇到類似的選擇問題,那就沒有這麼簡單了,選的不好,會讓你深受其害。
經常在網路上看到有的xdjm問「多程序好還是多執行緒好?」、「linux下用多程序還是多執行緒?」等等期望一勞永逸的問題,我只能說:沒有最好,只有更好。根據實際情況來判斷,哪個更加合適就是哪個好。
我們按照多個不同的維度,來看看多執行緒和多程序的對比(注:因為是感性的比較,因此都是相對的,不是說乙個好得不得了,另外乙個差的無法忍受)。
對比維度
多程序
多執行緒
總結
資料共享、同步
資料共享複雜,需要用ipc;資料是分開的,同步簡單
因為共享程序資料,資料共享簡單,但也是因為這個原因導致同步複雜
各有優勢
記憶體、cpu
占用記憶體多,切換複雜,cpu利用率低
占用記憶體少,切換簡單,cpu利用率高
執行緒佔優
建立銷毀、切換
建立銷毀、切換複雜,速度慢
建立銷毀、切換簡單,速度很快
執行緒佔優
程式設計、除錯
程式設計簡單,除錯簡單
程式設計複雜,除錯複雜
程序佔優
可靠性程序間不會互相影響
乙個執行緒掛掉將導致整個程序掛掉
程序佔優
分布式適應於多核、多機分布式;如果一台機器不夠,擴充套件到多台機器比較簡單
適應於多核分布式
程序佔優
看起來比較簡單,優勢對比上是「執行緒 3.5 v 2.5 程序」,我們只管選線程就是了?
呵呵,有這麼簡單我就不用在這裡浪費口舌了,還是那句話,沒有絕對的好與壞,只有哪個更加合適的問題。我們來看實際應用中究竟如何判斷更加合適。
1)需要頻繁建立銷毀的優先用執行緒
原因請看上面的對比。
這種原則最常見的應用就是web伺服器了,來乙個連線建立乙個執行緒,斷了就銷毀執行緒,要是用程序,建立和銷毀的代價是很難承受的
2)需要進行大量計算的優先使用執行緒
所謂大量計算,當然就是要耗費很多cpu,切換頻繁了,這種情況下執行緒是最合適的。
這種原則最常見的是影象處理、演算法處理。
3)強相關的處理用執行緒,弱相關的處理用程序
什麼叫強相關、弱相關?理論上很難定義,給個簡單的例子就明白了。
一般的server需要完成如下任務:訊息收發、訊息處理。「訊息收發」和「訊息處理」就是弱相關的任務,而「訊息處理」裡面可能又分為「訊息解碼」、「業務處理」,這兩個任務相對來說相關性就要強多了。因此「訊息收發」和「訊息處理」可以分程序設計,「訊息解碼」、「業務處理」可以分執行緒設計。
當然這種劃分方式不是一成不變的,也可以根據實際情況進行調整。
4)可能要擴充套件到多機分布的用程序,多核分布的用執行緒
原因請看上面對比。
5)都滿足需求的情況下,用你最熟悉、最拿手的方式
至於「資料共享、同步」、「程式設計、除錯」、「可靠性」這幾個維度的所謂的「複雜、簡單」應該怎麼取捨,我只能說:沒有明確的選擇方法。但我可以告訴你乙個選擇原則:如果多程序和多執行緒都能夠滿足要求,那麼選擇你最熟悉、最拿手的那個。
多執行緒與多程序
程序 程序是程式的一次執行,在傳統的計算機中,程序既是基本的分配單元,也是基本的執行單元。執行緒 執行緒是可執行的實體單元,它是處理機排程的基本單位。由於執行緒在同一位址空間,因此建立和撤銷執行緒的開銷小,執行緒間的通訊效率高,切換迅速。在多處理機系統中,對程序的個數有所限制,但對執行緒的個數不存在...
多程序與多執行緒
import threading建立乙個執行緒,指向的函式,不接收引數的情況 t threading.thread target 函式名 建立乙個執行緒,指向的函式,收引數的情況 t threading.thread target 函式名,args 實參1,執行緒物件名.start 生命週期 我們的...
多執行緒與多程序
程序是資源分配的最小單位,基於cpu而言的,一般乙個cpu執行乙個程序,只不過切換速度太快,相當於同時在執行多個程序。如程式a在讀取大量資料時,cpu可以切換程式b,當a讀完之後,儲存b的執行進度並暫停,繼續執行a 也就是併發執行 乙個程式對應乙個程序組,程序具有建立其他程序的功能,而程式沒有。同一...