1.什么是上下文切換(Context Switch)?
上下文切換,有時也稱做進程切換或任務切換,是指CPU從一個進程或線程切換到另一個進程或線程。
操作系統(tǒng)可以同時運行多個進程, 然而一顆CPU同時只能執(zhí)行一項任務,操作系統(tǒng)利用時間片輪轉(zhuǎn)的方式,讓用戶感覺這些任務正在同時進行。 CPU給每個任務都服務一定的時間, 然后把當前任務的狀態(tài)保存下來, 在加載下一任務的狀態(tài)后, 繼續(xù)服務下一任務。任務的狀態(tài)保存及再加載, 這段過程就叫做上下文切換。
當一個進程在執(zhí)行時,CPU的所有寄存器中的值、進程的狀態(tài)以及堆棧中的內(nèi)容被稱 為該進程的上下文。當內(nèi)核需要切換到另一個進程時,它需要保存當前進程的 所有狀態(tài),即保存當前進程的上下文,以便在再次執(zhí)行該進程時,能夠必得到切換時的狀態(tài)執(zhí)行下去。在LINUX中,當前進程上下文均保存在進程的任務數(shù)據(jù)結(jié) 構(gòu)中。在發(fā)生中斷時,內(nèi)核就在被中斷進程的上下文中,在內(nèi)核態(tài)下執(zhí)行中斷服務例程。但同時會保留所有需要用到的資源,以便中繼服務結(jié)束時能恢復被中斷進程 的執(zhí)行。
2.上下文切換的消耗?
直接消耗包括: CPU寄存器需要保存和加載,系統(tǒng)調(diào)度器的代碼需要執(zhí)行,TLB實例需要重新加載,CPU 的pipeline需要刷掉。
間接消耗:多核的cache之間得共享數(shù)據(jù),間接消耗對于程序的影響要看線程工作區(qū)操作數(shù)據(jù)的大小。
上下文切換通常是計算密集型的。也就是說,它需要相當可觀的處理器時間,在每秒幾十上百次的切換中,每次切換都需要納秒量級的時間。所以,上下文切換對系統(tǒng)來說意味著消耗大量的 CPU 時間,事實上,可能是操作系統(tǒng)中時間消耗最大的操作。
3.如何檢查上下文切換是否頻繁?
(1)確認CPU使用率
CPU是否處于空閑狀態(tài)。
(2)vmstat 1
從vmstat的輸出可以看到,io項的block_in和block_out是否頻繁,system項的每秒中斷數(shù)(in)和每秒的上下文切換(cs)是否頻繁。
(3)
pidstat -w 1
從pidstat上可以看到,每個進程對應的cswch(自愿上下文切換)和nvcswch(非自愿上下文切換)是否頻繁。
cswch/s: 每秒任務主動(自愿的)切換上下文的次數(shù),當某一任務處于阻塞等待時,將主動讓出自己的CPU資源。
nvcswch/s: 每秒任務被動(不自愿的)切換上下文的次數(shù),CPU分配給某一任務的時間片已經(jīng)用完,因此將強迫該進程讓出CPU的執(zhí)行權(quán)。
(4)/proc/stat
/proc/stat包含了CPU的活動信息,上下文切換就是其中一項,以ctxt開頭,它表示系統(tǒng)開機到目前為止的上下文切換總數(shù)。
cat /proc/stat | grep ctxt && sleep 30 && cat /proc/stat | grep ctxt
通過上面的命令,可以計算出每秒上下文切換次數(shù)=兩者差值/30
通過以上命令即可以定位那個進程上下文切換頻繁。
4.造成上下文切換頻繁的原因?
當前執(zhí)行任務的時間片用完之后, 系統(tǒng)CPU正常調(diào)度下一個任務
當前執(zhí)行任務碰到IO阻塞, 調(diào)度器將掛起此任務, 繼續(xù)下一任務
多個任務搶占鎖資源, 當前任務沒有搶到,被調(diào)度器掛起, 繼續(xù)下一任務
用戶代碼掛起當前任務, 讓出CPU時間
硬件中斷