并發編程是當前軟件領域中不可忽視的一個關鍵概念。隨著CPU等硬件的不斷發展,我們都渴望讓我們的程序運行速度更快、更快。而Go語言在語言層面天生支持并發,充分利用現代CPU的多核優勢,這也是Go語言能夠廣泛流行的一個重要原因。
在JAVA中,要支持高并發有幾種方案可供選擇。首先,我們可以通過開啟多部署節點集群來增加高并發處理能力,通過增加機器硬件來實現。其次,我們可以在單節點上開啟多線程來處理請求。然而,即使在單節點內創建線程也是非常耗費資源的。因此,通常情況下我們會使用線程池來管理線程的創建和銷毀。然而,有一個公式你可能會很熟悉,即核心線程數等于CPU核數的一半加一。這意味著我們并不是線程創建得越多,對于我們的Java程序就越好。
在我們明確了問題的痛點之后,我們可以進一步探究一下Go語言是如何解決這些問題,并且將高并發作為Go語言的一項特色功能。
goroutine
我們在Java中開啟線程的方式是直接創建一個Thread對象。然而,在Go語言中,如果我們想要實現異步處理,我們可以使用"go"關鍵字來開啟一個goroutine協程。協程的最大優勢在于其輕量級,可以輕松創建上百萬個協程而不會導致系統資源的耗盡,而線程和進程通常最多也不能超過1萬個。舉個例子:
go f() // 創建一個新的 goroutine 運行函數f
在Go語言中,我們可以非常簡單地使用關鍵字"go"來開啟一個協程,從而實現異步處理函數f。只需在函數f的調用前面加上"go"關鍵字,就能使得該函數在一個獨立的協程中異步執行。
不僅可以使用"go"關鍵字來開啟一個協程異步執行具名函數,還可以使用"go"關鍵字來開啟一個協程異步執行匿名函數。
go func(){
// ...
}()
今天我們的重點不在這里,而是要討論為什么Go語言適合處理高并發的情況。我們都知道,操作系統的CPU最小調度單位是線程,然而Go語言卻使用了協程的概念。那么問題來了,Go語言是如何將這些協程交給CPU來處理的呢?如果無法將它們交給CPU處理,那么就算再創建多少協程也無法運行代碼。在這里,我們就需要了解一下Go語言的調度器,也就是GPM調度模型。
GPM調度模型
可以借鑒一下以下圖例,總的來說,我們可以像線程池一樣,無論創建了多少協程,都需要將它們放入隊列中。然后,剩下的任務就交給調度器來處理。
圖片
其中:
- G:使用關鍵字"go"加上一個函數調用可以創建一個goroutine(簡稱G)。每次調用"go f()"都會創建一個新的G,其中包含要執行的函數f以及相關的上下文信息。
- 全局隊列(Global Queue)是用來存放等待運行的 G(Goroutine)的地方。
- P 是指 goroutine 執行所需的物理資源,每個 P 最多可以承載 GOMAXPROCS 個 goroutine 的執行。
- P 的本地隊列是類似于全局隊列的,它存放了等待運行的G,并且數量限制在256個以內。每當新建一個G時,優先將其加入到P的本地隊列中,如果本地隊列已滿,則會批量移動部分G到全局隊列中。
- 為了使線程能夠執行任務,需要通過獲取調度器(P)來獲取任務(G)。線程首先嘗試從調度器的本地隊列獲取任務,如果本地隊列為空,則線程會嘗試從全局隊列或其他調度器的本地隊列獲取任務。一旦線程獲取到任務,就會執行任務,并在任務執行完畢后再次從調度器獲取下一個任務,持續重復這個過程。
Goroutine 調度器和操作系統調度器通過 M 結合起來,形成了調度的基本單位。在這個結合中,每個 M 代表一個內核線程,而操作系統調度器則負責將這些內核線程分配到 CPU 的核心上進行執行。
channel
單純地將函數并發執行是沒有意義的,因為函數與函數之間需要進行數據交換,才能真正體現并發執行函數的意義。
雖然可以利用共享內存進行數據交換,但是在不同的 goroutine 中使用共享內存容易導致競態問題的出現。為了確保數據交換的正確性,許多并發模型都需要通過使用互斥量對內存進行加鎖來解決這個問題。然而,這種做法往往會帶來性能問題,因為加鎖操作會引入額外的開銷。
Go語言采用的并發模型是CSP(Communicating Sequential Processes),這個模型強調了通過通信共享內存的方式來實現并發,而不是通過共享內存來實現通信。這種設計理念使得Go語言在處理并發任務時更加高效和安全。
如果說 goroutine 是Go程序中實現并發執行的主體,那么channel就是連接這些goroutine之間的紐帶。channel是一種能夠使得一個goroutine向另一個goroutine發送特定值的通信機制。
Mutex(互斥鎖)在實現上也是使用了重量級鎖。與Java的互斥鎖相比,Go語言的Mutex有以下幾點區別:
內存開銷:Go語言的Mutex相對較輕量,使用較少的內存。這是因為Go語言的Mutex只包含一個字段,用于表示鎖的狀態,而Java的互斥鎖通常包含更多的字段和數據結構。
鎖的語法:在Go語言中,可以使用mutex.Lock()和mutex.Unlock()方法來手動控制鎖的獲取和釋放,這樣可以更靈活地控制鎖的粒度。而在Java中,使用synchronized關鍵字來實現互斥鎖,鎖的粒度相對固定,只能對整個方法或代碼塊進行加鎖。
鎖的性能:由于Go語言的Mutex較為輕量,并且采用了更高效的實現方式,比如以下幾個方面:
- 自旋鎖:在低并發的情況下,Go語言的Mutex會采用自旋鎖的方式。自旋鎖是一種忙等待的鎖,當一個Goroutine嘗試獲取鎖時,如果鎖已經被其他Goroutine持有,則該Goroutine會一直循環檢查鎖的狀態,直到成功獲取鎖。這種方式避免了線程切換的開銷,提高了性能。
- 優化的調度策略:Go語言的調度器在處理Goroutine的調度時會進行優化,盡量將鎖的持有者與等待者調度到同一個處理器(P)上執行,減少線程之間的上下文切換和鎖競爭的開銷。
- 等待隊列:當一個Goroutine無法獲取到Mutex鎖時,它會進入等待隊列,等待鎖的釋放。Go語言的Mutex的等待隊列是基于鏈表實現的,相比Java的互斥鎖使用的等待隊列,具有更低的內存開銷和更高的效率。
總結
并發編程是當前軟件領域中一個重要的概念。Go語言通過goroutine和channel的特性,天生支持高并發處理,充分利用現代CPU的多核優勢。與Java相比,Go語言的協程更加輕量級,可以輕松創建上百萬個協程。Go語言的調度器采用GPM調度模型,通過將協程放入隊列中,由調度器分配給CPU處理。此外,Go語言采用CSP模型,通過channel實現協程之間的通信,避免了共享內存帶來的競態問題。相比之下,Go語言的Mutex鎖更輕量、靈活,并且具有更高的性能。總的來說,Go語言適合處理高并發的情況,成為了當前軟件開發領域的熱門語言之一。