原創(chuàng)：微觀技術(shù)

作為后端研發(fā)同學(xué)為了幾兩碎銀，沒日沒夜周旋于各種人、各種事上。

如果你要想成長的更快，就要學(xué)會歸納總結(jié)，找到規(guī)律，并且善用這些規(guī)律。

就比如工作，雖然事情很多、也很繁瑣，但如果按照性質(zhì)歸下類，我覺得可以分為兩大類：

1、業(yè)務(wù)類，如：產(chǎn)品要做一個紅包活動，下周一就要上線，于是研發(fā)同學(xué)就吭哧吭哧，周末加班不睡覺也要趕出來

2、技術(shù)類，如：架構(gòu)升級、系統(tǒng)優(yōu)化等，這類事情對技術(shù)能力有一定要求，通常要求有一定的項(xiàng)目經(jīng)驗(yàn)的同學(xué)來 owner

關(guān)于業(yè)務(wù)類的內(nèi)容很大程度依賴于產(chǎn)品同學(xué)的節(jié)奏，研發(fā)更多是被動角色，我們能做的是就是多跟產(chǎn)品聊天，「實(shí)時」了解產(chǎn)品的最新動向，培養(yǎng)自己的業(yè)務(wù) sense，給自己多預(yù)留一定的buffer時間可以去做技術(shù)調(diào)研、技術(shù)儲備。

工作過一段時間同學(xué)一般都經(jīng)歷過，產(chǎn)品變化節(jié)奏很快，經(jīng)常都是倒排時間，讓研發(fā)苦不堪言。

至于技術(shù)類，相對就比較溫和的多了，不過也非常考驗(yàn)研發(fā)的技術(shù)實(shí)力。

今天，我們就來聊下關(guān)于接口性能優(yōu)化有哪些技巧？

1、本地緩存

本地緩存，最大的優(yōu)點(diǎn)是應(yīng)用和cache是在同一個進(jìn)程內(nèi)部，請求緩存非常快速，沒有過多的網(wǎng)絡(luò)開銷等，在單應(yīng)用不需要集群支持或者集群情況下各節(jié)點(diǎn)無需互相通知的場景下使用本地緩存較合適。缺點(diǎn)也是因?yàn)榫彺娓鷳?yīng)用程序耦合，多個應(yīng)用程序無法直接的共享緩存，各應(yīng)用或集群的各節(jié)點(diǎn)都需要維護(hù)自己的單獨(dú)緩存，對內(nèi)存是一種浪費(fèi)。

常用的本地緩存框架有 Guava、Caffeine 等，都是些單獨(dú)的jar包，直接導(dǎo)入到工程里即可使用。

我們可以根據(jù)自己的需要靈活選擇想要哪個框架

使用門檻比較低，大家可以自行網(wǎng)上搜索相應(yīng)的教程，這里就不展開了。

本地緩存適用兩種場景：

對緩存內(nèi)容時效性要求不高，能接受一定的延遲，可以設(shè)置較短過期時間，被動失效更新保持?jǐn)?shù)據(jù)的新鮮度
緩存的內(nèi)容不會改變。比如：訂單號與uid的映射關(guān)系，一旦創(chuàng)建就不會發(fā)生改變

注意問題：

內(nèi)存 Cache 數(shù)據(jù)條目上限控制，避免內(nèi)存占用過多導(dǎo)致應(yīng)用癱瘓。
內(nèi)存中的數(shù)據(jù)移出策略
雖然實(shí)現(xiàn)簡單，但潛在的坑比較多，最好選擇一些成熟的開源框架

2、分布式緩存

本地緩存的使用很容易讓你的應(yīng)用服務(wù)器帶上“狀態(tài)”，而且容易受內(nèi)存大小的限制。

分布式緩存借助分布式的概念，集群化部署，獨(dú)立運(yùn)維，容量無上限，雖然會有網(wǎng)絡(luò)傳輸?shù)膿p耗，但這1~2ms的延遲相比其更多優(yōu)勢完成可以忽略。

優(yōu)秀的分布式緩存系統(tǒng)有大家所熟知的 Memcached 、redis。對比關(guān)系型數(shù)據(jù)庫和緩存存儲，其在讀和寫性能上的差距可謂天壤之別，redis單節(jié)點(diǎn)已經(jīng)可以做到 8W+ QPS。設(shè)計(jì)方案時盡量把讀寫壓力從數(shù)據(jù)庫轉(zhuǎn)移到緩存上，有效保護(hù)脆弱的關(guān)系型數(shù)據(jù)庫。

注意問題：

緩存的命中率，如果太低無法起到抗壓的作用，壓力還是壓到了下游的存儲層
緩存的空間大小，這個要根據(jù)具體業(yè)務(wù)場景來評估，防止空間不足，導(dǎo)致一些熱點(diǎn)數(shù)據(jù)被置換出去
緩存數(shù)據(jù)的一致性
緩存的快速擴(kuò)容問題
緩存的接口平均RT，最大RT，最小RT
緩存的QPS
網(wǎng)絡(luò)出口流量
客戶端連接數(shù)

3、并行化

梳理業(yè)務(wù)流程，畫出時序圖，分清楚哪些是串行？哪些是并行？充分利用多核 CPU 的并行化處理能力

如下圖所示，存在上下文依賴的采用串行處理，否則采用并行處理。

JDK 的 CompletableFuture 提供了非常豐富的API，大約有50種處理串行、并行、組合以及處理錯誤的方法，可以滿足我們的場景需求。

之前寫的文章：搞定 CompletableFuture，并發(fā)異步編程和編寫串行程序還有什么區(qū)別？

4、異步化

一個接口的 RT 響應(yīng)時間是由內(nèi)部業(yè)務(wù)邏輯的復(fù)雜度決定的，執(zhí)行的流程約簡單，那接口的耗費(fèi)時間就越少。

所以，普遍做法就是將接口內(nèi)部的非核心邏輯剝離出來，異步化來執(zhí)行。

下圖是一個電商的創(chuàng)建訂單接口，創(chuàng)建訂單記錄并插入數(shù)據(jù)庫是我們的核心訴求，至于后續(xù)的用戶通知，如：給用戶發(fā)個短信等，如果失敗，并不影響主流程的完成。

我們會將這些操作從主流程中剝離出來。

業(yè)務(wù)的普遍做法就是，下單成功后，發(fā)送一條異步消息到MQ 服務(wù)器，由消費(fèi)端監(jiān)聽 topic，異步消費(fèi)執(zhí)行，通過發(fā)布/訂閱模式也能支持一些新的消費(fèi)任務(wù)的快速接入。

5、池化技術(shù)

TCP 三次握手非常耗費(fèi)性能，所以我們引入了 Keep-Alive 長連接，避免頻繁的創(chuàng)建、銷毀連接。

池化技術(shù)也是類似道理，將很多能重復(fù)使用的對象緩存起來，放到一個池子里，用的時候去申請一個實(shí)例對象，用完后再放回池子里。

池化技術(shù)的核心是資源的“預(yù)分配”和“循環(huán)使用”，常見的池化技術(shù)的使用有：線程池、內(nèi)存池、數(shù)據(jù)庫連接池、HttpClient 連接池等

連接池的幾個重要參數(shù)：最小連接數(shù)、空閑連接數(shù)、最大連接數(shù)

比如創(chuàng)建一個線程池:

new ThreadPoolExecutor(3, 15, 5, TimeUnit.MINUTES,
new ArrayBlockingQueue<>(10),
new ThreadFactoryBuilder().setNameFormat("data-thread-%d").build(),
(r, executor) -> {
if (r instanceof BaseRunnable) {
((BaseRunnable) r).rejectedExecute();
}
});

6、分庫分表

MySQL的底層 innodb 存儲引擎采用 B+ 樹結(jié)構(gòu)，三層結(jié)構(gòu)支持千萬級的數(shù)據(jù)存儲。

當(dāng)然，現(xiàn)在互聯(lián)網(wǎng)的用戶基數(shù)非常大，這么大的用戶量，單表通常很難支撐業(yè)務(wù)需求，將一個大表水平拆分成多張結(jié)構(gòu)一樣的物理表，可以極大緩解存儲、訪問壓力。

分庫分表也可能會帶入很多問題：

分庫分表后，數(shù)據(jù)在分表內(nèi)產(chǎn)生數(shù)據(jù)傾斜
如何創(chuàng)建全局性的唯一主鍵id
數(shù)據(jù)如何路由到哪一個分片

每一個問題展開都要花費(fèi)很長篇幅來講解，這里主要講接口性能優(yōu)化的方案匯總，就不展開細(xì)講了。

關(guān)于分庫分表，市場受歡迎的開源框架是 sharding-jdbc，目前已經(jīng)捐贈給Apache并啟動孵化

之前寫的文章：為什么要分庫分表？

7、SQL 優(yōu)化

雖然有了分庫分表，從存儲維度可以減少很大壓力，但「富不過三代」，我們還是要學(xué)會精打細(xì)算，就比如所有的數(shù)據(jù)庫操作都是通過 SQL 來執(zhí)行。

一個不好的SQL會對接口性能產(chǎn)生很大影響。

比如：

搞了個深度翻頁，每次數(shù)據(jù)庫引擎都要預(yù)查非常多的數(shù)據(jù)
索引缺失，走了全表掃描
一條 SQL 一次查詢幾萬條數(shù)據(jù)

SQL 優(yōu)化的經(jīng)驗(yàn)非常多，比如：

SQL 查詢時，盡量不要使用 select * ，而是 select 具體字段
如果只有一條查詢結(jié)果（或者最大值、最小值），建議使用 limit 1
索引不宜太多，一般控制在 5個以內(nèi)
where 語句中盡量避免使用 or來連接條件。or 可能會導(dǎo)致索引失效，從而全表掃描
索引盡量避免建在有大量重復(fù)數(shù)據(jù)的字段上，如：性別
where 、 order by 涉及的列上建索引，避免全表掃描
更多.....

SQL 優(yōu)化的內(nèi)容非常多，這里就不展開了

之前寫的一篇文章：SQL 優(yōu)化有哪些技巧？

8、預(yù)先計(jì)算

有很多業(yè)務(wù)的計(jì)算邏輯比較復(fù)雜，比如頁面要展示一個網(wǎng)站的 PV、微信的拼手氣紅包等

如果在用戶訪問接口的瞬間觸發(fā)計(jì)算邏輯，而這些邏輯計(jì)算的耗時通常比較長，很難滿足用戶的實(shí)時性要求。

一般我們都是提前計(jì)算，然后將算好的數(shù)據(jù)預(yù)熱到緩存中，接口訪問時，只需要讀緩存即可

是不是一下子就快了很多。

9、事務(wù)相關(guān)

很多業(yè)務(wù)邏輯有事務(wù)要求，針對多個表的寫操作要保證事務(wù)特性。

但事務(wù)本身又特別耗費(fèi)性能，為了能盡快結(jié)束，不長時間占用數(shù)據(jù)庫連接資源，我們一般要減少事務(wù)的范圍。

將很多查詢邏輯放到事務(wù)外部處理。

另外在事務(wù)內(nèi)部，一般不要進(jìn)行遠(yuǎn)程的 RPC 接口訪問，一般占用的時間比較長。

10、海量數(shù)據(jù)處理

如果數(shù)據(jù)過大，除了采用關(guān)系型數(shù)據(jù)庫的分庫分表外，我們還可以采用 NoSQL

如：MongoDB、Hbase、Elasticsearch、TiDB

NoSQL 采用分區(qū)架構(gòu)，對數(shù)據(jù)海量存儲能較好的支持，但是事務(wù)方面可能沒那么友好。

每一個 NoSQL 框架都有自己的特色，有支持搜索的、有列式存儲、有文檔存儲，大家可以根據(jù)自己的業(yè)務(wù)場景選擇合適的框架。

11、批量讀寫

當(dāng)下的計(jì)算機(jī)CPU處理速度還是很多的，而 IO 一般是個瓶頸，如：磁盤IO、網(wǎng)絡(luò)IO。

有這么一個場景，查詢 100 個人的賬戶余額？

有兩個設(shè)計(jì)方案：

方案一：開單次查詢接口，調(diào)用方內(nèi)部循環(huán)調(diào)用 100 次

方案二：服務(wù)提供方開一個批量查詢接口，調(diào)用方只需查詢 1 次

你覺得那種方案更好？

答案不言而喻，肯定是方案二

數(shù)據(jù)庫的寫操作也是一樣道理，為了提高性能，我們一般都是采用批量更新。

12、鎖的粒度

并發(fā)業(yè)務(wù)，為了防止數(shù)據(jù)的并發(fā)更新對數(shù)據(jù)的正確性產(chǎn)生干擾，我們通常是采用加鎖，涉及獨(dú)享資源每次只能是一個線程來處理。

問題點(diǎn)在于，鎖是成對出現(xiàn)的，有加鎖就是釋放鎖

對于非競爭資源，我們沒有必要圈在鎖內(nèi)部，會嚴(yán)重影響系統(tǒng)的并發(fā)能力。

控制鎖的范圍是我們要考慮的重點(diǎn)。

之前寫過一篇常用的鎖有哪些，聊聊 13 種鎖的實(shí)現(xiàn)方式

13、上下文傳遞

Tom哥帶團(tuán)隊(duì)對小伙伴有要求，代碼必須要有 code review 環(huán)節(jié)，review 同學(xué)代碼經(jīng)常發(fā)現(xiàn)一個問題。

當(dāng)需要一個數(shù)據(jù)時，如果沒有調(diào) RPC 接口去查，比如想用戶信息這種通用型接口

因?yàn)榍懊嬉茫隙ㄒ呀?jīng)查過。但是我們知道方法的調(diào)用都是以棧幀的形式來傳遞，隨著一個方法執(zhí)行完畢而出棧，方法內(nèi)部的局部變量也就被回收了。

后面如果又要用到這個信息，只能重新去查。

如果能定義一個Context 上下文對象，將一些中間信息存儲并傳遞下來，會大大減輕后面流程的再次查詢壓力。

14、空間大小

如何創(chuàng)建一個集合，這還不簡單，很快我們就寫出下面代碼

List<String> lists = Lists.newArrayList();

如果說，要往里面插入 1000000 個元素，有沒有更好的方式？

我們做個試驗(yàn)：

場景一：

結(jié)果：1000000 次插入 List，花費(fèi)時間：154

場景二：

結(jié)果：1000000 次插入 List，花費(fèi)時間：134

如果我們預(yù)先知道集合要存儲多少元素，初始化集合時盡量指定大小，尤其是容量較大的集合。

ArrayList 初始大小是 10，超過閾值會按 1.5 倍大小擴(kuò)容，涉及老集合到新集合的數(shù)據(jù)拷貝，浪費(fèi)性能。

15、查詢優(yōu)化

避免一次從 DB 中查詢大量的數(shù)據(jù)到內(nèi)存中，可能會導(dǎo)致內(nèi)存不足，建議采用分批、分頁查詢

日日操夜夜添-日日操影院-日日草夜夜操-日日干干-精品一区二区三区波多野结衣-精品一区二区三区高清免费不卡

接口性能優(yōu)化的 15 個技巧