現在云服務已經深入千家萬戶了,不僅商用,私用也很多。很多云服務廠商也都有配套的服務器安全模塊,可以檢測網絡流量異常、內存占用量和CPU占用率,并且允許人工設置告警閾值。例如,CPU持續大于90%10分鐘,那么你可能就會收到一條告警通知。
有時,或許這樣的告警是因為一些惡意行為或者bug導致。但是有時,我們希望我們編寫的程序能夠盡可能壓榨性能去盡快處理一些工作,此時CPU占滿或許是一個很正常的行為。可如此就會觸發告警,加之一些同道告警強迫癥發作,此時就會很為難。如果增加一些sleep操作,莫名其妙的睡眠似乎總是不夠優雅與完美。
那么,有沒有什么好的解決方案呢?
今天碼哥就給大家提供一種解決方案。

或許有些人聽過用過Docker,docker容器就是可以做到資源隔離與資源配額的。似乎是我們想要的,那么是否可以借鑒一下呢?
答案是肯定的。
很多時候,我們的程序只是一次性的任務,且有些任務還依賴一些框架,如果將這種任務裝入docker容器運行,顯然成本和收益的問題讓我們內心不太通達。
在linux中,這樣的資源配額限制是通過cgroups來實現的,它能夠限制CPU、內存、IO等資源的使用程度。當然cgroups還有一些其他的使用功能,這里就不額外延展啦。
為了應對上面的那種資源限制需求,碼哥展示一個用C語言編寫的啟動程序,幫你輕松解決這類問題。

限于篇幅,我們只展示CPU限制的方式,內存和IO相關的限制方法與其類似,可參閱網上一些人的文章自行擴展。
下面直接上代碼(受限于手機屏幕尺寸,建議大家PC端查看):
/*
* Author: 碼哥比特
*/
#define _GNU_SOURCE
#include <stdio.h>
#include <sys/types.h>
#include <unistd.h>
#include <fcntl.h>
#include <sys/mount.h>
#include <sched.h>
#include <errno.h>
#include <string.h>
#include <dirent.h>
#include <stdlib.h>
#include <sys/stat.h>
char *cpu = NULL;
char *group_name = NULL;
char cpu_basedir[256];
int deleted = 0;
static void print_help(char *name)
{
printf("Usage:n");
printf("%s [OPTIONS] SHELL COMMANDn", name);
printf("t-cttset cpu raten");
printf("t-gttgroup namen");
printf("t-dttdelete groupn");
}
static int parse_args(int argc, char *argv[])
{
//...掠過一些參數解析部分
}
static void set_limit(void)
{
int fd, n, pid = getpid();
char tmp[1024];
if (cpu != NULL) {
if (mkdir(cpu_basedir, S_IRWXU) < 0) {
if (errno != EEXIST) {
fprintf(stderr, "create cpu group failed");
exit(1);
}
}
memset(tmp, 0, sizeof(tmp));
snprintf(tmp, sizeof(tmp)-1, "%s/cpu.cfs_quota_us", cpu_basedir);
if ((fd = open(tmp, O_WRONLY)) < 0) {
fprintf(stderr, "open cpu file failed. %sn", strerror(errno));
exit(1);
}
memset(tmp, 0, sizeof(tmp));
n = snprintf(tmp, sizeof(tmp)-1, "%sn", cpu);
write(fd, tmp, n);
close(fd);
memset(tmp, 0, sizeof(tmp));
snprintf(tmp, sizeof(tmp)-1, "%s/tasks", cpu_basedir);
if ((fd = open(tmp, O_WRONLY|O_AppEND)) < 0) {
fprintf(stderr, "open cpu tasks failed. %sn", strerror(errno));
exit(1);
}
memset(tmp, 0, sizeof(tmp));
n = snprintf(tmp, sizeof(tmp)-1, "%dn", pid);
write(fd, tmp, n);
close(fd);
}
}
int main(int argc, char *argv[])
{
int idx = parse_args(argc, argv);
if (group_name == NULL) {
fprintf(stderr, "group name must be givenn");
print_help(argv[0]);
exit(1);
}
memset(cpu_basedir, 0, sizeof(cpu_basedir));
snprintf(cpu_basedir, sizeof(cpu_basedir)-1, "/sys/fs/cgroup/cpu/%s", group_name);
if (deleted) {
remove(cpu_basedir);
}
if (idx) {
set_limit();
execv(argv[idx], argv+idx);
}
return 0;
}
為了節省篇幅,代碼中略過了一些參數解析部分。從幫助信息中,我們也可大致看到程序的使用方式。
# ./cpuctl -c=89000 -g=test_group a.out #姑且先叫cpuctl吧
這里,-g是用來設置資源組名的,避免和其他資源組沖突。-c是這個資源組下的所有進程CPU占用總和的上限數值,89000是89%的含義。這里要注意,如果你有兩個進程在這個資源組下,那么兩個進程是平分89%的,也就是每個進程44.5%。a.out則是我們要執行的程序。
我們用一個簡單的死循環來測試一下:
#include <stdio.h>
int main(void)
{
while (1) {}
return 0;
}
正常情況下100%無疑,如圖:

CPU100%
下面我們用我們的程序啟動器來啟動a.out并限制其CPU為89%,如圖:

CPU 89%
我們可以看到,其CPU占比會在89%上下小幅浮動,大家可自行嘗試。
從代碼中,我們可以看到,其實限制的方法是在/sys/fs/cgroup/cpu下建立一個test_group目錄,然后向其內的cfs_quota_us文件寫入限制額度,再向其內的tasks寫入希望限制的進程ID。目前從碼哥的使用情況來看,阿里和騰訊的cgroups配置都是在/sys/fs/cgroup中的,可能其他的操作系統有不同的路徑。
喜歡的朋友可以關注碼哥,也可以在評論區給碼哥留言交流,謝謝觀看!