近期,人工智能領(lǐng)域迎來(lái)了一位新星——MiniCPM-V4.0,作為MiniCPM-V系列的一次重要升級(jí),它迅速吸引了業(yè)界的目光。這款模型搭載了4.1億參數(shù),其構(gòu)建基礎(chǔ)是強(qiáng)大的SigLIP2-400M與MiniCPM4-3B。相較于前輩,MiniCPM-V4.0在圖像與視頻理解領(lǐng)域展現(xiàn)出了卓越的能力,同時(shí)在效率上也實(shí)現(xiàn)了質(zhì)的飛躍。
MiniCPM-V4.0以其非凡的視覺(jué)理解能力自豪。在OpenCompass這一權(quán)威評(píng)測(cè)平臺(tái)上,它以69.0的平均分脫穎而出,力壓GPT-4.1-mini-20250414、擁有8.1億參數(shù)的MiniCPM-V2.6(得分65.2)以及3.8億參數(shù)的Qwen2.5-VL-3B-Instruct(得分64.5)。不僅在單圖理解上表現(xiàn)出色,在多圖與視頻理解領(lǐng)域,MiniCPM-V4.0同樣展現(xiàn)出了強(qiáng)大的實(shí)力。
尤為MiniCPM-V4.0針對(duì)移動(dòng)設(shè)備進(jìn)行了精心設(shè)計(jì)。在iPhone 16 Pro Max上,它運(yùn)行流暢,首次響應(yīng)延遲低于2秒,解碼速度高達(dá)每秒17個(gè)以上token,且全程無(wú)發(fā)熱現(xiàn)象。即便面對(duì)高并發(fā)請(qǐng)求,該模型也能輕松應(yīng)對(duì),展現(xiàn)出卓越的吞吐性能。
為了讓更多用戶(hù)能夠輕松體驗(yàn)MiniCPM-V4.0的魅力,開(kāi)發(fā)團(tuán)隊(duì)提供了多樣化的使用方案。它完美兼容llama.cpp、Ollama、vLLM等平臺(tái)工具,極大地拓寬了應(yīng)用場(chǎng)景。團(tuán)隊(duì)還開(kāi)源了一款專(zhuān)為iPhone和iPad打造的iOS應(yīng)用,用戶(hù)只需簡(jiǎn)單操作即可上手。同時(shí),配套提供的Cookbook不僅包含了詳盡的使用指南,還列舉了諸多實(shí)用示例,進(jìn)一步降低了使用門(mén)檻。
感興趣的朋友可以通過(guò)以下鏈接了解更多關(guān)于MiniCPM-V4.0的信息:https://huggingface.co/openbmb/MiniCPM-V-4