在人工智能(AI)領(lǐng)域,一場別開生面的“資源錯位戰(zhàn)”正在悄然上演。在這場戰(zhàn)役中,大型科技公司熱衷于參數(shù)升級的“軍備競賽”,而中小型創(chuàng)業(yè)公司則另辟蹊徑,深耕大型公司無暇或不愿涉足的細分賽道。醫(yī)療行業(yè),以其高風(fēng)險性、低容錯率以及對準(zhǔn)確性和嚴謹性的極高要求,成為了這場數(shù)字化攻堅戰(zhàn)中的最難陣地。
近年來,全國各地的AI企業(yè)紛紛意識到了細分賽道的重要性,加大了對垂直領(lǐng)域行業(yè)大模型的投入力度。醫(yī)療行業(yè)對AI的需求尤為迫切,但通用大模型往往難以完全滿足其獨特需求。這一現(xiàn)狀促使企業(yè)開始探索更加專業(yè)化的解決方案。
方舟健客技術(shù)高級副總裁郭陟形象地比喻了通用大模型與垂直大模型在醫(yī)療領(lǐng)域的應(yīng)用。他認為,AI在醫(yī)療場景的落地應(yīng)用,如同醫(yī)學(xué)生成長為婦科專家的過程。通用大模型就像醫(yī)學(xué)院培養(yǎng)的醫(yī)學(xué)生,掌握了廣泛的醫(yī)學(xué)基礎(chǔ)知識,但缺乏臨床實戰(zhàn)經(jīng)驗。而要成為一個真正的專家,則需要經(jīng)過長年累月的臨床實踐和經(jīng)驗積累。
壹生檢康,一家專注于女性精準(zhǔn)健康檢測的科技公司,正是這一理念的踐行者。在女性健康領(lǐng)域深耕3年多后,他們積累了豐富的行業(yè)經(jīng)驗和龐大用戶群體。然而,隨著業(yè)務(wù)的發(fā)展,公司也面臨著如何更好地服務(wù)用戶的難題。通用大模型雖然能夠提供一定程度的幫助,但在準(zhǔn)確性和特定場景的控制上仍有不足。
在此背景下,開源DeepSeek的出現(xiàn)為行業(yè)和個人用戶帶來了對大模型概念的更深層次理解。它不僅推動了通用大模型廠商的快速迭代,還為垂直大模型低成本的技術(shù)實現(xiàn)提供了清晰的路徑。壹生檢康的團隊在經(jīng)過深入研究和對比后,決定自研婦科垂直大模型。
在基礎(chǔ)模型的選擇上,團隊充分考慮了技術(shù)資源和算力的限制。他們對比了不同參數(shù)量的模型,最終選擇了在計算資源和回復(fù)效果之間取得最佳平衡的32B參數(shù)量模型。同時,為了確保模型的醫(yī)學(xué)知識預(yù)訓(xùn)練基礎(chǔ)和專業(yè)性,團隊還重點對比了多個開源推理模型,并最終選擇了QwQ_32B作為基礎(chǔ)模型。
在數(shù)據(jù)準(zhǔn)備與訓(xùn)練策略上,團隊充分利用了壹生檢康旗下toC應(yīng)用“閨蜜醫(yī)生”平臺積累的真實病例數(shù)據(jù)。他們篩選出具有代表性的數(shù)據(jù)樣本,通過DeepSeek進行蒸餾處理,并將蒸餾數(shù)據(jù)用于第一輪訓(xùn)練。然而,未經(jīng)標(biāo)注的純蒸餾數(shù)據(jù)對模型能力的提升影響甚微。因此,在第二輪訓(xùn)練中,團隊邀請了醫(yī)生團隊對數(shù)據(jù)進行逐條審核、標(biāo)注和優(yōu)化,最終構(gòu)建起覆蓋全癥狀、均衡化的數(shù)據(jù)集。
為了評估模型的診斷準(zhǔn)確率,團隊設(shè)計了自動化評估裁判模型,能夠在每次測試中快速對比訓(xùn)練前后的準(zhǔn)確率變化。同時,他們還邀請了多位三甲醫(yī)院的婦科醫(yī)生對模型的診斷結(jié)果和處理建議進行人工評估,以確保評估結(jié)果的公正性和客觀性。
經(jīng)過多位婦科專家的對比評估,壹生檢康自研的豆蔻婦科大模型在月經(jīng)不調(diào)、異常出血、白帶異常、外陰瘙癢、下腹疼痛、下腹包塊六個癥狀上的診斷準(zhǔn)確率達到了77.1%,高出DeepSeek 7%。在某些特定疾病的診斷上,豆蔻婦科大模型還展現(xiàn)出了更優(yōu)的性能和專業(yè)度。
團隊在微調(diào)過程中全力優(yōu)化成本。他們充分利用了貝聯(lián)珠貫平臺上的英偉達4090 GPU卡進行訓(xùn)練,單次訓(xùn)練耗時僅約4小時。最終形成的大型模型參數(shù)量更小,顯著降低了推理成本,同時保證了推理速度和并發(fā)處理能力。
在應(yīng)用場景上,豆蔻婦科大模型不僅服務(wù)于C端用戶,通過閨蜜醫(yī)生APP提供更加精準(zhǔn)、專業(yè)的婦科健康建議,還賦能了婦科醫(yī)生資源相對匱乏的基層診所和大健康機構(gòu)。這些機構(gòu)可以通過簡單的自有知識庫+RAG訓(xùn)練,快速上線企業(yè)自己的婦科AI醫(yī)生。
豆蔻婦科大模型的成功研發(fā),不僅為醫(yī)療行業(yè)提供了更加專業(yè)化、個性化的解決方案,也為AI在醫(yī)療領(lǐng)域的落地應(yīng)用開辟了新的道路。隨著技術(shù)的不斷進步和應(yīng)用場景的不斷拓展,相信未來會有更多像豆蔻婦科大模型這樣的垂直大模型涌現(xiàn)出來,為人們的健康保駕護航。