為了響應衛生經濟學建模者更多地應用合適的復雜系統模型去解決公共衛生領域面臨的復雜挑戰的需求,由40余位復雜系統模型和經濟學評價領域的專家組成的國際團隊制訂,并于近期發布了應用復雜系統模型進行公共衛生干預措施經濟學評價的指南。本文對指南的制訂過程和主要內容進行解讀,以期為國內研究人員提供參考,最終提高我國公共衛生研究和服務的整體質量和改善國民的健康水平。
公共衛生領域中面臨的各種挑戰可以被視為復雜的系統問題,因為其常需要權衡公眾對不同結果的評價,協同各個部門的政策成本和獲益,并且作為開放領域,容易受到快速變化的外部環境的影響,從而具有嚴重的不確定性[1]。與此同時,公共衛生干預措施往往也具有復雜性,這是由于其有多個相互作用的部分、錯綜復雜的作用路徑、實施場景的難以預測等特性[2]。復雜系統中的各因素不是孤立的而是相互作用的,導致我們難以通過簡單的線性因果模型的研究方法去理解或者掌握其產生的效果方向和大小。此時,基于復雜系統模型(complex systems model,CSM)的分析與評價方法將可能是最優的選擇。經濟學評價是公共衛生干預措施研究全生命周期中的一個核心組成部分[3]。基于建模技術的經濟學評價能夠估計公共衛生投資產生的潛在價值,探索政策變化的增量效應和人口效應[4]。衛生經濟學評價通常需要基于較復雜的數學統計模型和相對完整的調查數據,因而對技術、人才、經費和時間的要求較高,這限制了其在中低等收入國家中的廣泛應用[5]。近年來,對在公共衛生領域中應用CSM進行討論的相關文獻逐漸增多,且有關學者號召應該更多地使用復雜系統方法進行公共衛生決策。然而,已發表的采用CSM進行經濟學評價的案例很少[6]。為了支持研究人員更好地應用CSM規劃和實施公共衛生干預措施經濟學評價項目,由40余位CSM和經濟學評價領域的專家組成的國際團隊制訂并于近期發布了應用CSM進行公共衛生干預措施經濟學評價的指南(以下簡稱“指南”)[7]。
為了給我國公共衛生干預措施的經濟學評價提供新思路和幫助國內研究人員更好地應用該指南,本文對該指南的制訂過程和主要內容(即CSM的定義、應用場景、類型選擇、建模的關鍵環節)進行解讀,并結合我國實際情況探討該指南在我國公共衛生干預措施經濟學評價中的應用前景,旨在為最終提高我國公共衛生研究和服務的整體質量和改善國民的健康水平做出貢獻。
1 指南的制訂過程
2020年9月至2021年3月研究人員邀請44位CSM和經濟學評價領域的專家參加兩期研討會以進行該指南的制訂,最終42位專家出席了研討會,36位參與了該指南的撰寫。研究人員首先開展了一項更新的概況性評價,納入了CSM的典型案例,并對建模方法進行了分類。基于該概況性評價的結果,2020年9月16日組織委員會召開了第一期研討會,主要包括3個目的:① 對CSM定義達成共識;② 編寫現有指南文件、案例研究和方法學指南的綜合清單;③ 對CSM指南達成共識。第二期研討會在2021年3月17日召開,主要包括4個目的:① 確定指南的目標與用戶;② 確定應用CSM的場景;③ 對模型類型達成共識;④ 確定技術指南與案例研究。
2 指南的主要內容
2.1 復雜系統模型的定義
面向公共衛生的CSM是具有動態(dynamic)、非線性(non-linearity)、反饋(feedback)和相互作用(interactions)等4個相互重疊關鍵特征的定量模型,它的目的是及時發現緊急結果(emergent outcomes)、預測健康、經濟學和其他潛在結果,為公共衛生政策制定提供依據(圖1)。由于上述關鍵特征會增加模型的復雜性,因此,為了幫助建模者更好地掌握CSM的應用,有必要明晰CSM的復雜性(complexity)和傳統概念上復雜化(complicated)的區別,例如,過多的建模要素和錯綜復雜的干預措施可能使模型變得復雜化,但卻不一定使模型具有復雜性[8]。目前常見的公共衛生CSM主要包括偏微分方程(partial differential equations,PDEs)、離散事件模擬(discrete event simulation,DES)、主體模擬(agent-based models,ABMs)、系統動力學(systems dynamics,SD)、可計算一般均衡模型(computable general equilibrium models,CGE)和混合模型(hybrid models)等[9-16]。

2.2 復雜系統建模的應用場景
公共衛生問題本身就是具有復雜性,因此復雜系統適用于解決公共衛生問題,過度簡化模型會降低模型的實用性,因此建模者需要了解復雜系統的行為模式、機制和過程以及干預措施與系統之間相互作用的關系,特別是將干預措施與結果聯系起來的復雜特性(圖2)。CSM尤其適用于對不同要素或水平(個體/匯總)進行多種公共衛生干預措施經濟學評價。然而,當可選擇其他建模方式實現相似的結果時,則不一定需要應用CSM。因此,建模者在建模過程中應考慮存在的實際限制,如模型類型、可獲得的數據和資源、利益相關者的偏好等,來選擇合適的建模類型[7]。

CSM很難獲取到充足的試驗數據來支持研究,因此需要使用一些假設來填補證據空白(即理論、數據、校準方面)。假設的合理性是至關重要的,因此研究人員理應找到科學的工具來驗證提出的假設。需要注意的是,模型理論和校準參數的增加,會加大其使用外部數據進行驗證的難度,導致時間的浪費、不透明度的增加和非必要風險的出現[17]。例如,過多的校準參數可能會導致數據的過度擬合[18]。此外,建模者還需要考慮數據缺失和復雜特性的存在可能會增加模型預測結果的不確定性。因為在這種情況下,多個輸入變量之間可能存在復雜的相互關系,并且初始輸入條件的微小變化也可能會導致截然不同的輸出結果。因此,建模者應該關注決策者的需求,權衡模型的簡化和復雜化程度,避免過于簡化或復雜化導致模型不適用于決策需求[7]。
2.3 復雜系統模型的類型選擇
2.3.1 模型類型的選擇
建模者在選擇合適的模型類型進行公共衛生干預措施經濟學評價時,應該與是否應用CSM的決定結合起來考慮,對決策問題、系統特征和數據進行類似的審查。雖然有一系列可用的CSM供建模者選擇,但是實際應用時應根據不同維度(即確定性/非確定性、靜態/動態、離散/連續、個體/匯總和數理邏輯/代數)來確定最終的模型類型[19]。修訂版的Brennan分類方法,見表1。

2.3.2 復雜系統模型的類型選擇
建模者通常使用SD和ABMs方法來解決復雜系統中出現的問題[20],SD采用聚合視角來整合系統中的各個部分或成分,并預測系統隨時間推移的變化。ABMs可被視為更為個體化的建模方法,重點考慮行為、異質性和主體之間的相互作用。然而,CSM的選擇范圍不僅限于上述兩種主流方法,還有其他類型的CSM可被應用。
公共衛生研究人員要開放思維,廣泛探索不同學科的研究成果,并將其融合到本領域的研究中,以更好地理解和解決公共衛生問題。例如,CGE模型和PDEs模型也可被用于公共衛生問題的復雜系統建模。CGE模型通過對經濟體系的各個細節參數進行建模,來分析政策決策對經濟整體的影響,包括稅收、消費、投資等關鍵因素[11]。而PDEs則通過數學方程描述傳染病在人群中的傳播規律,以及病毒等病原體的擴散速度和傳染率等變化[10]。這兩種模型和SD的相似之處在于,它們都著重于分析人群或經濟體系的聚合特性和動態變化。然而,在CSM中,可以將多種類型結合起來形成混合模型。雖然已有研究人員提出混合模型框架[21],但混合模型目前在公共衛生領域中應用依然很少[22-23]。
鑒于以上建模方法概念之間存在廣泛重疊,建模者應該根據問題的性質來選擇合適的CSM,而不是對某一公共衛生問題規定使用特定的模型類型。然而,在實際應用過程中,研究人員發現存在某種CSM被廣泛應用的聚類現象,這可能是由于受到研究學科、專業知識影響。例如,SD和CGE模型通常用于問題邊界較廣的領域,例如影響范圍超出公共服務的政策研究[11-12];ABMs可以幫助研究者更好地理解個體行為和社交網絡因素對公共衛生領域中飲酒、吸煙、飲食和體育活動等健康行為的影響[13-14];DES適用于醫療資源缺乏的健康問題,例如癌癥篩查和心理健康服務[9,16];個體水平模型更能夠準確地估計異質性的效應,并探討公平性影響。
2.4 復雜系統建模的關鍵環節
2.4.1 利益相關者的參與
在構建CSM的全過程中,建模者與利益相關者進行強有力的溝通至關重要,這可以確保模型輸出符合預期結果[24]。建模者不僅需要考慮到各領域利益相關者廣泛和多樣的觀念,還需要根據利益相關者對于復雜系統的理解的變化實時對模型進行調整。已有研究證明了利益相關者與建模者共同參與CSM的構建可以提高模型的透明度、增加對建模過程的理解和對模型及其輸出結果的認可度[25]。值得注意的是,在構建和實施CSM模型時,除了需要利益相關者的參與,建模者還應該與公眾代表進行互動和溝通[26]。
2.4.2 理解并確定問題
在構建CSM之前,需要對問題進行深入的研究和分析,并將這些研究分析的結果記錄下來,這對構建和驗證模型結構和類型至關重要[24]。隨著時間的推移,問題的理解會隨著新的證據、利益相關者的不同觀點以及系統變化而發生改變。因此,圖示化復雜系統對于理解問題是非常關鍵的,特別是在利益相關者持有不同觀點的情況下。系統圖譜(systems map)可以幫助建模者和利益相關者達成共識并制定協議,在公共衛生建模中有很多不同的方法和途徑可供選擇,常用的方法包括:群體概念映射、因果循環圖和軟系統方法。這些方法可以幫助建模者和利益相關者更好地理解系統的復雜性和之間的相互作用,并找到解決問題的最佳途徑[7]。
2.4.3 設置模型邊界
模型邊界(model boundary)是用于規定模型中應該包括的要素和變量,它的界定容易受到建模者的專業知識和偏好的影響,因此模型邊界的設定具有一定的主觀性。建模者在建模過程中需要遵循透明化的原則,應該詳細記錄和說明在理解問題時納入和排除每個組成部分的理由[24]。同時,還應該詳細描述系統中包含的各個要素和關鍵變量,以便更好地解釋模型結果和確定資源投資的優先級[27]。
2.4.4 引入數據和證據
衛生經濟模型通常是基于實證數據推導的流行病模型。然而,CSM可以基于觀察數據構建,或基于理論或者假設進行抽象構建。應用CSM評估衛生經濟政策時,通常需要大量的觀察數據和經驗認知來構建模型,并使用統計學技術來分析數據和評估政策的效果。因此,研究人員需要具備專業的方法學知識和技能來處理數據和構建模型。
當個體水平和系統某些部分的數據缺乏時,建模者需要使用數據合成技術來創建合成數據[13]。空間微觀模擬技術是將屬性豐富的微觀數據和代表性的宏觀數據相結合,形成一個新的數據集,對于CSM建模者合成數據具有重大的借鑒意義。空間微觀模擬技術是借助迭代比例擬合(iterative proportional fitting)和組合優化(combinatorial optimization)這兩種方法來處理數據。迭代比例擬合用于調整樣本數據的權重,使得樣本數據更好地反映人口普查或政府數據的特征。組合優化是一種合成和復制個體數據的技術,可以用于從宏觀數據中生成個體水平的數據,從而得到更加具體和詳細的微觀數據[7]。
雖然反饋回路作為CSM的一個關鍵特征,但是回路中模型參數由于其他變量的時依性混雜往往難以測量。在這種情況下,簡單的回歸方法不能確定因果效應,因為它提供的是暴露對結果的真實效應的有偏估計[28]。因此,如果資源和數據可獲取,建模者可以設計專門的統計分析方法。目標試驗模擬研究(simulation study of target test)作為一種新的研究框架,可通過模擬目標隨機對照試驗來幫助研究者在觀察性研究中確定暴露/干預與結果之間因果關系[29]。近年來該框架已被越來越多的研究人員用以解決相關研究問題。同時,國外學者開發了在線工具CERBOT,用以幫助研究人員開展目標試驗模擬研究。
校準(calibration)是一種迭代過程,即根據目前的模擬結果來調整模型參數,從而更準確地匹配觀測到的結果。模型校準包括貝葉斯校準和非貝葉斯校準兩類方法。其中,貝葉斯校準通過生成后驗分布來識別不確定性,由此進行概率敏感性分析,但計算時需耗費大量時間[30]。非貝葉斯校準目標則是找到一組校準參數,使模型能夠最好地復現校準目標。然而,頻率學校準方法作為一種非貝葉斯校準方法,容易出現過度擬合的問題,即研究人員過分相信模型參數的準確性,而沒有考慮到模型參數的不確定性[31]。無論使用何種校準方法,其都可能遇到參數識別性問題,即數據不足以校準所需參數。
2.4.5 計算效率
計算效率通常是指模型的運行速度以及所需要的計算資源。它決定建模者在何種情況下和如何使用模型輸出結果,是判斷CSM可行性和可靠性的重要因素之一。然而,在實際運用過程中,CSM往往會面臨計算能力的問題,尤其在微觀層面的模型。校準多種要素的模型通常需要昂貴的計算成本,這可能超出研究項目的資源上限。此時,建模者可以對模型邊界進行修改,在減少復雜性的同時需要保持模型的可操作性。目前,模型模擬和分布式模擬可以用來處理計算效率帶來的問題[7]。
2.4.6 模型的不確定性
敏感性分析和參數不確定分析可讓利益相關者知曉不確定性的來源。然而,在CSM分析不確定性具有一定挑戰。首先,分析不確定性可能受到計算能力和時間限制的影響;其次,建模者可能沒有完全理解不確定性的來源;最后,不確定性本身也可能會影響研究人員如何應用模型輸出結果[32]。除了參數的不確定性以外,模型本身的結構也可能是不確定性,目前最新的技術是利用機器學習方法來不斷地調整模型結構和參數,以適應實際需求和數據變化[33]。此外,證據權重法提出了一種評估不同證據的方法,并根據證據的可靠性和相關性決定其在決策過程中的權重,以確保使不同觀點并存[34]。建模者應該認識到模型只是真實世界的簡化,未知的變量和要素可能會影響模型的準確性和適用性,因此必須清晰地向用戶報告這些模型的局限性[7]。
2.4.7 模型驗證與確認
模型驗證(verification)是檢查模型編碼是否正確的過程。模型確認(validation)是測試模型是否能精確反映真實世界中發生的事件[7]。這兩個步驟都非常重要,因為它們可以確保模型的質量和可靠性,從而為決策者提供堅實的決策依據。建模者需要根據驗證分類、建議和驗證評估工具來實施驗證和確認,并結合可用的資源和數據來制定潛在的解決方案[35](表2)。

共同參與和模型透明度是確保模型有效性和可信度的重要手段。通過與專家和利益相關者的討論來測試表面效度和驗證模型,可以幫助建立決策者對模型的信任。在模型構建和應用的各個階段,建模者都應該進行迭代和多方面的驗證[9,12,15]。此外,模型透明度也非常重要,必須有詳細的文檔記錄,以便可以對其進行再現。采用“開源”模型可以進一步提高模型的可信度和可靠性,從而為決策者提供更好的決策依據[7]。
外部驗證和交叉驗證是兩種常見的驗證方法,用于比較模型輸出和實際觀測到的數據,驗證模型的準確性。具體來說,外部驗證是將CSM輸出與回顧性數據進行比較[9],交叉驗證是將CSM輸出與其他模型進行比較[16]。在公共衛生的背景下,外部驗證和校準的過程可能相互交織,難以區分,特別是在可用數據有限的情況下。此外,由于反饋回路中不同要素之間的關系可能隨著時間推移而發生變化,很難將CSM的輸出結果與未用于創建模型的真實世界數據進行比較。為了應對這些挑戰,建模者應該在個體水平和匯總水平進行驗證。在個體水平的驗證包括測試模型的每個部分是否準確地代表了真實世界,而匯總水平的驗證則確認是否再現了系統結果的突發動態[7]。
3 討論
隨著公共衛生問題日益受到人們的重視,公共衛生干預措施的經濟學評價也越來越重要。近年來,我國研究人員開始注重構建模型來進行經濟學評價,但仍然存在一定的問題,主要體現在構建的模型過于簡單而無法提供多個干預措施對比的綜合經濟學評價、未能考慮關鍵變量的不確定性[36]。因此,本研究對Health Economics期刊近期發布的指南進行了解讀,旨在促進我國建模者應用該指南開展相關研究,提高相關衛生經濟學評價研究的質量,以期最終提高我國公共衛生研究和服務的整體質量和改善國民的健康水平。
我國在系統科學理論和方法論的研究方面幾乎與國外同時起步,并且開創了以社會系統為主要研究對象所形成的復雜社會系統理論。但是系統理論對復雜系統建模尚停留在對系統的組成要素、結構和功能的理解,還未上升到使用統計學和數學模型來研究和應用復雜系統,且未形成規范的整體結構[37]。公共衛生問題在發生發展過程中常常受到多種復雜因素的影響,應用傳統分析方法處理復雜系統研究問題往往存在很大的局限性,國內多數研究尚停留在單因素、短期、個體和線性的研究水平[6]。CSM有助于幫助研究人員更深入理解和分析復雜系統中各要素變化及相互作用。該指南建議,當有涉及動態、反饋回路、非線性和相互作用的特性時,需要應用CSM。我們認為該指南能夠為剛進入這一領域和已經參與開發此類模型的研究人員提供快速學習的路徑,可以幫助相關研究人員更好地理解和應用CSM解決公共衛生領域中的復雜問題,進而對公共衛生系統中政策制訂和決策實施產生重要影響。健康中國發展戰略及行動任務突出強調要倡導多元主體的共同參與,這與CSM中要求利益相關者與公眾代表共同參與模型構建的觀點相一致,以建立起以“疾病預防”和“健康促進”為核心的公共衛生體系[38]。因此,為了更好地解決我國公共衛生領域面臨的復雜問題,應加強CSM在我國公共衛生領域中的應用,并結合實際探索CSM方法學的最佳實踐,制訂具有本土特色、符合我國實際情況的CSM方法學指南。衛生經濟學評價是公共衛生干預措施評價過程中一項復雜而重要的環節,研究者應謹慎地選擇評價模型,同時考慮其在真實世界中的合理性和公平性。在我國,應用CSM進行公共衛生干預措施的經濟評價尚處于探索階段,相關文獻數量較少。目前,我國學者在進行公共衛生干預措施經濟學評價時,往往選擇CSM的單一類型且應用在公共衛生某一特定領域,往往難以應對日益復雜的公共衛生問題[6]。根據指南中CSM的建議模型類型,應根據問題性質,選用混合復雜模型來解決公共衛生問題。因此,為了更好地解決我國公共衛生領域面臨的復雜問題,應加強CSM在我國公共衛生領域中的應用,并結合實際探索應用CSM開展公共衛生干預措施經濟學評價的最佳方法學實踐,制訂具有本土特色、符合我國實際情況的CSM方法學應用指南。
綜上所述,本文對應用CSM對公共衛生干預措施進行經濟學評價指南的主要內容進行了解讀,并結合我國實際情況探討了該指南在我國公共衛生干預措施經濟學評價中的應用前景,旨在為最終提高我國公共衛生研究和服務的整體質量和改善國民的健康水平做出貢獻。考慮到我國與西方公共衛生政策體系機制不同,及實施主體和文化的差異,建議我國研究者和決策者在應用該指南時應結合我國國情,同時考慮制訂具有中國特色的應用CSM進行公共衛生干預措施經濟學評價的指南。
公共衛生領域中面臨的各種挑戰可以被視為復雜的系統問題,因為其常需要權衡公眾對不同結果的評價,協同各個部門的政策成本和獲益,并且作為開放領域,容易受到快速變化的外部環境的影響,從而具有嚴重的不確定性[1]。與此同時,公共衛生干預措施往往也具有復雜性,這是由于其有多個相互作用的部分、錯綜復雜的作用路徑、實施場景的難以預測等特性[2]。復雜系統中的各因素不是孤立的而是相互作用的,導致我們難以通過簡單的線性因果模型的研究方法去理解或者掌握其產生的效果方向和大小。此時,基于復雜系統模型(complex systems model,CSM)的分析與評價方法將可能是最優的選擇。經濟學評價是公共衛生干預措施研究全生命周期中的一個核心組成部分[3]。基于建模技術的經濟學評價能夠估計公共衛生投資產生的潛在價值,探索政策變化的增量效應和人口效應[4]。衛生經濟學評價通常需要基于較復雜的數學統計模型和相對完整的調查數據,因而對技術、人才、經費和時間的要求較高,這限制了其在中低等收入國家中的廣泛應用[5]。近年來,對在公共衛生領域中應用CSM進行討論的相關文獻逐漸增多,且有關學者號召應該更多地使用復雜系統方法進行公共衛生決策。然而,已發表的采用CSM進行經濟學評價的案例很少[6]。為了支持研究人員更好地應用CSM規劃和實施公共衛生干預措施經濟學評價項目,由40余位CSM和經濟學評價領域的專家組成的國際團隊制訂并于近期發布了應用CSM進行公共衛生干預措施經濟學評價的指南(以下簡稱“指南”)[7]。
為了給我國公共衛生干預措施的經濟學評價提供新思路和幫助國內研究人員更好地應用該指南,本文對該指南的制訂過程和主要內容(即CSM的定義、應用場景、類型選擇、建模的關鍵環節)進行解讀,并結合我國實際情況探討該指南在我國公共衛生干預措施經濟學評價中的應用前景,旨在為最終提高我國公共衛生研究和服務的整體質量和改善國民的健康水平做出貢獻。
1 指南的制訂過程
2020年9月至2021年3月研究人員邀請44位CSM和經濟學評價領域的專家參加兩期研討會以進行該指南的制訂,最終42位專家出席了研討會,36位參與了該指南的撰寫。研究人員首先開展了一項更新的概況性評價,納入了CSM的典型案例,并對建模方法進行了分類。基于該概況性評價的結果,2020年9月16日組織委員會召開了第一期研討會,主要包括3個目的:① 對CSM定義達成共識;② 編寫現有指南文件、案例研究和方法學指南的綜合清單;③ 對CSM指南達成共識。第二期研討會在2021年3月17日召開,主要包括4個目的:① 確定指南的目標與用戶;② 確定應用CSM的場景;③ 對模型類型達成共識;④ 確定技術指南與案例研究。
2 指南的主要內容
2.1 復雜系統模型的定義
面向公共衛生的CSM是具有動態(dynamic)、非線性(non-linearity)、反饋(feedback)和相互作用(interactions)等4個相互重疊關鍵特征的定量模型,它的目的是及時發現緊急結果(emergent outcomes)、預測健康、經濟學和其他潛在結果,為公共衛生政策制定提供依據(圖1)。由于上述關鍵特征會增加模型的復雜性,因此,為了幫助建模者更好地掌握CSM的應用,有必要明晰CSM的復雜性(complexity)和傳統概念上復雜化(complicated)的區別,例如,過多的建模要素和錯綜復雜的干預措施可能使模型變得復雜化,但卻不一定使模型具有復雜性[8]。目前常見的公共衛生CSM主要包括偏微分方程(partial differential equations,PDEs)、離散事件模擬(discrete event simulation,DES)、主體模擬(agent-based models,ABMs)、系統動力學(systems dynamics,SD)、可計算一般均衡模型(computable general equilibrium models,CGE)和混合模型(hybrid models)等[9-16]。

2.2 復雜系統建模的應用場景
公共衛生問題本身就是具有復雜性,因此復雜系統適用于解決公共衛生問題,過度簡化模型會降低模型的實用性,因此建模者需要了解復雜系統的行為模式、機制和過程以及干預措施與系統之間相互作用的關系,特別是將干預措施與結果聯系起來的復雜特性(圖2)。CSM尤其適用于對不同要素或水平(個體/匯總)進行多種公共衛生干預措施經濟學評價。然而,當可選擇其他建模方式實現相似的結果時,則不一定需要應用CSM。因此,建模者在建模過程中應考慮存在的實際限制,如模型類型、可獲得的數據和資源、利益相關者的偏好等,來選擇合適的建模類型[7]。

CSM很難獲取到充足的試驗數據來支持研究,因此需要使用一些假設來填補證據空白(即理論、數據、校準方面)。假設的合理性是至關重要的,因此研究人員理應找到科學的工具來驗證提出的假設。需要注意的是,模型理論和校準參數的增加,會加大其使用外部數據進行驗證的難度,導致時間的浪費、不透明度的增加和非必要風險的出現[17]。例如,過多的校準參數可能會導致數據的過度擬合[18]。此外,建模者還需要考慮數據缺失和復雜特性的存在可能會增加模型預測結果的不確定性。因為在這種情況下,多個輸入變量之間可能存在復雜的相互關系,并且初始輸入條件的微小變化也可能會導致截然不同的輸出結果。因此,建模者應該關注決策者的需求,權衡模型的簡化和復雜化程度,避免過于簡化或復雜化導致模型不適用于決策需求[7]。
2.3 復雜系統模型的類型選擇
2.3.1 模型類型的選擇
建模者在選擇合適的模型類型進行公共衛生干預措施經濟學評價時,應該與是否應用CSM的決定結合起來考慮,對決策問題、系統特征和數據進行類似的審查。雖然有一系列可用的CSM供建模者選擇,但是實際應用時應根據不同維度(即確定性/非確定性、靜態/動態、離散/連續、個體/匯總和數理邏輯/代數)來確定最終的模型類型[19]。修訂版的Brennan分類方法,見表1。

2.3.2 復雜系統模型的類型選擇
建模者通常使用SD和ABMs方法來解決復雜系統中出現的問題[20],SD采用聚合視角來整合系統中的各個部分或成分,并預測系統隨時間推移的變化。ABMs可被視為更為個體化的建模方法,重點考慮行為、異質性和主體之間的相互作用。然而,CSM的選擇范圍不僅限于上述兩種主流方法,還有其他類型的CSM可被應用。
公共衛生研究人員要開放思維,廣泛探索不同學科的研究成果,并將其融合到本領域的研究中,以更好地理解和解決公共衛生問題。例如,CGE模型和PDEs模型也可被用于公共衛生問題的復雜系統建模。CGE模型通過對經濟體系的各個細節參數進行建模,來分析政策決策對經濟整體的影響,包括稅收、消費、投資等關鍵因素[11]。而PDEs則通過數學方程描述傳染病在人群中的傳播規律,以及病毒等病原體的擴散速度和傳染率等變化[10]。這兩種模型和SD的相似之處在于,它們都著重于分析人群或經濟體系的聚合特性和動態變化。然而,在CSM中,可以將多種類型結合起來形成混合模型。雖然已有研究人員提出混合模型框架[21],但混合模型目前在公共衛生領域中應用依然很少[22-23]。
鑒于以上建模方法概念之間存在廣泛重疊,建模者應該根據問題的性質來選擇合適的CSM,而不是對某一公共衛生問題規定使用特定的模型類型。然而,在實際應用過程中,研究人員發現存在某種CSM被廣泛應用的聚類現象,這可能是由于受到研究學科、專業知識影響。例如,SD和CGE模型通常用于問題邊界較廣的領域,例如影響范圍超出公共服務的政策研究[11-12];ABMs可以幫助研究者更好地理解個體行為和社交網絡因素對公共衛生領域中飲酒、吸煙、飲食和體育活動等健康行為的影響[13-14];DES適用于醫療資源缺乏的健康問題,例如癌癥篩查和心理健康服務[9,16];個體水平模型更能夠準確地估計異質性的效應,并探討公平性影響。
2.4 復雜系統建模的關鍵環節
2.4.1 利益相關者的參與
在構建CSM的全過程中,建模者與利益相關者進行強有力的溝通至關重要,這可以確保模型輸出符合預期結果[24]。建模者不僅需要考慮到各領域利益相關者廣泛和多樣的觀念,還需要根據利益相關者對于復雜系統的理解的變化實時對模型進行調整。已有研究證明了利益相關者與建模者共同參與CSM的構建可以提高模型的透明度、增加對建模過程的理解和對模型及其輸出結果的認可度[25]。值得注意的是,在構建和實施CSM模型時,除了需要利益相關者的參與,建模者還應該與公眾代表進行互動和溝通[26]。
2.4.2 理解并確定問題
在構建CSM之前,需要對問題進行深入的研究和分析,并將這些研究分析的結果記錄下來,這對構建和驗證模型結構和類型至關重要[24]。隨著時間的推移,問題的理解會隨著新的證據、利益相關者的不同觀點以及系統變化而發生改變。因此,圖示化復雜系統對于理解問題是非常關鍵的,特別是在利益相關者持有不同觀點的情況下。系統圖譜(systems map)可以幫助建模者和利益相關者達成共識并制定協議,在公共衛生建模中有很多不同的方法和途徑可供選擇,常用的方法包括:群體概念映射、因果循環圖和軟系統方法。這些方法可以幫助建模者和利益相關者更好地理解系統的復雜性和之間的相互作用,并找到解決問題的最佳途徑[7]。
2.4.3 設置模型邊界
模型邊界(model boundary)是用于規定模型中應該包括的要素和變量,它的界定容易受到建模者的專業知識和偏好的影響,因此模型邊界的設定具有一定的主觀性。建模者在建模過程中需要遵循透明化的原則,應該詳細記錄和說明在理解問題時納入和排除每個組成部分的理由[24]。同時,還應該詳細描述系統中包含的各個要素和關鍵變量,以便更好地解釋模型結果和確定資源投資的優先級[27]。
2.4.4 引入數據和證據
衛生經濟模型通常是基于實證數據推導的流行病模型。然而,CSM可以基于觀察數據構建,或基于理論或者假設進行抽象構建。應用CSM評估衛生經濟政策時,通常需要大量的觀察數據和經驗認知來構建模型,并使用統計學技術來分析數據和評估政策的效果。因此,研究人員需要具備專業的方法學知識和技能來處理數據和構建模型。
當個體水平和系統某些部分的數據缺乏時,建模者需要使用數據合成技術來創建合成數據[13]。空間微觀模擬技術是將屬性豐富的微觀數據和代表性的宏觀數據相結合,形成一個新的數據集,對于CSM建模者合成數據具有重大的借鑒意義。空間微觀模擬技術是借助迭代比例擬合(iterative proportional fitting)和組合優化(combinatorial optimization)這兩種方法來處理數據。迭代比例擬合用于調整樣本數據的權重,使得樣本數據更好地反映人口普查或政府數據的特征。組合優化是一種合成和復制個體數據的技術,可以用于從宏觀數據中生成個體水平的數據,從而得到更加具體和詳細的微觀數據[7]。
雖然反饋回路作為CSM的一個關鍵特征,但是回路中模型參數由于其他變量的時依性混雜往往難以測量。在這種情況下,簡單的回歸方法不能確定因果效應,因為它提供的是暴露對結果的真實效應的有偏估計[28]。因此,如果資源和數據可獲取,建模者可以設計專門的統計分析方法。目標試驗模擬研究(simulation study of target test)作為一種新的研究框架,可通過模擬目標隨機對照試驗來幫助研究者在觀察性研究中確定暴露/干預與結果之間因果關系[29]。近年來該框架已被越來越多的研究人員用以解決相關研究問題。同時,國外學者開發了在線工具CERBOT,用以幫助研究人員開展目標試驗模擬研究。
校準(calibration)是一種迭代過程,即根據目前的模擬結果來調整模型參數,從而更準確地匹配觀測到的結果。模型校準包括貝葉斯校準和非貝葉斯校準兩類方法。其中,貝葉斯校準通過生成后驗分布來識別不確定性,由此進行概率敏感性分析,但計算時需耗費大量時間[30]。非貝葉斯校準目標則是找到一組校準參數,使模型能夠最好地復現校準目標。然而,頻率學校準方法作為一種非貝葉斯校準方法,容易出現過度擬合的問題,即研究人員過分相信模型參數的準確性,而沒有考慮到模型參數的不確定性[31]。無論使用何種校準方法,其都可能遇到參數識別性問題,即數據不足以校準所需參數。
2.4.5 計算效率
計算效率通常是指模型的運行速度以及所需要的計算資源。它決定建模者在何種情況下和如何使用模型輸出結果,是判斷CSM可行性和可靠性的重要因素之一。然而,在實際運用過程中,CSM往往會面臨計算能力的問題,尤其在微觀層面的模型。校準多種要素的模型通常需要昂貴的計算成本,這可能超出研究項目的資源上限。此時,建模者可以對模型邊界進行修改,在減少復雜性的同時需要保持模型的可操作性。目前,模型模擬和分布式模擬可以用來處理計算效率帶來的問題[7]。
2.4.6 模型的不確定性
敏感性分析和參數不確定分析可讓利益相關者知曉不確定性的來源。然而,在CSM分析不確定性具有一定挑戰。首先,分析不確定性可能受到計算能力和時間限制的影響;其次,建模者可能沒有完全理解不確定性的來源;最后,不確定性本身也可能會影響研究人員如何應用模型輸出結果[32]。除了參數的不確定性以外,模型本身的結構也可能是不確定性,目前最新的技術是利用機器學習方法來不斷地調整模型結構和參數,以適應實際需求和數據變化[33]。此外,證據權重法提出了一種評估不同證據的方法,并根據證據的可靠性和相關性決定其在決策過程中的權重,以確保使不同觀點并存[34]。建模者應該認識到模型只是真實世界的簡化,未知的變量和要素可能會影響模型的準確性和適用性,因此必須清晰地向用戶報告這些模型的局限性[7]。
2.4.7 模型驗證與確認
模型驗證(verification)是檢查模型編碼是否正確的過程。模型確認(validation)是測試模型是否能精確反映真實世界中發生的事件[7]。這兩個步驟都非常重要,因為它們可以確保模型的質量和可靠性,從而為決策者提供堅實的決策依據。建模者需要根據驗證分類、建議和驗證評估工具來實施驗證和確認,并結合可用的資源和數據來制定潛在的解決方案[35](表2)。

共同參與和模型透明度是確保模型有效性和可信度的重要手段。通過與專家和利益相關者的討論來測試表面效度和驗證模型,可以幫助建立決策者對模型的信任。在模型構建和應用的各個階段,建模者都應該進行迭代和多方面的驗證[9,12,15]。此外,模型透明度也非常重要,必須有詳細的文檔記錄,以便可以對其進行再現。采用“開源”模型可以進一步提高模型的可信度和可靠性,從而為決策者提供更好的決策依據[7]。
外部驗證和交叉驗證是兩種常見的驗證方法,用于比較模型輸出和實際觀測到的數據,驗證模型的準確性。具體來說,外部驗證是將CSM輸出與回顧性數據進行比較[9],交叉驗證是將CSM輸出與其他模型進行比較[16]。在公共衛生的背景下,外部驗證和校準的過程可能相互交織,難以區分,特別是在可用數據有限的情況下。此外,由于反饋回路中不同要素之間的關系可能隨著時間推移而發生變化,很難將CSM的輸出結果與未用于創建模型的真實世界數據進行比較。為了應對這些挑戰,建模者應該在個體水平和匯總水平進行驗證。在個體水平的驗證包括測試模型的每個部分是否準確地代表了真實世界,而匯總水平的驗證則確認是否再現了系統結果的突發動態[7]。
3 討論
隨著公共衛生問題日益受到人們的重視,公共衛生干預措施的經濟學評價也越來越重要。近年來,我國研究人員開始注重構建模型來進行經濟學評價,但仍然存在一定的問題,主要體現在構建的模型過于簡單而無法提供多個干預措施對比的綜合經濟學評價、未能考慮關鍵變量的不確定性[36]。因此,本研究對Health Economics期刊近期發布的指南進行了解讀,旨在促進我國建模者應用該指南開展相關研究,提高相關衛生經濟學評價研究的質量,以期最終提高我國公共衛生研究和服務的整體質量和改善國民的健康水平。
我國在系統科學理論和方法論的研究方面幾乎與國外同時起步,并且開創了以社會系統為主要研究對象所形成的復雜社會系統理論。但是系統理論對復雜系統建模尚停留在對系統的組成要素、結構和功能的理解,還未上升到使用統計學和數學模型來研究和應用復雜系統,且未形成規范的整體結構[37]。公共衛生問題在發生發展過程中常常受到多種復雜因素的影響,應用傳統分析方法處理復雜系統研究問題往往存在很大的局限性,國內多數研究尚停留在單因素、短期、個體和線性的研究水平[6]。CSM有助于幫助研究人員更深入理解和分析復雜系統中各要素變化及相互作用。該指南建議,當有涉及動態、反饋回路、非線性和相互作用的特性時,需要應用CSM。我們認為該指南能夠為剛進入這一領域和已經參與開發此類模型的研究人員提供快速學習的路徑,可以幫助相關研究人員更好地理解和應用CSM解決公共衛生領域中的復雜問題,進而對公共衛生系統中政策制訂和決策實施產生重要影響。健康中國發展戰略及行動任務突出強調要倡導多元主體的共同參與,這與CSM中要求利益相關者與公眾代表共同參與模型構建的觀點相一致,以建立起以“疾病預防”和“健康促進”為核心的公共衛生體系[38]。因此,為了更好地解決我國公共衛生領域面臨的復雜問題,應加強CSM在我國公共衛生領域中的應用,并結合實際探索CSM方法學的最佳實踐,制訂具有本土特色、符合我國實際情況的CSM方法學指南。衛生經濟學評價是公共衛生干預措施評價過程中一項復雜而重要的環節,研究者應謹慎地選擇評價模型,同時考慮其在真實世界中的合理性和公平性。在我國,應用CSM進行公共衛生干預措施的經濟評價尚處于探索階段,相關文獻數量較少。目前,我國學者在進行公共衛生干預措施經濟學評價時,往往選擇CSM的單一類型且應用在公共衛生某一特定領域,往往難以應對日益復雜的公共衛生問題[6]。根據指南中CSM的建議模型類型,應根據問題性質,選用混合復雜模型來解決公共衛生問題。因此,為了更好地解決我國公共衛生領域面臨的復雜問題,應加強CSM在我國公共衛生領域中的應用,并結合實際探索應用CSM開展公共衛生干預措施經濟學評價的最佳方法學實踐,制訂具有本土特色、符合我國實際情況的CSM方法學應用指南。
綜上所述,本文對應用CSM對公共衛生干預措施進行經濟學評價指南的主要內容進行了解讀,并結合我國實際情況探討了該指南在我國公共衛生干預措施經濟學評價中的應用前景,旨在為最終提高我國公共衛生研究和服務的整體質量和改善國民的健康水平做出貢獻。考慮到我國與西方公共衛生政策體系機制不同,及實施主體和文化的差異,建議我國研究者和決策者在應用該指南時應結合我國國情,同時考慮制訂具有中國特色的應用CSM進行公共衛生干預措施經濟學評價的指南。