循證醫學的誕生和發展進一步促進了臨床決策的規范化,循證臨床實踐意味著醫生專業知識、最佳研究證據和患者價值觀三者的結合。臨床流行病學知識是開展循證臨床實踐的基礎[1],臨床流行病學的基本原理、研究設計、數據管理和統計分析、臨床實踐指南等知識提供了科學的研究方法和證據,可以指導醫生的臨床決策,提高醫療實踐的質量和安全性。臨床流行病學在確定疾病的風險因素、制定診斷標準、評估治療結果和了解疾病進展和預后等方面發揮著關鍵作用。因此,合理有效地評估醫生的臨床流行病學知識有助于其學習和實踐循證醫學[2]。
臨床流行病知識量表(Utrecht questionnaire on knowledge on clinical epidemiology for evidence-based practice,U-CEP)由烏得勒支大學的Kortekaas等學者開發[3],量表的內容涉及提出臨床問題、評價研究證據和將證據應用于實踐,是第一個涵蓋了疾病的診斷、病因、治療和預后全部關鍵問題的臨床流行病知識評估量表。盡管已經有了一些其他臨床實踐相關的知識測量工具,但存在與臨床相關性不好、題目設計形式單一、使用耗時較多、僅評估疾病的治療等現實問題[4-6],相比之下,U-CEP的突出優勢在于它重視臨床流行病學知識在實踐中的實用性及其出色的測量性能。U-CEP量表原版為荷蘭語,目前量表的英文版信效度已經得到驗證[3],知識水平在不同醫生、培訓前后的差異可以通過得分的高低反映出來,可應用于臨床醫生教育培訓效果的評價[7]。在數百種工具中,U-CEP量表是評估循證臨床實踐知識的高質量工具之一[8-9],廣泛應用于臨床流行病學知識調查[10]、教育培訓,并用于評估培訓的效果。U-CEP較為新穎,有著概括性強、綜合性高且簡便易用的特點。但目前尚無通用的中文版U-CEP量表。因此,本研究致力于對英文版U-CEP量表進行漢化并開展信效度驗證,以期為我國臨床流行病學和循證醫學的教育教學效果提供相應的評估工具,提高臨床工作者的循證臨床實踐能力,改善臨床決策的質量和安全性。
1 資料與方法
1.1 技術路線
技術路線圖見圖1。

1.2 研究對象
本研究的研究對象為全國各地區臨床醫生及臨床醫學生,研究對象的選取方法為方便抽樣,調查方式為網絡在線調查。研究對象的納入標準為:① 有良好的閱讀和理解能力,與研究者溝通無障礙;② 自愿參與本研究調查,通過知情同意。Costello等[11]的研究指出探索性因子分析的樣本量應不少于量表條目的10倍,本研究按照量表條目與研究對象1∶10的比例確定樣本量,U-CEP量表共25個條目,所需樣本量為250人。同時考慮20%的問卷不合格率,本研究預期納入最小樣本量為313例。本研究實施過程中在確保樣本量滿足標準的基礎上,盡可能多納入合格的研究樣本。本研究已通過北京大學第三醫院倫理委員會審核批準(審批號:LM2023324)。
1.3 研究方法與工具
1.3.1 一般資料調查表
由2位研究者設計研究對象的一般資料調查表,其內容包括調查對象的性別、年齡、最高學歷、工作單位級別、所在科室分類、執業類別、職稱、臨床工作年限、是否系統學習過流行病學、衛生統計學、循證醫學、臨床流行病學等相關信息。
1.3.2 U-CEP量表漢化過程
依據經典Brislin翻譯模型[12]進行量表的翻譯、回譯和文化調適。英文版U-CEP量表包括兩個獨立的條目集(Set A和Set B),兩個版本各設置了25個條目來測量調查對象的臨床流行病學知識掌握程度。① 量表翻譯:由2名精通英語,且母語為漢語的碩士研究生獨立完成英文版U-CEP進行量表條目、各條目選項及評分規則的翻譯,形成U-CEP量表中文譯版T1和T2,再經2位臨床流行學專家討論與調整后初步形成量表的中文版T;② 量表回譯:選取2位有較好雙語背景且未接觸過原量表的臨床醫生獨立將T回譯成英文,形成回譯版本B1和B2,臨床流行病學專家對2份回譯本進行對比和調整,形成回譯稿B;③ 調適:由2位臨床流行病學專家、1位臨床專家、4位譯者組成研究小組,經研究小組對比、分析T和B的差異后,對B進行再次修改,同時結合我國的文化背景進行語言的調整,最終達成一致意見形成之中文版U-CEP量表。
1.3.3 中文版U-CEP量表
該量表包含25個條目,內容涉及疾病的臨床診斷(diagnosis)、病因(etiology)、預后(prognosis)、治療(therapy)4個層面(DEPth)的知識,條目設置了19個單選題和2個計算題,每題1分,4個問答題,每題3分,滿分33分,得分越高,臨床流行病學知識掌握程度越好,見表1。

1.3.4 調查方法
1.3.4.1 預調查
采取方便抽樣法抽取北京大學第三醫院30人,使用中文版U-CEP量表開展預調查,評估填寫問卷的用時是否合理,收集調查對象對問卷內容等的疑問或建議,分析預調查過程中出現的問題,并擬定相應的解決措施,總結在調查實施過程中的注意事項。
1.3.4.2 資料收集
正式調查時,由研究對象獨立填寫問卷并提交;在醫學生中測量復本信度時的紙質問卷均當場回收。研究者在數據錄入的過程中進行問卷填寫的邏輯核查,評估問卷填寫是否完整、真實、可靠,排除重要信息缺失或明顯未認真填寫的問卷。研究者與需要重測的研究對象保持聯系,在次日或隔日組織調查對象再次填寫問卷,用以評價中文版臨床流行病學知識量表的重測信度。
1.3.5 項目分析
① 條目分析法:計算各條目回答正確/滿分的研究對象比例,反映量表各條目得分的集中趨勢,各個條目的正確率高于10%且低于90%時認為條目較為可靠,不存在明顯偏態;② 條目區分度檢驗:采用臨界比值法[13],將量表按照總得分從大到小排序,前27%位和后27%位的得分作為臨界分數,得分高于前27%位者為高分組,得分低于后27%者為低分組,采用獨立樣本t檢驗計算各條目的臨界比值(critical ration,CR),比較各條目得分在兩組間的差異;③ 條目-總分相關(item-total correlation,ITC):ITC的值是采用Pearson相關系數法計算得到的各條目得分與總得分的相關系數,ITC表示條目與總量表測量的一致性[14]。當ITC<0.15時,認為該條目與總量表的相關性低;當0.15≤ITC<0.2時,條目與量表中度相關;當0.20≤ITC<0.40時,條目與量表相關度好;當ITC≥0.40時,條目與量表相關度很好。
1.3.6 信度檢驗
① 內部一致性信度:采用整體Cronbach's α系數反映量表各條目之間的同質性。當Cronbach's α系數>0.7時,認為量表具有較高的內部一致性信度。同時計算逐項剔除各條目后的Cronbach's α系數,當剔除某一條目后整體的Cronbach's α系數有較大提升時,認為該條目與量表其他條目不同。② 重測信度:采用方便抽樣的方法選取17位研究對象再次測量,與第一次測量間隔1~2天,采用Pearson相關法計算同一組研究對象兩次測量總得分的相關系數。重測信度反映該量表測量結果的穩定程度。③ 復本信度:使用U-CEP量表的另一個版本B作為版本A的復本,由北京大學第三醫院臨床醫學生同時填寫U-CEP的2個版本,由1位臨床流行病學專業人員評分,計算同一組調查對象兩版本量表總得分的Pearson相關系數,≥0.7時認為量表的復本信度較好。
1.3.7 效度檢驗
① 內容效度:采用專家評定法評價中文版U-CEP的內容效度。選取12位來自公共衛生與預防醫學的專家參與評價,其研究方向包括臨床流行病學方向、流行病與衛生統計學其他方向和循證醫學方向。每個條目采用Likert 4級評分法[15],不相關、弱相關、較強相關、非常相關分別賦值1~4分,計算條目內容效度(item-content validity index,I-CVI)、量表水平的內容效度指數(scale-content validity index,S-CVI),其中S-CVI分為全體一致S-CVI(S-CVI/UA)和平均S-CVI(S-CVI/Ave)、隨機一致性概率(Pc)、校正概率K*。I-CVI=給出評分為3分或4分的專家人數/專家總數,S-CVI/UA=所有專家評分為3分或4分的條目數/總條目數,S-CVI/Ave=所有條目I-CVI的平均值,Pc=[n!/A!(n-A)!]×0.5n(式中n為評價專家數,A為評分為3分或4分的專家數),K*=(I-CVI-Pc)/(1-Pc)。專家人數不少于6人時,I-CVI≥0.78[16]、S-CVI/UA≥0.80[17],S-CVI/Ave≥0.90[18]時認為量表內容信度較優。K*的評價標準是:0.40~0.59為一般,0.60~0.74為良好,>0.74為優秀[19]。當不足15%的研究對象得滿分或零分時,認為該量表能夠監測到調查對象知識的提升或退化,不存在天花板效應和地板效應[20]。② 結構效度:進行探索性因子分析,提取特征根>1的公因子,要求公因子累積方程貢獻率>50%。我們認為系統學習過流行病學、衛生統計學、循證醫學、臨床流行病學等相關知識的調查對象的得分應高于沒有系統學習過的調查對象,比較兩組得分的差異,差異有統計學意義時認為量表有較好的結構效度。③ 已知族群效度:比較在不同年齡、學歷、工作單位級別、科室、專業類別、職稱、臨床工作年限、相關知識學習情況下,臨床醫生的得分情況,若差異有統計學意義,則表明中文版U-CEP具有區分不同特征臨床醫生的臨床流行病知識水平的功效[19]。
1.4 統計分析
采用SPSS 26.0軟件進行統計分析。符合正態分布的計量資料使用表示,計數資料使用頻數和百分位數表示。兩組間得分的比較使用獨立樣本t檢驗,三組及以上的組間比較采用單因素方差分析。檢驗水準設為α=0.05(雙側)。
2 結果
2.1 預調查結果
參與預調查的醫生均能在20~40分鐘內完成問卷填寫,且認為不存在難以理解的條目,由此形成中文版U-CEP量表測試版。
2.2 調查對象的一般資料
共發放問卷451份,有效問卷414份,問卷回收有效率91.8%。在414位調查對象中,女性有220人(53.1%),年齡>30歲的有217人(52.4%),243人為碩士學歷(58.7%),81人為博士學歷(19.6%)。調查對象中三甲醫院醫生有241人(58.2%),工作科室為內科系統的醫生有121人(29.2%),外科系統55人(13.3%);執業類別為西醫類的醫生有202人(48.8%),中醫類12人(2.9%),中西醫結合4人(1.0%)。中級職稱醫生121人(29.2%),高級職稱68人(16.4%);工作年限超過10年的有111人(26.8%);78.3%的醫生系統學習過流行病學、衛生統計學、循證醫學、臨床流行病學等相關知識(表4)。


2.3 量表信效度檢驗結果
2.3.1 項目分析結果
量表各條目回答的正確率為24.4%~89.4%。量表各條目正確率的平均數為58.1%,其中,條目3正確率最高,為89.4%,條目8正確率最低,為24.4%。比較414份量表的前27%(>17分)與后27%(<12分)各條目得分的組間差異發現,各條目的決斷值范圍為1.163~21.832,除了條目4(CR=1.163,P=0.246)外,其余條目均達到統計學顯著水平(P<0.05)。U-CEP各條目ITC范圍為0.053~0.626,有5個條目的ITC<0.15(20%),2個條目ITC≥0.15~0.20(8%),6個條目ITC≥0.20~0.40(24%),12個條目ITC≥0.40(48%),除條目4(ITC=0.053,P=0.283)外,其余條目P值均<0.05。
2.3.2 信度分析結果
中文版U-CEP整體的Cronbach's α系數為0.80。逐一刪除條目后,量表的Cronbach's α系數均無明顯增加(表2)。對17位醫生間隔1~2天進行重測,兩次得分的Pearson相關系數為0.848(P<0.001)。使用U-CEP量表條目集B(Set B)作為中文版U-CEP(即Set A)的復本,由18位臨床醫學生同時填寫U-CEP的2個版本,由1位臨床流行病學專業人員評分,兩條目集總得分的Pearson相關系數為0.838(P<0.001)。

2.3.3 效度分析結果
2.3.3.1 內容效度
12位受訪專家均表示中文版U-CEP量表題目表達清晰易懂、無歧義,評分明細如下(表3)。量表各條目的I-CVI范圍為0.917~1.000,S-CVI/UA=0.760,S-CVI/Ave=0.980,Pc為0.000 24~0.002 93,K*為0.916~1.000,見表3。414位臨床醫生的量表總得分為(14.36±3.92),最高得分23分,最低得分5分,得滿分或零分的調查對象比例為0%,未發現天花板效應和地板效應。

2.3.3.2 結構效度
探索性因子分析結果顯示,量表條目的累積方差貢獻率為57.50%。系統學習過相關知識的調查對象的平均得分為14.84[95%CI(14.42,15.26)],沒有經過系統學習者平均得分為12.64[95%CI(11.88,13.41)],兩組間差異有統計學意義(P<0.001)。表明該量表的結構效度較好。
2.3.3.3 已知族群效度
已知族群效度分析結果顯示,不同學歷(P=0.016)、有無系統學習過相關知識(P<0.001)的臨床醫生U-CEP量表總得分比較,差異有統計學意義;不同性別、年齡、工作單位級別、科室、專業、職稱、工作年限的臨床醫生比較,差異沒有統計學意義(P>0.05)。見表4。
3 討論
很多研究證據并不都能順利地轉化為臨床實踐,醫生是臨床診療的重要參與者,掌握臨床流行病學知識是循證臨床實踐的重要基礎。U-CEP量表注重考察臨床密切相關的診斷、病因、治療和預后知識,有很強的綜合性,與其他測量臨床實踐相關知識的量表相比,U-CEP更加便捷省時,利于推廣使用。例如,Berlin量表[6]注重考察計算和生物統計學的解釋,耗時較多;Fresno量表[5]僅設置了開放性問題;ACE量表[4]僅涉及治療性研究。教育和培訓是促進循證臨床實踐的重要措施,有必要監測培訓前后知識掌握程度的動態變化,U-CEP量表的本土化能夠為我國臨床醫生臨床流行病學培訓效果的評價提供可靠的測量工具。本研究量表的漢化基于Brislin翻譯模型,過程規范;研究小組包括多名臨床醫生、臨床流行病學專家、統計學專家,并開展預調查,保證了中文版U-CEP量表的科學性。
Kortekaas等[3]使用英文版U-CEP量表測量全科醫生(general practitioner,GP)的臨床流行病學知識,研究發現,接受培訓前,醫生得分為(14.4±6.9),得分為滿分(33分)的43.6%,3年培訓結束后得分為(24.9±4.7),臨床流行病學知識得到顯著提升;另一相似的研究[7]發現,接受GP培訓后醫生的得分為29.5[95%CI(28.0,31.0)],得分為滿分(50分)的59.0%。本研究中,我國414位臨床醫生平均得分為(14.36±3.92),年齡≤30歲的醫生得分為(14.59±4.06),平均得分約為滿分(33分)的44.2%,得分較低,可能原因是我國對于臨床醫生的相關教育不足。本研究中,由研究對象自報是否“系統學習過相關知識(累計學習時間>10小時)”,“系統學習過”相關知識的醫生占比78.3%,有進一步提高的可能,提示我國臨床醫生存在相關教育和培訓的需求。“系統學習過”相關知識的醫生得分為14.84,得分較低,盡管得分與“未系統學習”者之間存在統計學差異,但得分的絕對值差異較小,原因可能是10小時間斷學習的效果有限,而Kortekaas等學者為醫生定制了臨床流行病知識的教育方案,教育時間也較長(1~3年)。這也提示我們完善臨床流行病學教育模式,設計更加貼近醫生的教育方案,將教育要融入醫生的日常工作,在不增加診療負擔的前提下提高醫生整體的臨床流行病學知識。僅有少數條目的與總量表的相關性低、區分度低,量表整體有較好的內部一致性和對調查對象的區分度。條目4“病因學研究是研究因果關系的嗎?請選擇最合適的答案”得分與總得分沒有明顯的相關性,正確率較高(82.37%),且不能有效區分高分組和低分組,原因可能是該題目的設計較為簡單,不能有效測量研究對象的臨床流行病學知識水平,在未來的量表修正中需要對其進行重點修改。條目8“以下表述是否正確:混雜(偏倚)會在診斷性研究中起作用。”正確率為24.40%,正確率較低,與總量表的相關系數相關性較低,未來量表改良時可以重點關注該條目。
本研究結果顯示,中文版U-CEP量表的Cronbach's α系數為0.80,逐項刪除條目后的Cronbach's α系數沒有明顯升高,具有較高的內部一致性信度;重測信度和復本信度良好,可以認為測量的結果較為穩定,可以考慮在國內推廣使用。
本研究中,我國414位臨床醫生的最高分為23分,最低分5分,沒有天花板效應和地板效應,可以認為中文版U-CEP量表內容效度良好,能夠動態測量醫生的臨床流行病學知識水平,可以用于動態評估我國循證臨床實踐相關教育培訓的效果。已知族群效度分析的結果提示,中文版U-CEP能夠區分不同學歷及是否系統學習過相關知識的人群,顯示出較好的效度。不同工作單位級別、職稱、工作年限、專業類別、科室的醫生之間未表現出明顯的得分差異,原因可能有兩種。其一,U-CEP題目設置偏難,所測量的知識與臨床診療之間沒有密切的相關關系,臨床流行病知識并不隨著臨床經驗的積累而增加。對此,有望在此量表的基礎上進行優化,結合臨床工作實況及臨床流行病知識設計一些與臨床決策更為相關的題目,研制更加符合我國臨床現況的相關量表。其二,臨床工作缺乏循證醫學氛圍,醫療機構并沒有給予醫生足夠的教育和培訓支持,醫生自主學習臨床流行病學知識的動力和時間有限,研究認為,醫療機構、社會環境、醫生本身三個層面都影響著醫生的循證醫學知識和循證臨床實踐行為[21-23]。這提示通過多種途徑提升醫生循證臨床實踐能力的可能性。國內外學者為提高臨床醫生循證臨床實踐能力作出了許多探索[24-26],使用印刷資料、社交媒體等增加相關知識在線上線下的可及性、營造醫療專業人員之間積極學習與交流的氛圍、增加同伴支持、提高醫生學習的動機等均被證實為較為有效的干預途徑。對此,我們可以對醫生開展半結構化訪談了解醫生學習上的阻礙,制訂有針對性的應對措施,開展教育等多種方式、多個層面的綜合干預。
本研究存在一定的局限性:① U-CEP是評估醫生臨床流行病學知識的有效工具,但醫生對知識的掌握能夠在多大程度上指導臨床實踐尚不能明確得知,未來需要相關研究證實。② 本研究的樣本量為414例,樣本量較小,我們采用Cronbach's α系數法進行了該樣本量條件下的事后把握度分析,估算所得的把握度為0.996,尚可,但由于本研究使用方便抽樣開展網絡調查,研究對象的地區、工作單位級別等特征的分布可能存在偏頗,量表得分情況不具有廣泛的代表性。③ 本研究僅僅開展了橫斷面調查,未能驗證中文版U-CEP動態測量醫生臨床流行病學知識變化的有效性。
綜上所述,中文版U-CEP量表有良好的信效度,且有著良好的文化適配性,能夠有效評估醫生的臨床流行病學知識。未來,中文版U-CEP的動態測量作用需要在試驗中得到驗證;我們期望中文版U-CEP能夠應用在臨床醫學教育、醫生的培訓考核等過程中,產生更多的研究證據,探索與改良該工具的不足之處,助力祖國臨床流行病學教育,營造良好的臨床循證醫學環境。
聲明 本研究不存在任何利益沖突。
循證醫學的誕生和發展進一步促進了臨床決策的規范化,循證臨床實踐意味著醫生專業知識、最佳研究證據和患者價值觀三者的結合。臨床流行病學知識是開展循證臨床實踐的基礎[1],臨床流行病學的基本原理、研究設計、數據管理和統計分析、臨床實踐指南等知識提供了科學的研究方法和證據,可以指導醫生的臨床決策,提高醫療實踐的質量和安全性。臨床流行病學在確定疾病的風險因素、制定診斷標準、評估治療結果和了解疾病進展和預后等方面發揮著關鍵作用。因此,合理有效地評估醫生的臨床流行病學知識有助于其學習和實踐循證醫學[2]。
臨床流行病知識量表(Utrecht questionnaire on knowledge on clinical epidemiology for evidence-based practice,U-CEP)由烏得勒支大學的Kortekaas等學者開發[3],量表的內容涉及提出臨床問題、評價研究證據和將證據應用于實踐,是第一個涵蓋了疾病的診斷、病因、治療和預后全部關鍵問題的臨床流行病知識評估量表。盡管已經有了一些其他臨床實踐相關的知識測量工具,但存在與臨床相關性不好、題目設計形式單一、使用耗時較多、僅評估疾病的治療等現實問題[4-6],相比之下,U-CEP的突出優勢在于它重視臨床流行病學知識在實踐中的實用性及其出色的測量性能。U-CEP量表原版為荷蘭語,目前量表的英文版信效度已經得到驗證[3],知識水平在不同醫生、培訓前后的差異可以通過得分的高低反映出來,可應用于臨床醫生教育培訓效果的評價[7]。在數百種工具中,U-CEP量表是評估循證臨床實踐知識的高質量工具之一[8-9],廣泛應用于臨床流行病學知識調查[10]、教育培訓,并用于評估培訓的效果。U-CEP較為新穎,有著概括性強、綜合性高且簡便易用的特點。但目前尚無通用的中文版U-CEP量表。因此,本研究致力于對英文版U-CEP量表進行漢化并開展信效度驗證,以期為我國臨床流行病學和循證醫學的教育教學效果提供相應的評估工具,提高臨床工作者的循證臨床實踐能力,改善臨床決策的質量和安全性。
1 資料與方法
1.1 技術路線
技術路線圖見圖1。

1.2 研究對象
本研究的研究對象為全國各地區臨床醫生及臨床醫學生,研究對象的選取方法為方便抽樣,調查方式為網絡在線調查。研究對象的納入標準為:① 有良好的閱讀和理解能力,與研究者溝通無障礙;② 自愿參與本研究調查,通過知情同意。Costello等[11]的研究指出探索性因子分析的樣本量應不少于量表條目的10倍,本研究按照量表條目與研究對象1∶10的比例確定樣本量,U-CEP量表共25個條目,所需樣本量為250人。同時考慮20%的問卷不合格率,本研究預期納入最小樣本量為313例。本研究實施過程中在確保樣本量滿足標準的基礎上,盡可能多納入合格的研究樣本。本研究已通過北京大學第三醫院倫理委員會審核批準(審批號:LM2023324)。
1.3 研究方法與工具
1.3.1 一般資料調查表
由2位研究者設計研究對象的一般資料調查表,其內容包括調查對象的性別、年齡、最高學歷、工作單位級別、所在科室分類、執業類別、職稱、臨床工作年限、是否系統學習過流行病學、衛生統計學、循證醫學、臨床流行病學等相關信息。
1.3.2 U-CEP量表漢化過程
依據經典Brislin翻譯模型[12]進行量表的翻譯、回譯和文化調適。英文版U-CEP量表包括兩個獨立的條目集(Set A和Set B),兩個版本各設置了25個條目來測量調查對象的臨床流行病學知識掌握程度。① 量表翻譯:由2名精通英語,且母語為漢語的碩士研究生獨立完成英文版U-CEP進行量表條目、各條目選項及評分規則的翻譯,形成U-CEP量表中文譯版T1和T2,再經2位臨床流行學專家討論與調整后初步形成量表的中文版T;② 量表回譯:選取2位有較好雙語背景且未接觸過原量表的臨床醫生獨立將T回譯成英文,形成回譯版本B1和B2,臨床流行病學專家對2份回譯本進行對比和調整,形成回譯稿B;③ 調適:由2位臨床流行病學專家、1位臨床專家、4位譯者組成研究小組,經研究小組對比、分析T和B的差異后,對B進行再次修改,同時結合我國的文化背景進行語言的調整,最終達成一致意見形成之中文版U-CEP量表。
1.3.3 中文版U-CEP量表
該量表包含25個條目,內容涉及疾病的臨床診斷(diagnosis)、病因(etiology)、預后(prognosis)、治療(therapy)4個層面(DEPth)的知識,條目設置了19個單選題和2個計算題,每題1分,4個問答題,每題3分,滿分33分,得分越高,臨床流行病學知識掌握程度越好,見表1。

1.3.4 調查方法
1.3.4.1 預調查
采取方便抽樣法抽取北京大學第三醫院30人,使用中文版U-CEP量表開展預調查,評估填寫問卷的用時是否合理,收集調查對象對問卷內容等的疑問或建議,分析預調查過程中出現的問題,并擬定相應的解決措施,總結在調查實施過程中的注意事項。
1.3.4.2 資料收集
正式調查時,由研究對象獨立填寫問卷并提交;在醫學生中測量復本信度時的紙質問卷均當場回收。研究者在數據錄入的過程中進行問卷填寫的邏輯核查,評估問卷填寫是否完整、真實、可靠,排除重要信息缺失或明顯未認真填寫的問卷。研究者與需要重測的研究對象保持聯系,在次日或隔日組織調查對象再次填寫問卷,用以評價中文版臨床流行病學知識量表的重測信度。
1.3.5 項目分析
① 條目分析法:計算各條目回答正確/滿分的研究對象比例,反映量表各條目得分的集中趨勢,各個條目的正確率高于10%且低于90%時認為條目較為可靠,不存在明顯偏態;② 條目區分度檢驗:采用臨界比值法[13],將量表按照總得分從大到小排序,前27%位和后27%位的得分作為臨界分數,得分高于前27%位者為高分組,得分低于后27%者為低分組,采用獨立樣本t檢驗計算各條目的臨界比值(critical ration,CR),比較各條目得分在兩組間的差異;③ 條目-總分相關(item-total correlation,ITC):ITC的值是采用Pearson相關系數法計算得到的各條目得分與總得分的相關系數,ITC表示條目與總量表測量的一致性[14]。當ITC<0.15時,認為該條目與總量表的相關性低;當0.15≤ITC<0.2時,條目與量表中度相關;當0.20≤ITC<0.40時,條目與量表相關度好;當ITC≥0.40時,條目與量表相關度很好。
1.3.6 信度檢驗
① 內部一致性信度:采用整體Cronbach's α系數反映量表各條目之間的同質性。當Cronbach's α系數>0.7時,認為量表具有較高的內部一致性信度。同時計算逐項剔除各條目后的Cronbach's α系數,當剔除某一條目后整體的Cronbach's α系數有較大提升時,認為該條目與量表其他條目不同。② 重測信度:采用方便抽樣的方法選取17位研究對象再次測量,與第一次測量間隔1~2天,采用Pearson相關法計算同一組研究對象兩次測量總得分的相關系數。重測信度反映該量表測量結果的穩定程度。③ 復本信度:使用U-CEP量表的另一個版本B作為版本A的復本,由北京大學第三醫院臨床醫學生同時填寫U-CEP的2個版本,由1位臨床流行病學專業人員評分,計算同一組調查對象兩版本量表總得分的Pearson相關系數,≥0.7時認為量表的復本信度較好。
1.3.7 效度檢驗
① 內容效度:采用專家評定法評價中文版U-CEP的內容效度。選取12位來自公共衛生與預防醫學的專家參與評價,其研究方向包括臨床流行病學方向、流行病與衛生統計學其他方向和循證醫學方向。每個條目采用Likert 4級評分法[15],不相關、弱相關、較強相關、非常相關分別賦值1~4分,計算條目內容效度(item-content validity index,I-CVI)、量表水平的內容效度指數(scale-content validity index,S-CVI),其中S-CVI分為全體一致S-CVI(S-CVI/UA)和平均S-CVI(S-CVI/Ave)、隨機一致性概率(Pc)、校正概率K*。I-CVI=給出評分為3分或4分的專家人數/專家總數,S-CVI/UA=所有專家評分為3分或4分的條目數/總條目數,S-CVI/Ave=所有條目I-CVI的平均值,Pc=[n!/A!(n-A)!]×0.5n(式中n為評價專家數,A為評分為3分或4分的專家數),K*=(I-CVI-Pc)/(1-Pc)。專家人數不少于6人時,I-CVI≥0.78[16]、S-CVI/UA≥0.80[17],S-CVI/Ave≥0.90[18]時認為量表內容信度較優。K*的評價標準是:0.40~0.59為一般,0.60~0.74為良好,>0.74為優秀[19]。當不足15%的研究對象得滿分或零分時,認為該量表能夠監測到調查對象知識的提升或退化,不存在天花板效應和地板效應[20]。② 結構效度:進行探索性因子分析,提取特征根>1的公因子,要求公因子累積方程貢獻率>50%。我們認為系統學習過流行病學、衛生統計學、循證醫學、臨床流行病學等相關知識的調查對象的得分應高于沒有系統學習過的調查對象,比較兩組得分的差異,差異有統計學意義時認為量表有較好的結構效度。③ 已知族群效度:比較在不同年齡、學歷、工作單位級別、科室、專業類別、職稱、臨床工作年限、相關知識學習情況下,臨床醫生的得分情況,若差異有統計學意義,則表明中文版U-CEP具有區分不同特征臨床醫生的臨床流行病知識水平的功效[19]。
1.4 統計分析
采用SPSS 26.0軟件進行統計分析。符合正態分布的計量資料使用表示,計數資料使用頻數和百分位數表示。兩組間得分的比較使用獨立樣本t檢驗,三組及以上的組間比較采用單因素方差分析。檢驗水準設為α=0.05(雙側)。
2 結果
2.1 預調查結果
參與預調查的醫生均能在20~40分鐘內完成問卷填寫,且認為不存在難以理解的條目,由此形成中文版U-CEP量表測試版。
2.2 調查對象的一般資料
共發放問卷451份,有效問卷414份,問卷回收有效率91.8%。在414位調查對象中,女性有220人(53.1%),年齡>30歲的有217人(52.4%),243人為碩士學歷(58.7%),81人為博士學歷(19.6%)。調查對象中三甲醫院醫生有241人(58.2%),工作科室為內科系統的醫生有121人(29.2%),外科系統55人(13.3%);執業類別為西醫類的醫生有202人(48.8%),中醫類12人(2.9%),中西醫結合4人(1.0%)。中級職稱醫生121人(29.2%),高級職稱68人(16.4%);工作年限超過10年的有111人(26.8%);78.3%的醫生系統學習過流行病學、衛生統計學、循證醫學、臨床流行病學等相關知識(表4)。


2.3 量表信效度檢驗結果
2.3.1 項目分析結果
量表各條目回答的正確率為24.4%~89.4%。量表各條目正確率的平均數為58.1%,其中,條目3正確率最高,為89.4%,條目8正確率最低,為24.4%。比較414份量表的前27%(>17分)與后27%(<12分)各條目得分的組間差異發現,各條目的決斷值范圍為1.163~21.832,除了條目4(CR=1.163,P=0.246)外,其余條目均達到統計學顯著水平(P<0.05)。U-CEP各條目ITC范圍為0.053~0.626,有5個條目的ITC<0.15(20%),2個條目ITC≥0.15~0.20(8%),6個條目ITC≥0.20~0.40(24%),12個條目ITC≥0.40(48%),除條目4(ITC=0.053,P=0.283)外,其余條目P值均<0.05。
2.3.2 信度分析結果
中文版U-CEP整體的Cronbach's α系數為0.80。逐一刪除條目后,量表的Cronbach's α系數均無明顯增加(表2)。對17位醫生間隔1~2天進行重測,兩次得分的Pearson相關系數為0.848(P<0.001)。使用U-CEP量表條目集B(Set B)作為中文版U-CEP(即Set A)的復本,由18位臨床醫學生同時填寫U-CEP的2個版本,由1位臨床流行病學專業人員評分,兩條目集總得分的Pearson相關系數為0.838(P<0.001)。

2.3.3 效度分析結果
2.3.3.1 內容效度
12位受訪專家均表示中文版U-CEP量表題目表達清晰易懂、無歧義,評分明細如下(表3)。量表各條目的I-CVI范圍為0.917~1.000,S-CVI/UA=0.760,S-CVI/Ave=0.980,Pc為0.000 24~0.002 93,K*為0.916~1.000,見表3。414位臨床醫生的量表總得分為(14.36±3.92),最高得分23分,最低得分5分,得滿分或零分的調查對象比例為0%,未發現天花板效應和地板效應。

2.3.3.2 結構效度
探索性因子分析結果顯示,量表條目的累積方差貢獻率為57.50%。系統學習過相關知識的調查對象的平均得分為14.84[95%CI(14.42,15.26)],沒有經過系統學習者平均得分為12.64[95%CI(11.88,13.41)],兩組間差異有統計學意義(P<0.001)。表明該量表的結構效度較好。
2.3.3.3 已知族群效度
已知族群效度分析結果顯示,不同學歷(P=0.016)、有無系統學習過相關知識(P<0.001)的臨床醫生U-CEP量表總得分比較,差異有統計學意義;不同性別、年齡、工作單位級別、科室、專業、職稱、工作年限的臨床醫生比較,差異沒有統計學意義(P>0.05)。見表4。
3 討論
很多研究證據并不都能順利地轉化為臨床實踐,醫生是臨床診療的重要參與者,掌握臨床流行病學知識是循證臨床實踐的重要基礎。U-CEP量表注重考察臨床密切相關的診斷、病因、治療和預后知識,有很強的綜合性,與其他測量臨床實踐相關知識的量表相比,U-CEP更加便捷省時,利于推廣使用。例如,Berlin量表[6]注重考察計算和生物統計學的解釋,耗時較多;Fresno量表[5]僅設置了開放性問題;ACE量表[4]僅涉及治療性研究。教育和培訓是促進循證臨床實踐的重要措施,有必要監測培訓前后知識掌握程度的動態變化,U-CEP量表的本土化能夠為我國臨床醫生臨床流行病學培訓效果的評價提供可靠的測量工具。本研究量表的漢化基于Brislin翻譯模型,過程規范;研究小組包括多名臨床醫生、臨床流行病學專家、統計學專家,并開展預調查,保證了中文版U-CEP量表的科學性。
Kortekaas等[3]使用英文版U-CEP量表測量全科醫生(general practitioner,GP)的臨床流行病學知識,研究發現,接受培訓前,醫生得分為(14.4±6.9),得分為滿分(33分)的43.6%,3年培訓結束后得分為(24.9±4.7),臨床流行病學知識得到顯著提升;另一相似的研究[7]發現,接受GP培訓后醫生的得分為29.5[95%CI(28.0,31.0)],得分為滿分(50分)的59.0%。本研究中,我國414位臨床醫生平均得分為(14.36±3.92),年齡≤30歲的醫生得分為(14.59±4.06),平均得分約為滿分(33分)的44.2%,得分較低,可能原因是我國對于臨床醫生的相關教育不足。本研究中,由研究對象自報是否“系統學習過相關知識(累計學習時間>10小時)”,“系統學習過”相關知識的醫生占比78.3%,有進一步提高的可能,提示我國臨床醫生存在相關教育和培訓的需求。“系統學習過”相關知識的醫生得分為14.84,得分較低,盡管得分與“未系統學習”者之間存在統計學差異,但得分的絕對值差異較小,原因可能是10小時間斷學習的效果有限,而Kortekaas等學者為醫生定制了臨床流行病知識的教育方案,教育時間也較長(1~3年)。這也提示我們完善臨床流行病學教育模式,設計更加貼近醫生的教育方案,將教育要融入醫生的日常工作,在不增加診療負擔的前提下提高醫生整體的臨床流行病學知識。僅有少數條目的與總量表的相關性低、區分度低,量表整體有較好的內部一致性和對調查對象的區分度。條目4“病因學研究是研究因果關系的嗎?請選擇最合適的答案”得分與總得分沒有明顯的相關性,正確率較高(82.37%),且不能有效區分高分組和低分組,原因可能是該題目的設計較為簡單,不能有效測量研究對象的臨床流行病學知識水平,在未來的量表修正中需要對其進行重點修改。條目8“以下表述是否正確:混雜(偏倚)會在診斷性研究中起作用。”正確率為24.40%,正確率較低,與總量表的相關系數相關性較低,未來量表改良時可以重點關注該條目。
本研究結果顯示,中文版U-CEP量表的Cronbach's α系數為0.80,逐項刪除條目后的Cronbach's α系數沒有明顯升高,具有較高的內部一致性信度;重測信度和復本信度良好,可以認為測量的結果較為穩定,可以考慮在國內推廣使用。
本研究中,我國414位臨床醫生的最高分為23分,最低分5分,沒有天花板效應和地板效應,可以認為中文版U-CEP量表內容效度良好,能夠動態測量醫生的臨床流行病學知識水平,可以用于動態評估我國循證臨床實踐相關教育培訓的效果。已知族群效度分析的結果提示,中文版U-CEP能夠區分不同學歷及是否系統學習過相關知識的人群,顯示出較好的效度。不同工作單位級別、職稱、工作年限、專業類別、科室的醫生之間未表現出明顯的得分差異,原因可能有兩種。其一,U-CEP題目設置偏難,所測量的知識與臨床診療之間沒有密切的相關關系,臨床流行病知識并不隨著臨床經驗的積累而增加。對此,有望在此量表的基礎上進行優化,結合臨床工作實況及臨床流行病知識設計一些與臨床決策更為相關的題目,研制更加符合我國臨床現況的相關量表。其二,臨床工作缺乏循證醫學氛圍,醫療機構并沒有給予醫生足夠的教育和培訓支持,醫生自主學習臨床流行病學知識的動力和時間有限,研究認為,醫療機構、社會環境、醫生本身三個層面都影響著醫生的循證醫學知識和循證臨床實踐行為[21-23]。這提示通過多種途徑提升醫生循證臨床實踐能力的可能性。國內外學者為提高臨床醫生循證臨床實踐能力作出了許多探索[24-26],使用印刷資料、社交媒體等增加相關知識在線上線下的可及性、營造醫療專業人員之間積極學習與交流的氛圍、增加同伴支持、提高醫生學習的動機等均被證實為較為有效的干預途徑。對此,我們可以對醫生開展半結構化訪談了解醫生學習上的阻礙,制訂有針對性的應對措施,開展教育等多種方式、多個層面的綜合干預。
本研究存在一定的局限性:① U-CEP是評估醫生臨床流行病學知識的有效工具,但醫生對知識的掌握能夠在多大程度上指導臨床實踐尚不能明確得知,未來需要相關研究證實。② 本研究的樣本量為414例,樣本量較小,我們采用Cronbach's α系數法進行了該樣本量條件下的事后把握度分析,估算所得的把握度為0.996,尚可,但由于本研究使用方便抽樣開展網絡調查,研究對象的地區、工作單位級別等特征的分布可能存在偏頗,量表得分情況不具有廣泛的代表性。③ 本研究僅僅開展了橫斷面調查,未能驗證中文版U-CEP動態測量醫生臨床流行病學知識變化的有效性。
綜上所述,中文版U-CEP量表有良好的信效度,且有著良好的文化適配性,能夠有效評估醫生的臨床流行病學知識。未來,中文版U-CEP的動態測量作用需要在試驗中得到驗證;我們期望中文版U-CEP能夠應用在臨床醫學教育、醫生的培訓考核等過程中,產生更多的研究證據,探索與改良該工具的不足之處,助力祖國臨床流行病學教育,營造良好的臨床循證醫學環境。
聲明 本研究不存在任何利益沖突。