全面尿液篩檢的統計陷阱

劉玉皙、佘健源 (登於5/8蘋果論壇)

 

 

日前經市議會提議,新竹市政府決定五月起全面實施國高中全面尿液篩檢。贊成者認為此舉將有效遏止學生濫用毒品,並且認為「人權」不是規避全面尿篩的藉口。然而,全面尿篩有其統計陷阱:看似中立的全面尿液篩檢,在統計上卻不見得有相應的準確度,這並不是人權問題,而是在數學上即存在極大誤區,在執行上若稍有不慎,就會變成教育上的災難,有可能毀了孩子的一生。

 

統計學上有「貝氏機率」,計算的是在某條件成立之下,某一事件發生的機率。尿液篩檢的結果即是一種貝氏機率。假設現在測試的準確度如下:若受檢者吸毒,每次檢測呈陽性反應的機率為99%;若受檢者沒吸毒,陰性反應的機率為99%,偽陽性反應的機率則為1%。「吸毒/沒吸毒」即是給定的條件,99%是貝氏機率。表面上看來,誤判的機率似乎只有1%;其實不然,若實施全面尿檢,誤判的機率甚至可能超過50%,比「駁杯」還差!

 

這怎麼說呢?高中數學程度就可以理解。事實上全面尿篩並無法告訴我們學生是否真的吸毒,全面尿篩只能告訴我們某些學生呈陽性反應。此時貝氏機率的給定條件變成「陽性/陰性」。「陽性反應」包含了真的在吸毒的學生,也包含未吸毒但呈偽陽性反應的學生。當未吸毒的人口比例越高時,偽陽性的學生也就越多。目前政府單位推估全台約有1%之吸毒人口,而新竹市國高中學生 (含高職) 約有三萬六千人。若以上述假設99%敏感度的尿檢為基礎進行估算,我們可以貝氏機率推得,當實施全面尿篩後,將會有約712名學生呈陽性反應,其中卻只有356名學生是真的在吸毒。換言之,若某生在全面尿篩中呈陽性反應,則他真的在吸毒的可能性只有50%,誤判的比例將達五成!

 

這是令人震驚的結論,卻是數學上的現實。任何科學的證據,其實也只是機率的結果。也因此,在醫學和法律上,有嚴謹的程序降低誤判機率。既然「未吸毒人口占母體比例」有決定性影響,一般便只針對很有可能吸毒的嫌犯尿檢,而非全民尿檢。而任何初次檢驗是陽性的人,都必須再複驗,而不是馬上把他們當成罪犯。然而,新竹市教育局和學校基層人員是否了解這個統計陷阱?機率意味風險,而不是蓋棺論定的依據,如果老師們都用「有罪推定」的心態把機率看成證據,又萬一弱勢學生(窮、單親、課業表現不佳)剛好呈現偽陽性反應,那對一個中學生會造成多麼毀滅性的結果?

 

一個「全民有罪推定」的全面尿檢,牽涉的不僅是人權問題,而是鐵錚錚的統計誤區。尤其教育牽涉到的是學生的未來,依前述計算,影響的可能是三百多名學生的人生。一個理盲的社會,將以下一代的成長為代價,而這並不是宣稱全面尿檢已簽署「家長同意書」可以抹滅的事實。

 

   
全面尿液篩檢圖(1)  

計算附錄: 


假設P(A)=吸毒的機率, P(B)=不吸毒的機率, P(C)=驗出來是陽性的機率, P(D)=驗出來是陰性的機率, A與B無交集, C與D無交集, P(C|A)=0.99, P(D|B)=0.99, P(A)=0.005, P(B)=1-P(A)=0.995, 而根據貝氏機率,
P(C|A)=P(C交集A) / P(A) = 0.99,
P(D|B)=P(D交集B) / P(B) = 0.99
所以每位檢驗呈陽性的人,他真的在吸毒的機率=P(A|C) = P(A交集C)/ P(C)
分子=P(A交集C) = P(C|A)*P(A) = 0.99*0.005 =0.00495
分母=P(C) =P(C|A)*P(A)+P(C|B)*P(B)=0.99*0.005+0.995*0.01=0.0149
所以, 所以每位檢驗呈陽性的人,他真的在吸毒的機率=P(A|C) =0.00495/0.0149 = 0.3322
值得注意的是, 誤判的機率主要是看P(A)而定,但我們永遠不知道真實的P(A),有點像統計的假設檢定,所以,萬一現在P(A)只有0.001, 誤判的機率更高, 而如果P(A)較高, 誤判機率就越低

所以文章第三段的新竹市例子,就把P(A)代入0.01, 算出來誤判機率較低一些,但是也有五成

這就是為甚麼如果我們針對很有可能吸毒的群體進行尿檢,誤判機率會低非常多的緣故,因為當P(A)高到80%的時候, 誤判機率就會比較低了
這才是全面尿檢與針對特定群體尿檢的決定性差異

 

 

創作者介紹
創作者 laches 的頭像
laches

歧路花園

laches 發表在 痞客邦 留言(1) 人氣()


留言列表 (1)

發表留言
  • laches
  • 附錄計算:

    假設P(A)=吸毒的機率, P(B)=不吸毒的機率, P(C)=驗出來是陽性的機率, P(D)=驗出來是陰性的機率, A與B無交集, C與D無交集, P(C|A)=0.99, P(D|B)=0.99, P(A)=0.005, P(B)=1-P(A)=0.995, 而根據貝氏機率,
    P(C|A)=P(C交集A) / P(A) = 0.99,
    P(D|B)=P(D交集B) / P(B) = 0.99
    所以每位檢驗呈陽性的人,他真的在吸毒的機率=P(A|C) = P(A交集C)/ P(C)
    分子=P(A交集C) = P(C|A)*P(A) = 0.99*0.005 =0.00495
    分母=P(C) =P(C|A)*P(A)+P(C|B)*P(B)=0.99*0.005+0.995*0.01=0.0149
    所以, 所以每位檢驗呈陽性的人,他真的在吸毒的機率=P(A|C) =0.00495/0.0149 = 0.3322
    值得注意的是, 誤判的機率主要是看P(A)而定,但我們永遠不知道真實的P(A),有點像統計的假設檢定,所以,萬一現在P(A)只有0.001, 誤判的機率更高, 而如果P(A)較高, 誤判機率就越低

    所以文章第三段的新竹市例子,就把P(A)代入0.01, 算出來誤判機率較低一些,但是也有五成