บทความของ M-CAB
เราควรเปรียบเทียบสถิติโควิด-19 ระหว่างประเทศด้วยตัวเลขใด?
เราควรเปรียบเทียบสถิติโควิด-19 ระหว่างประเทศด้วยตัวเลขใด?
สมมติว่า นาย ก. และ ข. มีรายได้ต่อเดือน 15,000 และ 30,000 บาท ตามลำดับ ถ้าเปรียบเทียบเฉพาะตัวเลข จะเห็นว่านาย ข. มีเงินใช้มากกว่า นาย ก. แต่ถ้าผมให้ข้อมูลเพิ่มเติมว่า นาย ข. ต้องดูแลภรรยาที่เป็นแม่บ้านซึ่งเลี้ยงลูกอีก 1 คนอยู่ที่บ้าน ในขณะที่ นาย ก. ยังไม่มีครอบครัว นาย ก. จะยังมีเงินใช้ 15,000 บาท/เดือนเท่าเดิม ในขณะที่นาย ข. เฉลี่ยแล้วจะมีเงินใช้เดือนละ 30,000/3 = 10,000 บาท น้อยกว่านาย ก. ตรงกันข้ามกับที่ได้ข้อมูลตอนแรก
เช่นเดียวกับเวลาเราได้ยินจำนวนผู้ป่วยโควิด-19 ของแต่ละจังหวัด หรือแต่ละประเทศในแต่ละวัน
‘ตัวหาร’ ทำให้เห็นขนาดที่แท้จริง
ยกตัวอย่างตัวเลขเมื่อวันที่ 14 เม.ย. อเมริกามีผู้ป่วยสูงสุด 587,597 ราย รองลงมาเป็นสเปน 172,541 ราย และอิตาลี 159,516 ราย แต่สาเหตุที่อเมริกามีจำนวนผู้ป่วยมากที่สุด อาจเป็นเพราะอเมริกาเป็นประเทศใหญ่ก็ได้ ซึ่งถ้าเราหารด้วยจำนวนประชากรทั้งหมดในประเทศนั้นๆ จะพบว่าประเทศที่มีอัตราป่วยสูงที่สุดกลับเป็นสเปน เพราะมีผู้ป่วย 3,690 ราย/ประชากร 1 ล้านคน (จำนวนผู้ป่วยหารด้วยประชากรทั้งหมด แล้วคูณด้วย 1 ล้าน)
รองลงมาเป็นสวิตเซอร์แลนด์ และเบลเยียม เท่ากับ 2,982 และ 2,846 ราย/ประชากร 1 ล้านคน ตามลำดับ ซึ่งเป็นคนละลำดับกับที่จัดเรียงในตอนแรก แน่นอนว่าจำนวนนับ (count) แม้เพียง 1 รายก็เป็นตัวเลขที่มีชีวิตและต้องได้รับการตรวจรักษา แต่เพื่อความยุติธรรมในการเปรียบเทียบจำนวนผู้ป่วยแต่ละประเทศ อย่างน้อยตัวเลขนั้นควรจะมี ‘ตัวหาร’ เพราะแต่ละประเทศมีจำนวนประชากรตั้งต้นก่อนที่จะติดเชื้อไม่เท่ากัน
และเมื่อหารแล้วจะทำให้เราเห็น ‘ขนาด’ ของชิ้นเค้กที่ถูกโรคตัดออกไป ว่าแท้จริงแล้วเป็นสัดส่วน (proportion) เท่าไรจากเค้กก้อนใหญ่ทั้งหมด
โดยสัดส่วนของโรคจะแบ่งออกเป็น 2 ประเภท คือสัดส่วนที่เกี่ยวกับความป่วย (morbidity) และสัดส่วนที่เกี่ยวกับความตาย (mortality) ขึ้นอยู่กับว่าเราสนใจความเสี่ยง (risk) ในการเกิดโรคก็จะเลือกอย่างแรก หรือถ้าสนใจความรุนแรง (severity) ของโรคก็จะเลือกอย่างหลัง ซึ่งเราจะได้ยินการนำเสนอตัวเลขทั้ง 2 ประเภทนี้อยู่แล้ว เช่น “วันนี้พบผู้ป่วยรายใหม่ 34 ราย ทำให้มีผู้ป่วยสะสม 2,613 ราย และเสียชีวิต 1 ราย ทำให้มีผู้เสียชีวิตสะสม 41 ราย”
สัดส่วนที่เกี่ยวกับความป่วย
จะสังเกตว่าตัวเลขที่เกี่ยวกับความป่วยมี 2 แบบ คือ จำนวนผู้ป่วยที่เพิ่มขึ้นในช่วงระยะเวลาหนึ่ง เช่น “วันนี้พบผู้ป่วยรายใหม่ 34 ราย” ซึ่งถ้ามีตัวหารก็จะเรียกว่า ‘อุบัติการณ์’ (incidence) และอีกตัวคือ จำนวนผู้ป่วยทั้งหมดในช่วงระยะเวลาหนึ่ง เช่น “ผู้ป่วยสะสม 2,613 ราย” ซึ่งถ้ามีตัวหารจะเรียกว่า ‘ความชุก’ (prevalence) ซึ่งอาจเป็นความชุกที่จุดเวลาที่กำหนด (point prevalence) หรือในช่วงเวลาที่กำหนด (period prevalence)
โดย point prevalence จะนับเฉพาะผู้ป่วย ณ เวลานั้น เช่น ถึงแม้ขณะนี้จะมีผู้ป่วยสะสม 2,613 ราย แต่จะต้องลบด้วยจำนวนผู้ที่หายป่วยแล้ว คือ กลับบ้าน 1,405 ราย และเสียชีวิต 41 รายออกไป = 1,167 ราย หรือถ้าในการรายงานของกระทรวงสาธารณสุขของบางประเทศจะรายงานเป็นตัวเลข ‘active cases’ เพราะจะแสดงให้เห็นถึงปริมาณทรัพยากร เช่น ยา จำนวนเตียง บุคลากรทางการแพทย์ ที่กำลังถูกใช้อยู่ในปัจจุบัน
แต่ปัญหาของสัดส่วนจะอยู่ที่มี ‘ตัวเศษ’ แล้ว แต่จะหา ‘ตัวส่วน’ มาจากไหน เพราะโดยนิยามแล้วตัวเศษจะต้องรวมอยู่ในตัวส่วน และตัวส่วนจะต้องเป็นประชากรที่มีความเสี่ยงที่จะเกิดโรค (population at risk of having the condition) ยกตัวอย่าง ตัวส่วนประชากรกลุ่มเสี่ยงของมะเร็งปากมดลูกจะต้องเป็น ‘ผู้หญิง’ ดังนั้นตัวหารต้องไม่มี ‘ผู้ชาย’ รวมอยู่ด้วย หรือในกรณีนี้คือใครเป็นประชากรที่มีโอกาสได้รับเชื้อไวรัสสายพันธุ์ใหม่บ้าง?
ซึ่งถ้าเราไม่ทราบ หรือคิดว่าทุกคนในพื้นที่มีความเสี่ยงทั้งหมด เราก็จะใช้จำนวนประชากรในจังหวัดหรือประเทศนั้นเป็นตัวหาร ดังภาพที่ 2 แต่ปัญหาจะอยู่ที่ ‘ตัวส่วน’ อีกเช่นกัน เพราะส่วนใหญ่จะใช้จำนวนประชากรกลางปีตามฐานข้อมูลทะเบียนราษฎร์ ซึ่งไม่ใช่ประชากรที่อาศัยอยู่ในจังหวัดนั้นจริง ในขณะที่ ‘ตัวเศษ’ ก็อาจไม่ได้รวมอยู่ในตัวส่วน เช่น ผู้ป่วยในกรุงเทพฯ รวมผู้ป่วยชาวจีนที่เข้ามาเที่ยวช่วงเดือน ม.ค. ด้วย