Các mô hình tiên lượng đều sai

Rate this post

Các mô hình tiên lượng đều sai.

TÁC GIẢ: BS. Nguyễn Tuấn

Chủ Nhật, tôi đọc được bài dưới đây trên “The Atlantic” [1] thấy hay hay, nên chia sẻ đến các bạn. Bài này nói rằng chúng ta đừng tin vào các mô hình tiên lượng dịch Vũ Hán! Tôi là người thích làm về tiên lượng, nhưng lại thích bài này và đồng ý với những gì bàn trong bài: tất cả các mô hình tiên lượng đều sai.

Tháng qua, một nhóm IT ở Sydney dùng AI (chẳng biết đó là cái gì), và dự báo rằng đến ngày 13/3 sẽ có 98,300 người bị nhiễm trên thế giới [2]. Dự báo này hoàn toàn sai. Trong thực tế, số bị nhiễm ngày 13/3 là 145,416 người, cao hơn gần 50% so với dự báo. Con số tử vong mà mô hình này dự báo càng sai be bét! Một số nhóm dự báo rằng Úc sẽ có hơn 3500 ca tử vong trong trận dịch, nhưng cho đến nay con số chỉ 50 và dịch xem ra đã được kiểm soát; như vậy dự báo này càng sai ghê gớm!

Lí do đơn giản là dịch bệnh truyền nhiễm không tuân theo các mô hình AI hay hồi qui (regression), hay mô hình time series. Các mô hình đơn giản như curve fitting sao cho gần với con số thực tế có thể dẫn đến vấn đề over-fitting và không thể dự báo tốt được. Các mô hình kiểu curve fitting có điểm yếu là không có lí thuyết dịch tễ, nên các tham số trong mô hình không có ý nghĩa thực tế. Dĩ nhiên, cũng có quan điểm cho rằng “chúng tôi chẳng quan tâm ý nghĩa là gì, miễn mô hình dự báo chính xác”, nhưng quan điểm này chỉ tốt cho con số, chớ không cho con số một ý nghĩa hay một “linh hồn” được.

Mô hình có ý nghĩa phải dựa trên lí thuyết dịch tễ học. Theo lí thuyết, có 3 tham số quan trọng của bất cứ trận dịch nào là hệ số lây lan (R0), thời gian ủ bệnh, và cái mà người ta gọi là “incidence density”. Cả 3 tham số này đều mang tính bất định và phụ thuộc vào địa phương. Chẳng hạn như R0 ở Vũ Hán là 3.8 (số mới nhứt), còn trên thế giới là 1.4 đến 2.5, và Việt Nam theo ước tính của tôi là chỉ 0.9 đến 1.2. Thời gian ủ bệnh khó ước tính, vì vấn đề xét nghiệm và dương tính giả & âm tính giả. Incidence density thì có thể ước tính dựa vào dữ liệu thực tế, nhưng nếu nhà cầm quyền giấu dữ liệu thì … cũng như không. Hôm nay có tin nói nhà cầm quyền Tàu giấu dữ liệu và tiêu hủy các báo cáo khoa học về dịch Vũ Hán [3], chẳng làm ai ngạc nhiên. Cả ba tham số đều mang tính bất định, thì làm sao có thể dự báo chính xác được.

Advertisement

Nhưng mô hình dịch tễ học không phải có mục tiêu chánh là độ chính xác. Mục tiêu chánh là cung cấp những tình huống. Tình huống tốt nhứt, tình huống trung bình, và tình huống xấu nhứt. Chánh phủ rất thích nghe và hành động trên dự báo tình huống xấu nhứt. Do đó, có thể xem mô hình tiên lượng như là một “cảnh báo” — một cảnh báo có lí thuyết và khoa học tính.

Gs George Box nói rất đúng rằng “All models are wrong, but some are useful” (tất cả mô hình đều sai, nhưng có vài mô hình có ích). Tất cả đều sai hiểu theo nghĩa nó đều cho ra dự báo ‘trớt quớt’ (vì nếu đúng thì không còn là ‘mô hình’). Một số mô hình có ích, vì được chánh phủ tin tưởng và có hành động nhằm kiểm soát dịch.

====

[1] https://www.theatlantic.com/…/coronavirus-models-are…/609271

[2] https://theconversation.com/covid-19-death-toll-estimated-t…

[3] https://www.theguardian.com/…/china-clamping-down-on-corona…

 

 

 

 

 

 

 

Giới thiệu Giang

Giang- Sinh viên y khoa trường đại học Tây Nguyên, mong muốn bổ sung nhiều kiến thức bổ ích cho các bạn sinh viên và cả cho chính bản thân mình.

Check Also

Tirzepatide hàng tuần cải thiện đáng kể cân nặng và kiểm soát đái tháo đường ở bệnh nhân béo phì và đái tháo đường loại 2.

Một nghiên cứu ngẫu nhiên đã chứng minh rằng tirzepatide giúp giảm cân và cải …