BS. Nguyễn V. Tuấn
Dự báo dịch Vũ Hán cho Việt Nam 2 tháng tới
Một trong những câu hỏi quan trọng về dịch Vũ Hán ở Việt Nam là trong tương lai gần tình hình dịch sẽ ra sao. Rất thiếu những dữ liệu về tình hình dịch ở Việt Nam, nên rất khó trả lời câu hỏi này. Trong bài trước [1], tôi đã tóm lược bức tranh dịch Vũ Hán ở Việt Nam, và trong cái note này tôi sẽ bàn qua về ước tính chỉ số R0 (reproduction ratio) và ước tính số ca nhiễm trong 60 ngày tới cho Việt Nam. Lần này tôi dùng mô hình Poisson (thay vì lần trước dùng mô hình SIR).
1. Xu hướng
Trước hết là số liệu về dịch bệnh. Theo trang wiki [2] thì tính đến ngày 2/4 đã có 227 ca nhiễm. Số liệu được báo cáo từng ngày, nên rất dễ cho việc phân tích. Cách đơn giản nhứt là đếm số ca mỗi ngày, và Biểu đồ 1 sau đây trình bày con số đó tính từ ngày 23/1/2020 đến 2/4/2020 (72 ngày). Nói liều theo ngôn ngữ xác suất Poisson, tỉ suất nhiễm trung bình = phương sai = 3.15.
Biểu đồ 1: Biểu đồ phần trên phản ảnh số ca nhiễm ghi nhận từ ngày 23/1/20 đến 2/4/2020. Biểu đồ phía dưới thể hiện số ca tích lũy từ ngày 23/1/2020 đến 2/4/2020.
Như có thể thấy, tình hình dịch diễn ra trong 2 thời điểm: trước 23/2 chỉ vài ca lác đác, nhưng từ 6/3 trờ đi thì số ca hàng này tăng nhanh. Có ngày số ca lên đến 19 ca (ngày 22/3). Mặc dù xu hướng chung là tăng, nhưng số ca thì có vẻ trồi sụt bất thường. Điều này đòi hỏi phải có phân tích bằng mô hình.
2. Hệ số lây lan
Vấn đề quan trọng trong mỗi trận dịch là ước tính hệ số lây nhiễm (còn gọi là ‘reproduction ratio’) và kí hiệu là R0. Như giải thích trước đây, R0 là chỉ số phản ảnh một người bị nhiễm lây lan cho R0 người khác. Nói cách khác, nếu R0 = 2, thì mỗi người bị nhiễm có thể lây lan cho 2 người khác. Hệ số này thường khác biệt giữa các nước vì tùy thuộc vào môi trường và tình hình lây lan. WHO dựa vào dữ liệu của Vũ Hán ước tính rằng R0 dao động trong khoảng 1.4 đến 2.5 [3]. Nhưng tình hình ở Việt Nam khác với Vũ Hán, và đòi hỏi phải có ước số riêng.
Hệ số này được ước tính qua phương pháp được mô tả chi tiết trong Cori et al [4]. Phương pháp này đòi hỏi phải có thời gian ủ bệnh, mật độ phân bố của số ca nhiễm (có thể ước tính từ Biểu đồ 1). Do đó, tôi dùng dữ liệu thực tế đến ngày 2/4 và kết hợp với thời gian ủ bệnh qua một nghiên cứu trên Ann Int Med (trung bình 5.1 ngày, độ lệch chuẩn 2.32 ngày) để mô phỏng [5]. Kết quả mô phỏng cho thấy tính trung bình R0 = 1.08, nhưng xác suất 95% có thể dao động từ 0.87 đến 1.33 (Biểu đồ 2).
Biểu đồ 2: Phân bố giá trị của hệ số lây lan (R0) theo mô phỏng dựa vào số liệu về số ca nhiễm trong Biểu đồ 1 và thời gian ủ bệnh công bố trên Ann Int Med 2020.
3. Nhiễm lực (force of infection)
Một thông số khác mang tính dịch tễ học cũng quan trọng không kém là ‘nhiễm lực’. Hệ số này được ước tính như là tỉ số của số ca mới nhiễm trên tích số của số ca có nguy cơ (susceptible) và thời gian phơi nhiễm. Vẫn dùng mô phỏng tôi có Biểu đồ 3 dưới đây. Kết quả phân tích cho thấy nhiễm lực có 3 làn sóng: trước tháng 2, sau tháng 2, và đầu tháng 3. Trước tháng 2 có một đợt nhỏ, không đáng kể; đợt hai thì cao hơn chút, nhưng đợt ba thì cao nhất. Tuy nhiên tín hiệu tích cực là nhiễm lực có vẻ đang suy giảm từ cuối tháng 3. Có thể nó phản ảnh biện pháp của chánh phủ đang có hiệu quả.
Biểu đồ 3: Nhiễm lực tính từ lúc dịch mới phát sinh cho đến nay. Xu hướng gần đây là giảm. Trục tung là nhiễm lực (force of infection), trục hoành là ngày, đường đứt đoạn là ngày hôm qua 2/4/2020. Nhìn chung, có 3 đợt sóng: đợt đầu xuất hiện trước tháng 2, đợ hai sau tháng hai và bị dập tắt, nhưng đợt ba thì bùng phát mạnh. Tuy nhiên, tín hiệu tích cực là có xu hướng giảm nhiễm lực từ cuối tháng 3.
4. Dự báo tương lai
Đến phần quan trọng là dự báo về tình hình dịch trong tương lai gần. Các tham số trên (số ca bệnh, hệ số lây lan R0, và nhiễm lực) có thể dùng để dự báo số ca nhiễm trong tương lai. Phương pháp dự báo chủ yếu là ‘branching process’ [6], dựa vào giả định (i) số ca bệnh mỗi ngày tuân theo luật phân bố Poisson; và (ii) thời gian. Phương pháp phân tích xem MỖI số ca nhiễm là một tham số bất định chịu sự chi phối của luật xác suất. Điều này nói lên rằng kết quả cũng mang tính bất định.
Kết quả dự báo (Biểu đồ 4) cho thấy trong 60 ngày tới, tổng số ca nhiễm mới có thể dao động trong khoảng 165 (tối thiểu) đến 2322 người (tối đa), với trung vị là 811 người. Tình huống tốt nhứt và xấu nhứt được trình bày trong Biểu đồ 5. Ý tưởng là phải làm cho biểu đồ này ‘flat’ để giảm áp lực lên hệ thống y tế.
Biểu đồ 4: Kết quả mô phỏng dự báo số ca nhiễm trong 60 ngày tới. Trục hoành là số ca dự báo, trục tung là tần số mô phỏng (có thể xem là xác suất hậu định). Tổng số ca nhiễm có thể dưới 500, nhưng cũng có thể ~2000 người, nhưng trung bình là 811 người.
Biểu đồ 5: Dự báo số ca nhiễm tích lũy trong 60 ngày tới. Biểu đồ trình bày cho nhiều tình huống thấp nhứt (1%) đến cao nhứt (99%). Dự báo tính từ ngày 3/4/2020. Tình huống trung bình là đường quantile 50%. Tình huống xấu nhứt là quantile 99%. Tuy nhiên, tình huống tốt nhứt là quantile 1%, với số ca nhiễm mới (dự báo) ~250.
***
Tóm lại, một số điểm chánh có thể rút ra từ phân tích dự báo này: (i) hệ số lây lan ở Việt Nam tương đối thấp (1.08, với khoảng tin cậy 95%: 0.87 – 1.33); (ii) nhiễm lực đang có xu hướng suy giảm từ đầu tháng Tư; và (iii) tổng số ca mới nhiễm trong 2 tháng tới [tính từ 2/4] là [trung bình] 811 người. Tuy nhiên, nếu can thiệp thì số ca chắc chắn sẽ giảm. Còn giảm bao nhiêu thì là một đề tài nghiên cứu mô phỏng khác.
Tôi phải nói thêm rằng những kết quả trên đây phụ thuộc vào phẩm chất của dữ liệu. Đặc biệt là ước tính hệ số R0, nếu số ca báo cáo mỗi ngày không đầy đủ, kém chính xác, hay cố ý làm giãn ra, v.v. thì sẽ làm lệch ước số R0. Mà, khi R0 bị lệch thì các dự báo cũng bị ảnh hưởng theo. Chúng ta hi vọng rằng dữ liệu VN ok.
====
PS: Cũng nhân dịp này xin cám ơn các bạn đã chịu khó cập nhựt số liệu trên trang wiki và cám ơn một bạn đọc đã gởi file excel cho tôi với đầy đủ danh sách đặc điểm các cá nhân bị nhiễm, với đảm bảo privacy tuyệt đối.
Có thể đọc dễ hơn trong blog:
[4] Cori A, et al. A New Framework and Software to Estimate Time-Varying Reproduction Numbers During Epidemics. Am J Epidemiol 2013;178:1505-12.
[5] Lauer SA, et al. The Incubation Period of Coronavirus Disease 2019 (COVID-19) From Publicly Reported Confirmed Cases: Estimation and Application. Ann Int Med 2020.
[6] Nouvellet P, et al. A simple approach to measure transmissibility and forecast incidence. Epidemics 2018;22:29-35.