Thể thao brain: có bao nhiêu người nhiễm virus Vũ Hán?
Tác giả: Bác sĩ Nguyễn Tuấn
Câu hỏi dài hơn là ‘có bao nhiêu phần trăm người trong cộng đồng bị nhiễm virus Vũ Hán?’ Câu trả lời ngắn là không thể nào biết. Nhưng chúng ta có thể ước tính bằng vài phương pháp dịch tễ học rất đơn giản. Câu trả lời là trong quần thể xét nghiệm tỉ lệ nhiễm thật sự (trung bình) là 0.0041 (tức 0.41%), nhưng có thể lên đến tối đa là 0.01 (hay 1%).
Cộng đồng
Lí do chúng ta không bao giờ biết được câu trả lời là vì dịch bệnh, khác với các bệnh mãn tính, rất ‘dynamic’ và can thiệp của con người. Nếu chúng ta ra ngoài cộng đồng làm xét nghiệm để biết bao nhiêu người mắc bệnh tiểu đường thì khá dễ: lấy số ca mắc bệnh chia cho tổng số cỡ mẫu. Nhưng một ước số như vậy không thể nào áp dụng cho bệnh truyền nhiễm như dịch Vũ Hán, bởi vì nó lệ thuộc vào thời gian. Và, khi nhiễm virus xảy ra ở qui mô cộng đồng thì các giới chức y tế can thiệp để giảm lây lan. Do đó, chúng ta sẽ không bao giờ có được một ước tính chính xác. Thật ra, ngay cả câu hỏi cũng là không … đáng hỏi!
Quần thể xét nghiệm
Nhưng chúng ta có thể đặt câu hỏi có bao nhiêu phần trăm người thực sự bị nhiễm cho một quần thể xét nghiệm. Có lẽ đa số nghĩ rằng chỉ lấy số người có kết quả dương tính chia cho tổng số ca được xét nghiệm thì sẽ có đáp số. Nhưng vấn đề không đơn giản vậy.
Thật vậy, vấn đề trở nên phức tạp vì phương pháp xét nghiệm không hoàn hảo về độc chính xác. Độ chính xác của các phương pháp xét nghiệm nhanh là bao nhiêu? Có hai chỉ số quan trọng gắn liền với một phương pháp xét nghiệm là độ nhậy (sensitivity) và độc đặc hiệu (specificity) mà ai học dịch tễ học căn bản đều biết. Độ nhậy nói lên rằng trong số 100 người thực sự bị nhiễm, có bao nhiêu người có kết quả dương tính (dương tính). Độ đặc hiệu cho chúng ta biết cứ 100 người không bị nhiễm, có bao nhiêu người có kết quả xét nghiệm ân tính (negative). Hai chỉ số này ảnh hưởng đến ước tính tỉ lệ nhiễm (prevalence) trong một mẫu xét nghiệm.
Hiện nay, có 2 phương pháp xét nghiệm chủ yếu: RT-PCR và xét nghiệm nhanh (rapid test). Xét nghiệm bằng RT-PCR phải làm trong labo, rất nhạy (có thể phát hiện 1 particle từ virus), nhưng hơi chậm để có kết quả. Xét nghiệm nhanh chủ yếu dựa vào antibody rất nhanh nhưng lại kém chính xác. Chẳng hạn như phương pháp “IgM-IgG combined Antibody” bên Tàu [1] cho ra kết quả trong vòng 15 phút. Tác giả báo cáo rằng độ nhậy là 88.7% và độc đặc hiệu là 90.6% [1]. Ở Úc, phương pháp thử máu lấy từ đầu ngón tay (OnSite Rapid Test) có độ nhậy là ~97% và đặc hiệu 99.4% đối với bệnh nhân bị nhiễm sau 5 ngày [2]. Nói chung, các phương pháp xét nghiệm nhanh dù không hoàn hảo (và sẽ chẳng bao giờ có phương pháp hoàn hảo) có độ chính xác khá cao.
Vì độ chính xác không phải 100%, nên một kết quả xét nghiệm dương tính không có nghĩa là người đó bị nhiễm; ngược lại, một kết quả âm tính không hẳn là người đó không bị nhiễm. Nhưng chúng ta có thể dùng số ca dương tính, số người đã được xét nghiệm, cùng với độ nhạy và đặc hiệu để ước tính số người thật sự bị nhiễm.
Việt Nam: thể dục brain
Chúng ta thử ứng dụng lí thuyết đó vào Việt Nam. Tính đến ngày hôm kia, VN đã xét nghiệm 17148 người, và kết quả là 123 dương tính. Kết quả này cho thấy tỉ lệ hiện hành là 0.72%. Nhưng đây là ‘apparent prevalence’ (pa), chớ không phải ‘true prevalence’ (tức tỉ lệ thực sự). Vấn đề đặt ra là trong mẫu này, có bao nhiêu phần trăm bị nhiễm thật sự.
Trả lời câu hỏi này tưởng dễ, mà không dễ. Nếu dùng lí thuyết dịch tễ học cơ bản thì tỉ lệ thật (tạm gọi là P) là: (pa + sp – 1) / (se + sp – 1); trong đó, se là độ nhạy, sp là độc đặc hiệu. Nhưng phương trình này sẽ thất bại, vì pa thấp hơn tỉ lệ dương tính giả (1-sp)!
Do đó, chúng ta phải dùng đến trường phái suy luận Bayes [3]. Với Bayes, chúng ta phải xác định xác suất tiền định (prior distribution) cho các tham số P, se và sp. Giả dụ như chúng ta không biết gì về P, và phân bố beta(1, 1) có thể định lượng tình trạng ‘không biết’ đó. Còn sp và se, chúng ta biết rằng giá trị là hơn 0.90, do đó tôi cho thông tin tiền định là beta(90, 10). Sau đó, là dùng dữ liệu thực tế (pa) và tính xác suất hậu định cho P.
Dùng Gibbs sampler, tôi có kết quả như sau (xem hình): trung vị của P (true prevalence) là 0.0041 (tức 0.41%), với khoảng tin cậy 95% từ 0.0011 đến 0.0076, nhưng có thể lên đến tối đa là 0.01 (hay 1%). Kết quả này cho thấy độ bất định trong ước số rất cao. Lí do cũng dễ hiểu, vì xác suất dương tính giả và âm tính giả còn cao hơn tỉ lệ hiện hành! Nhưng dựa vào kết quả trên, chúng ta có thể nói rằng trong số 17148 đó, có thể số nhiễm thật lên đến 171 người.
Kết quả này có áp dụng cho cộng đồng? Dĩ nhiên là không, vì những người được xét nghiệm trong mẫu được chọn không phải ngẫu nhiên, mà tập trung vào những cá nhân có nguy cơ cao hay tương đối cao. (Do đó, hôm nọ, có người lấy con số ví dụ của tôi, mà bỏ qua đoạn ‘caveat’ phía dưới, để gây hiểu lầm là rất đáng tiếc). Nhưng nếu chúng ta thử liều đoán, với giả định rằng tỉ lệ ngoài cộng đồng chỉ bằng 1/10 của tỉ lệ tối đa (1%) trong quần thể xét nghiệm? Nếu vậy thì chúng ta chọn 0.001 hay 0.1% làm ước số. Nếu cộng đồng là 10,000,000 người thì số ca nhiễm có thể lên đến 10,000 người, nhưng thấp nhứt thì cũng 1000 người.
Ở Úc, các chuyên gia dịch tễ học dự báo ‘rùng rợn’ hơn. Tính đến ngày 21/3, Úc đã xét nghiệm trên 123,000 người, với 1081 dương tính, tức tỉ lệ dương tính là 0.9%. Kết quả tính toán của tôi là tỉ lệ nhiễm (quần thể xét nghiệm) 0.7% mà thôi. Nhưng không hiểu họ tính toán sao mà dự báo rằng có thể 13 triệu người bị nhiễm (dân số Úc là 25.6 triệu) nếu không can thiệp.
Ghi chú biểu đồ: trục hoành là tỉ lệ nhiễm thật (true prevalence), trục tung là xác suất, còn gọi là ‘posterior probability’. Biểu đồ này được tính toán từ mô hình Bayes, với tham số độ nhạy ~ beta(90, 10), độ đặc hiệu ~ beta(90, 10), và prevalence ~ Beta(1, 1).