“Người từng mắc covid-19 có nguy cơ tái nhiễm gấp 5 lần nếu không tiêm vaccine”. Đó là một cái tit của vtv [1] mà một bạn đọc muốn tôi bình luận. Đọc bài báo trên cdc [2] mà vtv trích dẫn thì thấy vtv hiểu sai con số và ý nghĩa của con số. Câu chuyện nói lên rằng cần phải cân nhắc khi đọc những nghiên cứu liên quan đến covid. Theo tôi nghĩ bài báo trên CDC là một loại rác rưởi covid, một ca tiêu biểu về sai lầm trong nghiên cứu khoa học.
1. Một sự hiểu sai
Bài báo đó công bố trên trang nhà của CDC (Mĩ) so sánh hai nhóm bệnh nhân bị nhập viện vì những triệu chứng giống covid-19:
• Nhóm 1 (n = 6328) là những người không bị nhiễm trước đây và đã được tiêm vaccine đủ 2 liều. Trong số này, có 324 người (tức 5.1%) có kết quả xét nghiệm PCR dương tính với covid.
• Nhóm 2 (n = 1020) là những người đã bị nhiễm trước đây và chưa tiêm vaccine. Trong số này, có 89 người (8.7%) dương tính với covid.
• Sau khi phân tích thống kê, họ tính toán được tỉ số odds là 5.49, với khoảng tin cậy 95% dao động từ 2.75 đến 10.99.
Họ kết luận rằng ở những người bị nhập viện vì những triệu chứng giống covid-19 đã từng bị nhiễm hay chưa được tiêm vaccine, odds có kết quả dương tính với covid-19 ở người chưa vaccine cao gấp 5.5 lần so với người đã tiêm vaccine mRNA (sau khi đã hiệu chỉnh cho các yếu tố khác). Dựa vào nghiên cứu này, họ (tác giả) kêu gọi mọi người nên đi tiêm chủng vaccine covid càng sớm càng tốt.
Thế nhưng vtv lại chạy cái tít là “Người từng mắc covid-19 có nguy cơ tái nhiễm gấp 5 lần nếu không tiêm vaccine”. Cái tít đó của vtv có thể hiểu như sau:
• Nhóm 1 là những người đã từng bị nhiễm và chưa tiêm vaccine: p1
• Nhóm 2 là những người đã từng bị nhiễm và đã tiêm vaccine: p2
• Tỉ số nguy cơ = p1 / p2 = 5 lần.
Như các bạn thấy vtv hiểu sai, vì nhóm 1 trong bài báo là những người không bị nhiễm trước đây, nên không thể nói họ là ‘tái nhiễm’ được.
2. Vấn đề của nghiên cứu
Nghiên cứu công bố trên CDC có rất nhiều vấn đề làm cho kết quả đó có thể sai hay không có ý nghĩa gì đáng chú ý.
Vấn đề thứ nhứt là sự thiên lệch về cách tuyển chọn bệnh nhân. Nên nhớ rằng những người mà họ chọn là có triệu chứng giống như covid bị nhập viện. Điều này có nghĩa là những người này có nguy cơ nhiễm covid cao hơn so với trong cộng đồng. Do đó, chúng ta không ngạc nhiên khi tỉ lệ dương tính báo cáo khá cao (gần 9% trong nhóm bị nhiễm mà chưa tiêm vaccine). Con số đó chắc chắn không phản ảnh nguy cơ ngoài cộng đồng, bởi vì trong số những người có triệu chứng ngoài cộng đồng chỉ có một số ít là nhập viện.
Vấn đề thứ hai là so sánh kiểu trái táo và trái cam. Nhóm 1 là những người không bị nhiễm và được tiêm vaccine, còn nhóm 2 là người đã bị nhiễm mà chưa tiêm vaccine. Hai nhóm quá khác nhau. Dĩ nhiên, cách họ chọn bệnh nhân nghiên cứu là để phản bác những người nói rằng đã bị nhiễm thì có kháng thể không thua gì nhóm chưa bị nhiễm mà được tiêm vaccine. Nhưng phản bác kiểu họ làm là … hơi rẻ tiền. Đáng lí ra nếu họ làm nghiêm chỉnh thì nên chọn nhóm đã bị nhiễm + tiêm vaccine so với nhóm đã bị nhiễm + chưa tiêm vaccine thì mới công bằng.
Vấn đề thứ ba là phân tích dữ liệu. Chúng ta thấy tỉ lệ dương tính trong nhóm 1 (không bị nhiễm + tiêm vaccine) là 5.1%, còn nhóm 2 (bị nhiễm + không vaccine) là 8.7%. Tỉ số nguy cơ là RR = 8.7 / 5.1 = 1.7. Ấy thế mà tác giả có kết quả RR = 5.5!
Con số 5.49 ở đâu ra? Xin thưa là tác giả đã làm phân tích và hiệu chỉnh cho nhiều yếu tố nhiễu. Do đó, từ 1.7 bị biến thành 5.5. Nói cách khác, con số 5.5 là ‘sản phẩm’ của mô hình thống kê, nó không phải là con số thật. Tác giả sai? Không hẳn. Một khi phân tích thống kê cho ra kết quả hiệu chỉnh và kết quả quan sát quá khác biệt (như trường hợp này) thì điều đó nói lên rằng nghiên cứu của họ bị sai từ nguồn gốc, nói theo tiếng Anh là ‘structural error’, hay sai hệ thống. Và, do đó, kết quả của nghiên cứu này có lẽ không đáng để chúng ta phải quan tâm.
Điều làm tôi thấy hơi ‘phiền’ là kết luận của tác giả, đọc lên giống như một kiểu tuyên truyền. Họ viết “All eligible persons should be vaccinated against COVID-19 as soon as possible, including unvaccinated persons previously infected with SARS-CoV-2” (tất cả những ai đủ tiêu chuẩn, kể cả người đã bị nhiễm, nên đi tiêm vaccine càng sớm càng tốt), đọc lên như là một lời kêu gọi hơn là kết luận từ bằng chứng khoa học. Chất lượng của chứng khoa học không đủ thuyết phục để họ ra lời kêu gọi như thế.
Chỉ khi nào họ có bằng chứng sau đây thì mới có thể ra lời kêu gọi đó: ở những người đã bị nhiễm, những ai chưa tiêm vaccine có nguy cơ tái nhiễm cao hơn những ai được tiêm vaccine. Theo tôi biết chưa có bằng chứng RCT nào như thế, nên việc kêu gọi như tác giả có vẻ là hô khẩu hiệu hơn là khoa học.
Câu chuyện này nói lên rằng để diễn giải đúng kết quả nghiên cứu về covid cần phải xem xét đến các chi tiết khoa học đằng sau của nghiên cứu đó. Nếu chỉ dựa vào những câu chữ của tác giả có khi dẫn đến hiểu sai như trường hợp vtv mà chúng ta thấy. Đa số (có lẽ hơn 95%) các nghiên cứu về covid chỉ là rác rưởi mà thôi; chỉ có một số rất ít là đáng đọc, và để biết cái nào đáng đọc thì cần phải hỏi các chuyên gia có kinh nghiệm — một điều mà báo chí Việt Nam bị thiếu.
____