Nhà khoa học có thể ví như người mù sờ voi. Trong ‘Kinh Niết Bàn và Kinh Trường A Hàm’ có kể câu chuyện người mù sờ voi như sau:
Ngày xưa có một ông vua sai đại thần dắt đền một con voi, cho một bọn người mù sờ xem. Sau đó vua hỏi: “Các ông đã biết voi chưa?”
– Biết rồi! Bọn người mù đáp.
– Thế voi như thế nào?
– Voi xem ra như cái đòn xóc. Người sờ ngà voi bảo.
– Voi như cái quạt. Người sờ tai nói.
– Voi như tảng đá. Người sờ đầu voi đáp.
Người sờ vòi lại bảo: “Voi giống như cái chày”.
– Voi giống như cái hộp gỗ. Người sờ mắt voi nói.
– Không phải. Voi như cái giường. Người sờ lưng voi khẳng định.
– Theo tôi con voi như cái thùng to. Người sờ bụng voi kêu lên.
– Đừng cãi nhau nữa, con voi như sợi dây thừng. Người sờ đuôi xác nhận.
Nhà vua nghe bọn người mù tranh cãi nhau, cảm khái nói:
Người mù đều rất đông
Tranh nhau nói sự thật
Voi vốn chỉ một thân
Thị phi lại bất đồng.
Tân tổng thống Biden tuyên bố rằng chánh sách về đại dịch covid-19 sẽ do khoa học dẫn đường. Lời tuyên bố này làm cho giới khoa học thở phào sau những năm tháng ‘sóng gió’ dưới thời TT Trump. Tuy nhiên, khoa học covid-19 thì còn rất rất nhiều bất định, và giới khoa học chỉ như ‘người mù sờ voi’ thôi. Dựa vào khoa học là cần thiết, nhưng lệ thuộc 100% vào khoa học nhứt thời là nguy hiểm và chẳng khác gì thoái thác vai trò lãnh đạo.
Nhiều người ngoài khoa học thường nhìn khoa học bằng cái nhìn xác định (deterministic). Tức là, theo họ cái gì mà giới khoa học báo cáo trên các tập san khoa học đều chính xác, chắc chắn, thậm chí là chân lí. Khoa học nói phải đứng cách nhau 1.5 mét mới là an toàn và giảm lây nhiễm, và chúng ta cần phải làm như thế. Khoa học nói đeo khẩu trang giảm lây nhiễm, và chúng ta nên đeo khẩu trang. Khoa học nói thuốc hydroxychlroquine có hiệu quả cứu người bị nhiễm covid-19, và thế là công chúng ùn ùn đi mua hydroxychlroquine. Khoa học nói vaccine có hiệu quả giảm 95% ca nhiễm covid-19 và thế là công chúng tin ngay.
Cái nhìn khoa học = chắc chắn = chính xác đó thật ra là một sai lầm. Tôi đi đến kết luận này vì đã chứng kiến rất nhiều sai lầm trong khoa học. Danh sách những sai lầm thì dài lắm, kể cả chuyện thay thế hormone (HRT) là một ca tiêu biểu. Có thời HRT được xem như thần dược, nhưng vài năm sau đó khi người ta làm nghiên cứu RCT thì mới biết nó có tác hại nhiều hơn là lợi ích.
Trong thời đại dịch, chỉ 1 năm (nếu tính từ tháng 1/2020 khi TT Trump tuyên bố tình trạng khẩn cấp) mà đã có hơn 20,000 nghiên cứu khoa học! Theo nhiều chuyên gia, 99% những nghiên cứu đó đều chỉ làm cho có, chớ chẳng đóng góp gì cho y văn. Đa số là sai: sai về phương pháp luận, sai về đo lường, sai về cách phân tích, sai về cách diễn giải. Ngay cả những kết quả đúng vẫn có những bất định. Gs Richard Feynman nói rất đúng: trong khoa học, chúngta không bao giờ biết mình đúng một cách tuyệt đối, chúng ta chỉ có thể chắc chắn là chúng ta sai.
Tuy nhiên, khoa học vẫn là cái tốt nhứt chúng ta có, là cái đèn soi sáng khi chúng ta không biết gì. Khoa học có khả năng tự sửa sai, và nó khá hơn niềm tin tôn giáo ở chỗ đó.
Những bất định trong kết quả nghiên cứu khoa học có thể đo lường được. Bởi vì một nghiên cứu dựa vào một mẫu bệnh nhân (có thể mẫu đó bao gồm 30,000 người hay 300 người), và kết quả chỉ được tính toán trên mẫu đó. Nếu nghiên cứu được lặp lại ở một mẫu khác, cho dùng cùng phương pháp đo lường và phân tích, thì kết quả có giống y chang như nghiên cứu đầu? Câu trả lời là KHÔNG. Kết quả của nghiên cứu 2 có thể thấp hơn hay cao hơn nghiên cứu đầu. Do đó, các nhà khoa học phải tưởng tượng ví dụ như nếu mình làm 100 nghiên cứu về hiệu quả của vaccine, và mỗi nghiên cứu có 30,000 người, thì kết quả của 100 nghiên cứu đó sẽ dao động ra sao? Các nhà nghiên cứu có phương pháp thống kê giúp họ trả lời câu hỏi đó.
Chẳng hạn như hiệu quả của vaccine Oxford/AstraZeneca, công chúng chỉ nghe các quan chức y tế và chuyên gia bệnh truyền nhiễm rằng vaccine có hiệu quả 62% [1]. Từ bộ trưởng y tế, giáo sư y khoa, bác sĩ chuyên khoa cao cấp, kí giả, v.v. ai ai cũng đề cập đến con số 62%. Tuy nhiên, trong thực tế họ không để ý đến tác giả của công trình nghiên cứu báo cáo rằng tính trung bình thì hiệu quả là 62%, nhưng trong thực tế nó có thể dao động từ 41% đến 76%. Các bạn sẽ hỏi, “Ô, vậy hiệu quả thật là bao nhiêu?” Câu trả lời là không ai biết, kể cả tác giả bài báo cũng không biết. Họ chỉ có thể biết là nó dao động trong khoảng 41% đến 76%. Đó là một sự bất định mà ít ai trong công chúng để ý hay hiểu. Tất cả những gì mà chúng ta đang tuân thủ trong mùa dịch (như đeo khẩu trang, đứng cách nhau 1.5 mét, v.v.) cũng đều dựa vào một khoa học yếu ớt như thế.
Nhà khoa học có thể ví von như là kẻ mù sờ voi trong câu chuyện cổ tích. Người thì sờ được cái lưng và nghĩ nó giống cái đòn xóc; kẻ sờ được cái tai bèn suy đoán rằng nó giống cái quạt; lại có người sờ được cái đầu thì nghĩ nó như tảng đá. Chẳng có ai đúng, vì mỗi người chỉ sờ một cơ phận mà thôi. Tương tự, khoa học cũng chỉ ‘sờ’ được một mối liên quan và suy luận từ đó, nên xác suất sai sót rất cao.
Dương tính giả và âm tính giả
Sự bất định của khoa học nó không phải chỉ hiện diện trong một nghiên cứu, mà cần phải có cái nhìn toàn cục. Đa số nghiên cứu y khoa (tôi chỉ giới hạn trong y khoa) đều có mục tiêu tìm mối liên quan giữa yếu tố X và bệnh Y. Yếu tố X có thể là quá cân, hút thuốc lá, dùng bia rượu, dinh dưỡng, vận động thể lực, gen, môi trường, v.v. Trong thực tế, có hàng triệu yếu tố nguy cơ (nếu tính cả gen).
Còn bệnh thì có thể rất rất nhiều, có thể lên đến 100,000 bệnh. Chỉ tính riêng các bệnh hiếm (rare) thì con số đã có chừng 10,000 bệnh! Do đó, giới khoa học có nhiều lựa chọn nghiên cứu: người thì nghiên cứu về biến thể gen A với bệnh tiểu đường, kẻ khác thì tập trung vào biến thể gen A và bệnh đột quị, người kia thì biến thể gen B và ung thư, v.v. Ngày nay, nhà khoa học có trong tay 1 triệu biến thể gen để khai thác.
Đến đây thì các bạn đã thấy một thế giới cho nhà khoa học. Nếu có 1 triệu yếu tố nguy cơ và 100,000 bệnh thì số nghiên cứu y khoa có thể lên đến 100,000 triệu nghiên cứu! Bao nhiêu nghiên cứu trong sô 100,000 triệu nghiên cứu là sai?
Thật ra có 2 cái sai. Chúng ta quay lại bảng 2×2 trong cái note trước để hiểu vấn đề:
* Có thể kết quả nghiên cứu là ‘dương tính’ nhưng trong thực tế thì không có mối liên quan gì giữa X và Y. Đó là sai sót loại I, còn gọi là ‘dương tính giả’.
* Có thể kết quả nghiên cứu là ‘âm tính’ nhưng trong thực tế thì có mối liên quan giữaX và Y. Đó là sai sót loại II, còn gọi là ‘âm tính giả’.
Bất cứ nghiên cứu nào cũng có ‘nguy cơ’ phạm phải 2 sai sót đó.
Không có cách gì loại bỏ 2 sai sót đó. Chỉ có cách giảm thiểu sai sót. Cách giảm thiểu sai sót đơn giản nhứt là nghiên cứu trên cỡ mẫu lớn sao cho sai sót loại I chỉ 5% thôi, và sai sót loại II chỉ 20%. Giới khoa học sợ sai sót dương tính giả hơn là sai sót âm tính giả, nên chỉ chấp nhận dương tính giả 5%, còn âm tính giả thì có thể chấp nhận cao hơn. Nói cách khác, cứ mỗi lần nhà khoa học kiểm định một giả thuyết (bất cứ giả thuyết nào), xác suất họ có kết quả dương tính giả thường là 5%. Nói cách khác, cứ 100 lần kiểm định hay 100 nghiên cứu thì sẽ có chừng 5 nghiên cứu cho ra kết quả sai (hay dương tính giả).
Mỗi nghiên cứu có xác suất dương tính giả 5% có nghĩa rằng xác suất đúng là 95%. Do đó, nếu họ kiểm định 100 giả thuyết, thì xác suất đúng cả 100 lần là 0.95^100 = 0.006 (hay 0.6%). Nói cách khác, nếu họ kiểm định 100 giả thuyết, thì xác suất gần 100% (chính xác là 1 – 0.95^100 = 0.994) sẽ có một phát hiện hay khám phá ‘dỏm’ / sai.
Thước đo để định lượng sai sót trong nghiên cứu khoa học là trị số P (hay ‘P-value’). Trị số này do nhà thống kê học và di truyền học thiên tài tên là Ronald Fisher (người Anh) phát kiến vào đầu thế kỉ 20. Có thể nói không ngoa rằng trị số P là một ý tưởng cách mạng trong khoa học. Thế nhưng rất rất nhiều người không hiểu trị số P, nên diễn giải sai.
Thông thường, đa số giới khoa học diễn giải rằng nếu một mối liên quan có trị số P = 0.02 có nghĩa là xác suất sai sót dương tính giả là 2%, và suy ra xác suất đúng là 98%. Nhưng rất tiếc cách hiểu rất phổ biến đó sai.
Trị số P = 0.02 có nghĩa là nếu trong thực tế không có mối liên quan giữa X và Y, xác suất mà nhà khoa học quan sát được dữ liệu như hiện nay (hay dữ liệu cao/thấp hơn hiện nay) là 2%. Nó (trị số P) không trả lời câu hỏi mà chúng ta cần biết: xác suất có mối liên quan là bao nhiêu?
Ý nghĩa của trị số P cũng giống như trong phiên toà (phương Tây). Thoạt đầu, bị cáo phải được giả định là vô tội (khoa học: giả thuyết là không có mối liên quan giữa X và Y). Sau đó, công tố viên phải thu thập chứng cớ để chứng minh bị cáo có tội (khoa học: làm thí nghiệm để thu thập dữ liệu). Sau khi có dữ liệu và giả dụ rằng dữ liệu thuyết phục, công tố viên sẽ nói nếu bị cáo vô tội thì dữ liệu này không thể xảy ra, nhưng dữ liệu đã xảy ra nên bị cáo có tội (khoa học: nếu X và Y độc lập như theo giả thuyết thì dữ liệu r phải bằng 0, nhưng thí nghiệm cho thấy r = 0.9, nên phải bác bỏ giả thuyết). Đó chính là ý nghĩa của trị số P.
Trị số P có rất nhiều vấn đề. Vấn đề thứ nhứt là khó hiểu và có khi phi logic. Vấn đề lớn nhứt là nếu kiểm định nhiều giả thuyết (hay nhiều nghiên cứu) thì nó có thể cho ra kết quả dương tính giả. Do đó, vài năm gần đây, giới khoa học nghĩ ra một số cách để giảm thiểu những sai sót trong kết luận dựa vào trị số P. Những cách thức phổ biến nhứt và được áp dụng nhiều nhứt trong nghiên cứu qui mô lớn bao gồm:
Advertisement
· false discovery rate (FDR, tỉ lệ dương tính giả) do Benjamini và Hochberg đề xướng;
· trị số q do John Storey đề xướng. Vì dụ trị số q = 2% có nghĩa dễ hiểu là 2% các kết quả có ý nghĩa thống kê là sai (dương tính giả);
· local FDR (hay lFDR) do Brad Efron đề xướng. lFDR thuộc trường phái Bayes, và phản ảnh xác suất giả thuyết vô hiệu đúng.
Trong các cách thức trên, local FDR là có ý nghĩa thực tế nhứt. Local FDR trả lời câu hỏi: nếu tôi quan sát mối liên quan với trị số P = 0.04 (tức có ý nghĩa thống kê) thì xác suất không có mối liên quan là bao nhiêu? Câu trả lời tuỳ thuộc vào bao nhiêu kiểm định giả thuyết trong nghiên cứu. Nếu nghiên cứu kiểm định 15 giả thuyết thì lFDR = 0.41, có nghĩa là tuy kết quả có ý nghĩa thống kê, nhưng xác suất không có mối liên quan lên đến 41%. Chúng ta muốn xác suất này (lFDR) càng thấp, như 0.0001, càng tốt.
Do đó, một kết quả ‘có ý nghĩa thống kê’ chưa đủ mạnh để nói rằng nhà khoa học đúng. Nhưng hiẹn nay — ngay bây giờ — kết quả nào về covid-19 với trị số P < 0.05 đều được xem là ‘khám phá’. Rất nhiều nhà khoa học trong dịch tễ học không nhận thức được điều này (nên sai sót quá nhiều trong dịch tễ học), nhưng giới nghiên cứu về di truyền thì đã ‘thấm’ từ lâu.
Tóm lại, bất cứ kết quả nghiên cứu khoa học nào cũng mang tính bất định. Bất định ở đây hiểu theo nghĩa kết quả đó có thể sai, nhưng cũng có thể đúng, và nhà khoa học không bao giờ dám nói chắc chắn. Nói như vậy không có nghĩa là khoa học vứt đi hay vô dụng; ngược lại, như nói trên nó là cái tốt nhứt chúng ta có. Vấn đề là sử dụng khoa học trong bối cảnh và cẩn thận.
Trong khoa học Covid-19 sự bất định càng cao, và chúng ta phải rất dè dặt với những chuyên gia nói như đinh đóng cột. Giáo sư George Davey Smith từng viết rằng những chuyên gia nào phát biểu càng khẳng định về covid-19, thì chúng ta càng ít tin vào chuyên gia đó (The more certain someone is about covid-19, the less you should trust them) [3].
Do đó, khi nghe ông Biden nói để cho khoa học dẫn đường trong chánh sách covid-19 tôi cảm thấy ‘mixed feeling’. Tôi nghĩ rằng đó là tín hiệu tích cực, nhưng những chánh sách có ảnh hưởng đến nhiều triệu người không nên lệ thuộc chỉ vào khoa học, mà còn phải cân nhắc đến tình hình thực tế và kinh tế nữa. Không phải ngẫu nhiên mà phe bảo thủ trong chánh phủ Trump (như Peter Navarro) không đồng ý với những khuyến cáo của giới khoa học (như A. Fauci).
Quay lại ý tưởng khoa học như người mù sờ voi, tôi lại trích dẫn Richard Feynman nữa như là một lời kết: Khi bạn biết nhiều hơn, bạn biết mình không biết nhiều hơn! Những gì bạn biết là trong cái vòng tròn, và bạn không biết những gì ngoài cái vòng tròn. Chu vi cái vòng tròn là cái bạn biết rằng mình không biết. Khi bạn có nhiều kiến thức hơn, cái vòng tròn cũng lớn hơn và chu vi của nó cũng rộng hơn.
TB: Nói xa không qua nói gần, cái note này chỉ nhằm giới thiệu bài giảng mới nhứt về FDR, q-value, local FDR, v.v. trên kênh youtube của tôi:
____________