P LÀ GÌ? P < 0.05 NGHĨA LÀ LÀM SAO?
Nguồn: Med Lang Fanatic
P value là khái niệm được gặp thấy lặp đi lặp lại trong các nghiên cứu. Thường trong các nghiên cứu, nếu p < 0.05 thì người ta gọi kết quả nghiên cứu đó có ý nghĩa thống kê (statistically significant).
Vậy P thực sự là gì?
Nếu bạn thông minh tuyệt đỉnh siêu nhân đầu óc hào quang lấp lánh ánh kim cương, chỉ cần nhớ trong đầu định nghĩa “đơn giản” sau: “P value is the probability that the data would be at least as extreme as those observed, if the null hypothesis were true.”
Dễ hiểu mà ha. 😐😐😐
Có một số tác giả cố gắng diễn giải dễ hiểu hơn như sau: “The p-value is the likelihood of the observed data, given that the null hypothesis is true.”
DIễn giải một cách bình dân học vụ hơn, P là viết tắt của probability, có nghĩa là “khả năng xảy ra” của …. (… là gì thì đọc tiếp đi ha).
Chúng ta có 2 loại giả thuyết, là null hypothesis (giả thuyết vô hiệu) và alternative hypothesis. Null hypothesis là giả thuyết rằng chả có gì hấp dẫn xảy ra cả, chả có sự khác biệt giữa các nhóm nghiên cứu, chả có sự khác biệt giữa các loại can thiệp điều trị, chả có cái mốc xì gì khác biệt cả. Alternative hypothesis là giả thuyết đảo của null hypothesis, nghĩa là có sự khác biệt thật sự giữa 2 nhóm nghiên cứu, là có sự khác biệt thật sự giữa các loại can thiệp điều trị, là có cái mốc xì gì đấy mà mình quan tâm.
Vì alternative hypothesis là đảo của null hypothesis, nên nếu null hypothesis là sai, thì coi như alternative hypothesis đúng.
P value là khả năng xảy ra của kết quả nghiên cứu (những dữ liệu mà chúng ta đã thu được, số liệu tỷ lệ các thứ) khi null hypothesis đúng. Nếu xác suất xảy ra của kết quả nghiên cứu (mà chúng ta đã thu được, nằm gọn trước mắt chúng ta) quá thấp (<0.05), có nghĩa là “thế ếu nào có thể xảy ra được nếu null hypothesis đúng”, chúng ta bác bỏ null hypothesis và chấp nhận alternative hypothesis.
Ví dụ đi ha.
Giả dụ là bạn đã có con, và con của bạn lười đánh răng kinh khủng. Một buổi tối nọ bạn lên phòng bất ngờ kiểm tra, thấy bàn chải đánh răng khô queo. Thằng con của bạn thì cứ khăng khăng là đánh răng rồi. Bạn bắt đầu dùng đầu óc thống kê phân tích để suy luận.
Result thu được ở đây là bàn chải đánh răng khô queo. Null hypothesis là con bạn trung thực (đã đánh răng). Alternative hypothesis là con bạn xạo ke (chưa đánh răng).
Khả năng bàn chải khô queo trong trường hợp con bạn đã đánh răng vài phút trước đó là cực kỳ khó xảy ra, xác suất xảy ra chỉ là 1 phần 10,000 mà thôi (theo các phương pháp tính toán thần thánh tưởng tượng). Do đó, p = 1/10,000 và hiển nhiên p < 0.05. Cho nên chúng ta bác bỏ null hypothesis, có nghĩa là bạn không tin con bạn trung thực. Bạn tin là con bạn nói dối. Bạn thưởng cho con bạn vài hèo vào mông.
Một ví dụ khác.
Một bữa nọ mình chơi tennis, và thắng Roger Federer (trong trường hợp bạn không biết, thì đây là một trong những huyền thoại tennis giỏi nhất mọi thời đại).
Giả sử như Roger Federer chơi đúng sức, không nhường mình, thì khả năng xảy ra chuyện mình thắng rất thấp, chắc cỡ 1 phần triệu. P = 1 phần triệu. Khả năng thấp như vậy mà xảy ra rành rành trước mắt, thì có vẻ Roger Federer không chơi đúng sức. P < 0.05, bạn bác bỏ null hypothesis và chấp nhận alternative hypothesis.
Đó. P value là vậy đó. Tưởng là khó lắm mà cũng không đến nỗi khó lắm.
Bạn đã ok chưa nè?