Chào mừng các bạn đến với trang của Học Viện MedAcademy!
Hôm nay, chúng mình sẽ cùng nhau khám phá một “siêu năng lực” mà bất kỳ sinh viên y khoa hay bác sĩ lâm sàng nào cũng nên trang bị trong hành trình chinh phục đỉnh cao nghề nghiệp của mình: ngôn ngữ lập trình R! 




Trong kỷ nguyên số, dữ liệu y khoa ngày càng đồ sộ và phức tạp. Việc phân tích thủ công không còn hiệu quả. R nổi lên như một công cụ “must-have” nhờ khả năng:





Fanpage của chúng mình đã giới thiệu về R trong các bài post trước đây. Về cơ bản, R là một ngôn ngữ lập trình và môi trường phần mềm tự do chuyên dụng cho tính toán thống kê và đồ họa. R không chỉ là một phần mềm, mà là một cộng đồng lớn mạnh với vô vàn gói (packages) được phát triển liên tục, đáp ứng mọi nhu cầu phân tích dữ liệu trong y khoa.




Ví dụ: Trong một nghiên cứu đánh giá hiệu quả của thuốc mới điều trị tăng huyết áp, chúng ta có các biến số như huyết áp tâm thu (mmHg), huyết áp tâm trương (mmHg), tuổi (năm), giới tính (nam/nữ), và chỉ số BMI (kg/m2).
* Phân tích kết quả chính và thứ cấp: Sử dụng hàm `lm()` để xây dựng mô hình hồi quy tuyến tính, đánh giá sự khác biệt về huyết áp giữa nhóm dùng thuốc và nhóm placebo, sau khi điều chỉnh cho các yếu tố nhiễu.
* Phân tích sự sống còn: Nếu nghiên cứu theo dõi biến cố tim mạch (ví dụ: nhồi máu cơ tim, đột quỵ), chúng ta có thể sử dụng gói `survival` để vẽ đường cong Kaplan-Meier, so sánh thời gian sống sót không biến cố giữa các nhóm bằng kiểm định Log-rank.
* Phân tích an toàn: Sử dụng các phép kiểm định thống kê (ví dụ: Chi-square test) để so sánh tỷ lệ tác dụng phụ giữa các nhóm.

Ví dụ: Nghiên cứu về ảnh hưởng của liều dùng thuốc kháng sinh A lên nồng độ thuốc trong huyết tương và hiệu quả diệt khuẩn trên bệnh nhân nhiễm trùng huyết.
* Phân tích PK: Sử dụng các gói như `nlme` để xây dựng mô hình phi tuyến tính hỗn hợp (nonlinear mixed-effects model), ước tính các thông số PK như diện tích dưới đường cong (AUC), thời gian bán thải (t1/2), độ thanh thải (CL).
* Phân tích PD: Sử dụng mô hình Emax để mô tả mối quan hệ giữa nồng độ thuốc và hiệu quả diệt khuẩn, từ đó xác định liều dùng tối ưu.

Ví dụ: Nghiên cứu về sự lây lan của dịch COVID-19 tại một thành phố.
* Phân tích xu hướng: Sử dụng hàm `ts()` để tạo chuỗi thời gian, sau đó sử dụng các mô hình ARIMA để dự báo số ca mắc mới trong tương lai.
* Đánh giá rủi ro: Sử dụng hồi quy logistic để xác định các yếu tố nguy cơ (ví dụ: tuổi, bệnh nền) liên quan đến khả năng mắc bệnh nặng.
* Mô hình hóa sự bùng phát dịch bệnh: Sử dụng các mô hình dịch tễ học (ví dụ: mô hình SIR) để mô phỏng sự lây lan của dịch bệnh và đánh giá hiệu quả của các biện pháp can thiệp.

* `tidyverse`: “Bộ sưu tập” các gói giúp xử lý và biến đổi dữ liệu dễ dàng (ví dụ: `dplyr`, `ggplot2`).
* `ggplot2`: Tạo ra những biểu đồ “chất như nước cất”.
* `survival`: Phân tích sống còn chuyên nghiệp.
* `lme4`: Xây dựng mô hình tuyến tính hỗn hợp và mô hình phi tuyến tính hỗn hợp.
* `emmeans`: Ước tính trung bình biên và so sánh các nhóm.
* `gt`: Tạo bảng biểu đẹp mắt và chuyên nghiệp.
* `ctrdata`: Phân tích dữ liệu từ thử nghiệm lâm sàng.


Hội đồng xét duyệt học bổng luôn đánh giá cao những ứng viên có kỹ năng nghiên cứu độc lập. Sử dụng R thành thạo chứng tỏ bạn:





Hãy chia sẻ kinh nghiệm của bạn về việc sử dụng R trong nghiên cứu ở phần bình luận nhé! Chúng mình luôn sẵn sàng lắng nghe và hỗ trợ các bạn. 

Advertisement