Chào các bạn đồng nghiệp tương lai và hiện tại!
Chắc hẳn trong quá trình học tập và làm việc, chúng mình đều quen thuộc với Excel. Nhưng liệu Excel có phải là “chân ái” duy nhất trong phân tích dữ liệu y khoa?
Hôm nay, chúng mình cùng nhau khám phá “sức mạnh” của R và so sánh với Excel, để xem khi nào “em R” thể hiện ưu thế vượt trội nhé! 




Phân tích dữ liệu giúp chúng mình:




Và để làm được điều đó, chúng mình cần những công cụ mạnh mẽ, chính xác. Cùng “mổ xẻ” R và Excel nhé!
Phần 1: “Diện kiến” R và Excel
* R:

* Xử lý dữ liệu lớn “siêu đỉnh”.
* Tích hợp vô số gói thư viện chuyên sâu (ví dụ: `dplyr` để biến đổi dữ liệu, `tidyr` để làm sạch dữ liệu, `ggplot2` để tạo biểu đồ “xịn xò”).
* Excel:

* Giao diện thân thiện, trực quan.
* Dễ dàng thực hiện các phép tính đơn giản, tạo bảng biểu.

Phần 2: “So găng” khả năng phân tích dữ liệu
* R:



Chúng mình có thể dùng R để:
* Đọc dữ liệu từ file CSV: `data <- read.csv(“du_lieu_tim_mach.csv”)`
* Tạo mô hình hồi quy logistic để đánh giá các yếu tố nguy cơ: `model <- glm(dau_tim ~ tuoi + gioi_tinh + huyet_ap + cholesterol + hut_thuoc + tien_su_gia_dinh, data = data, family = binomial)`
* Trực quan hóa kết quả bằng biểu đồ: `ggplot(data, aes(x = tuoi, y = dau_tim)) + geom_point() + geom_smooth(method = “glm”, method.args = list(family = “binomial”))`
* Excel:



Phần 3: “Điểm tên” những điều Excel không thể làm được
1. Khả năng xử lý dữ liệu lớn:

2. Tích hợp các gói thư viện chuyên sâu:

* `survival`: phân tích thời gian sống (ví dụ: thời gian sống thêm của bệnh nhân ung thư).
* `lme4`: phân tích mô hình hỗn hợp (ví dụ: đánh giá hiệu quả của thuốc trên nhiều bệnh nhân, mỗi bệnh nhân có nhiều lần đo).
3. Biểu đồ hóa và trực quan hóa dữ liệu:

4. Phân tích đa biến và mô hình hóa:

Phần 4: Ví dụ thực tế “mắt thấy tai nghe”

* R: Chúng mình có thể sử dụng gói `survival` để phân tích thời gian sống thêm của bệnh nhân, so sánh giữa nhóm điều trị mới và nhóm điều trị chuẩn. Chúng mình cũng có thể sử dụng `ggplot2` để tạo biểu đồ Kaplan-Meier, trực quan hóa kết quả.
* Excel: Excel có thể vẽ được đường cong sống còn, tuy nhiên các phân tích nâng cao như so sánh các đường cong sống còn bằng log-rank test sẽ khó thực hiện hơn.
Kết luận

* Sử dụng Excel khi:
* Phân tích dữ liệu đơn giản, số lượng nhỏ.
* Cần tạo bảng biểu, báo cáo nhanh.
* Sử dụng R khi:
* Phân tích dữ liệu lớn, phức tạp.
* Cần các phương pháp phân tích thống kê chuyên sâu.
* Muốn tạo biểu đồ trực quan, tùy biến cao.
Hy vọng bài viết này giúp các bạn hiểu rõ hơn về R và Excel. Đừng ngại thử sức với R, vì nó sẽ mở ra một thế giới mới trong phân tích dữ liệu y khoa
Advertisement