Phân biệt giữa chuyên ngành ứng dụng và công cụ trong phân tích dữ liệu y khoa
Nguồn: Lê Ngọc Khả Nhi – Biomedical Data Science Initiativies
-
Trong ngành Y khoa, nên tiến hành dự án nghiên cứu thuận theo tiến trình tự nhiên (đi từ vấn đề thiết thực/câu hỏi/giả thuyết, tự thu thập dữ liệu và làm thí nghiệm, và tìm đến giải pháp/kết quả), chứ không phải ngược lại – tức là công bố khoa học chỉ để giới thiệu hay khảo sát một công cụ thống kê nào đó, nói cách khác vai trò của bác sĩ là nhận ra và giải quyết vấn đề của ngành Y, không nên làm thay công việc của những khoa học gia ngành Computer science, statistics.
-
Tuy nhiên, các bác sĩ cần chủ động học tập suốt đời để cập nhật kiến thức về phương pháp, công cụ nhằm phát hiện giải pháp mới, thậm chí khi chúng chưa được sử dụng trong ngành Y khoa. Nên suy nghĩ cởi mở và sáng tạo thay vì chỉ đi theo lối mòn duy nhất.
Tuần trước, có bạn đồng nghiệp chia sẻ với Nhi về một workshop Phân tích dữ liệu được tổ chức tại một bệnh viện chuyên khoa. Những năm gần đây, những khóa học như thế này trở nên phổ biến. Đây là một tín hiệu đáng mừng cho thấy, ngoài chuyên môn, ban lãnh đạo bệnh viện đã quan tâm đến kỹ năng nghiên cứu khoa học, hỗ trợ các bác sĩ tự hoàn thiện khả năng phân tích dữ liệu của mình.Tuy nhiên, khi xem chương trình khóa học, Nhi nhận ra một chi tiết có thể gây ngộ nhận. Một cách cụ thể, người ta dành hẳn 2 ngày để học lý thuyết, thực hành (bằng STATA) chuyên đề “Thống kê cơ bản ứng dụng trong nghiên cứu bệnh lý X”.Vấn đề ở đây, đó là cách tiếp cận này dễ gây hiểu lầm rằng có một số kỹ thuật, công cụ, phương pháp X,Y,Z chuyên biệt cho một chuyên khoa A,B,C, hay một bệnh lý nào đó (thí dụ Ung thư).Sự hiểu lầm này rất phổ biến, Nhi từng nghe nghiên cứu sinh phát biểu: kỹ thuật X chuyên dùng phân tích dữ liệu genomic, tôi làm trong ngành Môi trường, có sử dụng được kỹ thuật này hay không ?Cách suy nghĩ này nguy hiểm ở chỗ, nó giới hạn tư duy của người học trong một chiếc hộp, chỉ biết làm một vài thứ, dùng máy móc cùng một công cụ cho hàng loạt vấn đề, và tự thỏa mãn với những thứ mình đã có, đã biết, thường làm.Do đó, rất nhiều lần Nhi đã nhấn mạnh về sự cần thiết phải phân biệt giữa Chuyên ngành/lĩnh vực ứng dụng và Phương pháp/công cụ.Trong sơ đồ, Nhi mô tả đơn giản về sự tham gia của Thống kê vào nghiên cứu y học, cho phép giải quyết những vấn đề/câu hỏi thực tiễn.Ban đầu, một vấn đề, thí dụ thực thể bệnh lý, hiện tượng sinh lý bệnh… đã luôn ở đó, trong thế giới lâm sàng. Mỗi bác sĩ quan sát, cảm nhận vấn đề đó theo lăng kính và góc nhìn cá nhân, theo nhiều chiều hướng khác nhau, tùy theo chuyên khoa, kiến thức, logic khoa học và sự nhạy cảm của mình.Từ quan sát, sinh ra giả thuyết khoa học, câu hỏi nghiên cứu, thiết kế thí nghiệm để thu thập dữ liệu. Câu hỏi, giả thuyết được phiên dịch sang ngôn ngữ thống kê thành một bài toán; và từ lúc đó người bác sĩ bước qua lằn ranh của thế giới thống kê, nơi có rất nhiều công cụ. Trong số đó, một vài công cụ có thể phù hợp và được dùng như giải pháp cho vấn đề.Có những công cụ phổ quát dùng được cho nhiều vấn đề khác nhau, có công cụ chỉ giải quyết được 1 bộ phận nhỏ vấn đề, có những công cụ kết nối với nhau thành quy trình để giải quyết toàn bộ vấn đề, có giải pháp đúng và giải pháp tối ưu, phức tạp và đơn giản, …Thí dụ: Phân tích cụm và network analysis rất phổ biến trong lĩnh vực genomic, đối tượng áp dụng là gene expression – nhưng chúng cũng dùng rất hiệu quả cho đối tượng là triệu chứng, biomarkers, trong mọi bệnh lý, chuyên khoa lâm sàng.Theo cùng cơ chế đó, những algorithm Machine learning như XGboost, Random Forest xuất hiện nhiều hơn trong các tạp chí chuyên khoa lâm sàng, thế chỗ cho Cox PH và logistic model cổ điển…Không gian phương pháp/công cụ và Chuyên khoa/ngành đều có giới hạn tương đối, cả 2 đều có thể mở rộng và thay hình đổi dạng rất nhanh.Sự chồng lắp giữa chúng là những giải pháp được đề nghị cho một số vấn đề: chỉ là phần nổi của tảng băng, thứ mà ta nhìn thấy trong y văn, công bố khoa học, các hội nghị…Chính phần còn lại bị ẩn đi, mới thực sự thú vị. Đó là những vấn đề chưa được giải quyết, những công cụ mới chưa được thử nghiệm.Khai thác những vùng này chính là cách tạo ra tính độc đáo cho công bố mới của bạn.Thông điệp rút ra từ sơ đồ này:-
Trong ngành Y khoa, nên tiến hành dự án nghiên cứu thuận theo tiến trình tự nhiên (đi từ vấn đề thiết thực/câu hỏi/giả thuyết, tự thu thập dữ liệu và làm thí nghiệm, và tìm đến giải pháp/kết quả), chứ không phải ngược lại – tức là công bố khoa học chỉ để giới thiệu hay khảo sát một công cụ thống kê nào đó, nói cách khác vai trò của bác sĩ là nhận ra và giải quyết vấn đề của ngành Y, không nên làm thay công việc của những khoa học gia ngành Computer science, statistics.
-
Tuy nhiên, các bác sĩ cần chủ động học tập suốt đời để cập nhật kiến thức về phương pháp, công cụ nhằm phát hiện giải pháp mới, thậm chí khi chúng chưa được sử dụng trong ngành Y khoa. Nên suy nghĩ cởi mở và sáng tạo thay vì chỉ đi theo lối mòn duy nhất.
-