[Guidelines] Thí nghiệm thứ 2 cho project ‘xgboost ứng dụng’.

vừa thực hiện xong thí nghiệm thứ 2 cho project ‘xgboost ứng dụng’. Trong thí nghiệm này ta dùng cơ chế tập hợp hình cây quyết định của xgboost để chọn ra tổ hợp 50-100 genes nhất phân biệt tuyến vú , từ một bộ dữ liệu 1926 genes. Tương tự với random forest, đơn vị cấu trúc của xgbbost là cácbooster, trong mỗi booster là quy luật hình cây từ 1 hay nhiều features; thông tin importance gain của mỗi features được theo dõi và ghi lại trong từng booster. Ta có thể biết hình xgboost đã dùng bao nhiêu genes để đạt trãng thái tối ưu ?, tính gain importance trung bình cho mỗi gene, biết cách thức mà các gene phối hợp với nhau trong các booster, và chuyển thông tin cấu trúc này thành sơ đồ mạng lưới.

Advertisement

Nguồn: Lê Ngọc Khả – Biomedical Data Science Initiativies

Advertisement

Giới thiệu Lac Thu

Avatar

Like page Y lâm sàng để cập nhật những thông tin và bài viết mới nhất!

Check Also

[Guidelines] Chia sẻ các điểm chính của 12 hướng dẫn lâm sàng năm 2020 và cuối 2019 (NEJM keypoints)

Toàn bộ bản tóm tắt 12 guidelines tại link sau: https://bit.ly/2TyOVbo Cập nhật hướng dẫn về …