Ước tính thông số của mô hình hồi qui logistic bằng R-Nguyễn Công Trình
Ước tính thông số của mô hình hồi qui logistic bằng R
Ở đây, tôi sẽ hướng dẫn cách phân tích số liệu trên bằng R. Trước khi phân tích,
cần phải nhập dữ liệu vào một khuôn khổ mà R có thể “đọc” được. Để tiện cho việc theo
dõi, tôi trình bày bảng số liệu một lần nữa ở đây:
Ở đây, chúng ta có hai biến, gọi tắt là ao và cancer; mỗi biến có hai giá trị: 0 (không)
và 1 (có). Trong nhóm ao = 1 (phơi nhiễm) có 28 đối tượng, và trong số này có 11
người bị ung thư; trong nhóm ao = 1 (không phơi nhiễm) có 143 đối tượng và trong số
này có 36 người bị ung thư. Chúng ta sẽ “bố trí” số liệu trên bằng R như sau:
ao <- c(1, 0)
ntotal <- c(28, 163)
cancer <- c(11, 36)
proportion <- cancer/ntotal
Chú thích:
Dòng 1 định nghĩa biến ao có hai giá trị 1 và 0 (chú ý dấu <- có nghĩa
tương đương như dấu bằng “=”);
• Dòng 2 định nghĩa biến ntotals, và cho biết ao=1 có 28 đối tượng,
ao=0 có 163 đối tượng;
• Dòng 3 định nghĩa biến cancer, và cho biết ao=1 có 11 đối tượng,
ao=0 có 36 đối tượng;
• Dòng 4 định nghĩa biến proportion bằng cancer chia cho
ntotals, có nghĩa là tỉ lệ ung thư cho từng nhóm ao.
Sau khi đã nhập số liệu, chúng ta đã sẵn sàng phân tích. Trong R có hàm glm
chuyên dụng cho phân tích hồi qui logistic. Cách viết hàm này đã được mô tả trong sách
của tôi. Ở đây, tôi chỉ giải thích ngắn gọn như sau:
logistic <- glm(proportion ~ ao, family=”binomial”,
weight=ntotal)
Trong lệnh trên, chúng ta yêu cầu R sử dụng hàm glm để mô tả proportion
như là một hàm số của ao (chú ý dấu ~ có nghĩa là mô hình), và phân phối của
proportion là phân phối nhị phân (binomial) vì chỉ có 2 giá trị. Ngoài ra, trong
lệnh trên, chúng ta còn cho một thông số weight=ntotal. Thông số weight yêu
cầu R sử dụng ntotal là một số tóm lược (thay vì một bệnh nhân).
Kết quả phân tích được lưu trữ đối tượng có tên là logistic (tất nhiên, chúng
ta có thể thay đổi với một tên nào khác mà mình thích). Bây giờ, chúng ta có thể xem
qua kết quả phân tích bằng cách lệnh summary đối tượng logistic như sau:
summary(logistic)
Comments
Post a Comment