Ước tính thông số của mô hình hồi qui logistic bằng R-Nguyễn Công Trình


Ước tính thông số của mô hình hồi qui logistic bằng R

Ở đây, tôi sẽ hướng dẫn cách phân tích số liệu trên bằng R. Trước khi phân tích, cần phải nhập dữ liệu vào một khuôn khổ mà R có thể “đọc” được. Để tiện cho việc theo dõi, tôi trình bày bảng số liệu một lần nữa ở đây:

Ở đây, chúng ta có hai biến, gọi tắt là ao và cancer; mỗi biến có hai giá trị: 0 (không) và 1 (có). Trong nhóm ao = 1 (phơi nhiễm) có 28 đối tượng, và trong số này có 11 người bị ung thư; trong nhóm ao = 1 (không phơi nhiễm) có 143 đối tượng và trong số này có 36 người bị ung thư. Chúng ta sẽ “bố trí” số liệu trên bằng R như sau: 
ao <- c(1, 0) 
ntotal <- c(28, 163)
 cancer <- c(11, 36) 
proportion <- cancer/ntotal

Chú thích:
Dòng 1 định nghĩa biến ao có hai giá trị 1 và 0 (chú ý dấu <- có nghĩa tương đương như dấu bằng “=”); 
• Dòng 2 định nghĩa biến ntotals, và cho biết ao=1 có 28 đối tượng, ao=0 có 163 đối tượng;
 • Dòng 3 định nghĩa biến cancer, và cho biết ao=1 có 11 đối tượng, ao=0 có 36 đối tượng; 
• Dòng 4 định nghĩa biến proportion bằng cancer chia cho ntotals, có nghĩa là tỉ lệ ung thư cho từng nhóm ao.
 Sau khi đã nhập số liệu, chúng ta đã sẵn sàng phân tích. Trong R có hàm glm chuyên dụng cho phân tích hồi qui logistic. Cách viết hàm này đã được mô tả trong sách của tôi. Ở đây, tôi chỉ giải thích ngắn gọn như sau:
logistic <- glm(proportion ~ ao, family=”binomial”, weight=ntotal) 
Trong lệnh trên, chúng ta yêu cầu R sử dụng hàm glm để mô tả proportion như là một hàm số của ao (chú ý dấu ~ có nghĩa là mô hình), và phân phối của proportion là phân phối nhị phân (binomial) vì chỉ có 2 giá trị. Ngoài ra, trong lệnh trên, chúng ta còn cho một thông số weight=ntotal. Thông số weight yêu cầu R sử dụng ntotal là một số tóm lược (thay vì một bệnh nhân).
Kết quả phân tích được lưu trữ đối tượng có tên là logistic (tất nhiên, chúng ta có thể thay đổi với một tên nào khác mà mình thích). Bây giờ, chúng ta có thể xem qua kết quả phân tích bằng cách lệnh summary đối tượng logistic như sau: 
summary(logistic)


Comments