Deskripsi
Analisis regresi logistik biner adalah metode statistik yang digunakan untuk memodelkan hubungan antara satu atau lebih variabel independen dengan variabel dependen yang bersifat biner atau dikotomis (memiliki dua kategori, seperti "ya" dan "tidak" atau "0" dan "1"). Analisis ini sangat berguna untuk memprediksi kemungkinan terjadinya suatu peristiwa berdasarkan sejumlah faktor prediktor. Tidak seperti regresi linear, yang digunakan untuk variabel dependen kontinu, regresi logistik biner menggunakan fungsi logit untuk menghubungkan variabel dependen biner dengan variabel independen, menghasilkan output berupa probabilitas. Misalnya, analisis regresi logistik biner dapat digunakan untuk memprediksi apakah seorang pasien menderita penyakit tertentu (positif/negatif) berdasarkan faktor-faktor seperti usia, jenis kelamin, dan gaya hidup. Keunggulan metode ini terletak pada kemampuannya untuk menangani variabel independen yang bersifat kontinu, ordinal, maupun kategorikal, serta untuk mengukur seberapa kuat pengaruh setiap prediktor terhadap peluang kejadian hasil tertentu.
Misalkan sebuah rumah sakit ingin memprediksi apakah seorang pasien akan mengalami serangan jantung (hasil biner: "ya" atau "tidak") berdasarkan beberapa faktor risiko. Misalnya, rumah sakit mengumpulkan data tentang usia pasien, tekanan darah, kadar kolesterol, indeks massa tubuh (BMI), dan apakah pasien merokok atau tidak. Variabel dependen dalam analisis ini adalah "terjadi serangan jantung" dengan kategori "ya" (1) dan "tidak" (0). Menggunakan analisis regresi logistik biner, rumah sakit dapat menentukan bagaimana masing-masing faktor risiko ini berhubungan dengan kemungkinan serangan jantung. Misalnya, hasil analisis mungkin menunjukkan bahwa:
- Usia: Dengan setiap peningkatan usia 5 tahun, kemungkinan mengalami serangan jantung meningkat sebesar 30%.
- Tekanan Darah: Tekanan darah tinggi secara signifikan meningkatkan peluang serangan jantung, dengan odds ratio (OR) sebesar 2,5.
- Merokok: Pasien yang merokok memiliki peluang dua kali lipat lebih tinggi mengalami serangan jantung dibandingkan yang tidak merokok.
- Kadar Kolesterol dan BMI: Kedua variabel ini juga mungkin menunjukkan hubungan signifikan dengan serangan jantung, tetapi mungkin dalam tingkat yang berbeda.
Hasil analisis ini menghasilkan model yang bisa digunakan untuk memperkirakan probabilitas bahwa seorang pasien dengan karakteristik tertentu akan mengalami serangan jantung.