✅ The verified answer to this question is available below. Our community-reviewed solutions help you understand the material better.
Problem klasifikasi biner dengan input \mathbf {x} = (1,x_{1},\dots,x_{D}) dapat diselesaikan setidaknya dengan dua cara.
Cara pertama menggunakan model logistic regression y = \mathrm {Sigmoid}(\mathbf {w}^{\top }\mathbf {x}) dengan
\mathbf {w} vektor parameter berdimensi
D+1 dan
y\in \{0,1\}.
Cara kedua menggunakan model softmax regression \mathbf {y} = \mathrm {Softmax}(\mathbf {W}\mathbf {x}) dengan
\mathbf {W} matriks parameter berdimensi
2\times (D+1) dan
\mathbf {y} vektor biner berdimensi 2. Pada model softmax regression tersebut, matriks
\mathbf {W} berisi 2 baris, yakni
\mathbf {w}_{0}^{\top } dan
\mathbf {w}_{1}^{\top } berdimensi
D+1, masing-masing terkait dengan kelas 0 dan kelas 1.
Andaikan sebuah model softmax regression \mathbf {y} = \mathrm {Softmax}(\mathbf {W}\mathbf {x}) untuk tugas klasifikasi biner sudah dilatih secara optimal berdasarkan himpunan data latih tertentu yang diberikan.
Maka, sebuah model logistic regression y = \mathbf {w}^{\top }\mathbf {x} yang optimal dan ekivalen dengan model softmax regression tersebut dapat diperoleh dengan melakukan transformasi berikut (ekivalen artinya menyelesaikan tugas yang sama dengan data latih yang sama dan hasil prediksi yang sama):