Kas ir apjukuma matrica?
Apjukuma matrica ir veiktspējas mērīšanas tehnika mašīnmācīšanās klasifikācijai. Tā ir sava veida tabula, kas palīdz uzzināt klasifikācijas modeļa veiktspēju testa datu kopā, lai būtu zināmas patiesās vērtības. Pats termins sajaukšanas matrica ir ļoti vienkāršs, taču ar to saistītā terminoloģija var būt nedaudz mulsinoša. Šeit ir sniegts vienkāršs šīs tehnikas skaidrojums.
Šajā apmācībā jūs uzzināsiet,
- Kas ir apjukuma matrica?
- Četri neskaidrības matricas rezultāti
- Apjukuma matricas piemērs:
- Kā aprēķināt neskaidrības matricu
- Citi svarīgi termini, izmantojot sajaukšanas matricu
- Kāpēc jums nepieciešama apjukuma matrica?
Četri neskaidrības matricas rezultāti
Apjukuma matrica vizualizē klasifikatora precizitāti, salīdzinot faktiskās un prognozētās klases. Binārā sajaukšanas matrica sastāv no kvadrātiem:

- TP: Patiesi pozitīvs: Paredzētās vērtības ir pareizi paredzētas kā faktiskas pozitīvas
- FP: Paredzētās vērtības nepareizi paredzēja faktisko pozitīvo. ti, negatīvās vērtības tiek prognozētas kā pozitīvas
- FN: Viltus negatīvs: pozitīvas vērtības tiek prognozētas kā negatīvas
- TN: patiess negatīvs: pareģotās vērtības ir pareizi paredzētas kā faktiskais negatīvs
Precizitātes testu varat aprēķināt no neskaidrības matricas:
Apjukuma matricas piemērs:
Apjukuma matrica ir noderīga mašīnmācīšanās metode, kas ļauj izmērīt atsaukšanas, precizitātes, precizitātes un AUC-ROC līkni. Zemāk sniegts piemērs, lai uzzinātu jēdzienus Patiesi pozitīvs, Patiesi negatīvs, Nepatiesi negatīvs un Patiesi negatīvs.
Patiesi pozitīvs:
Jūs prognozējāt pozitīvu, un tas izrādās patiess. Piemēram, jūs bijāt paredzējis, ka Francija uzvarēs pasaules kausu, un tā arī uzvarēja.
Īsts negatīvs:
Kad jūs paredzējāt negatīvu, un tā ir taisnība. Jūs bijāt paredzējuši, ka Anglija neuzvarēs un tā zaudēja.
Viltus pozitīvs:
Jūsu prognoze ir pozitīva, un tā ir nepatiesa.
Jūs bijāt paredzējuši, ka Anglija uzvarēs, taču tā zaudēja.
Viltus negatīvs:
Jūsu prognoze ir negatīva, un rezultāts ir arī nepatiesa.
Jūs bijāt paredzējis, ka Francija neuzvarēs, taču tā uzvarēja.
Jums jāatceras, ka prognozētās vērtības mēs raksturojam kā patiesas vai nepatiesas, vai pozitīvas un negatīvas.
Kā aprēķināt neskaidrības matricu
Šeit soli pa solim tiek aprēķināts neskaidrības matrica datu ieguvē
- 1. solis. Pirmkārt, jums jāpārbauda datu kopa ar paredzamajām rezultātu vērtībām.
- 2. solis. Paredziet visas testa datu kopas rindas.
- 3. solis. Aprēķiniet paredzamās prognozes un rezultātus:
- Katras klases pareizo pareģojumu kopskaits.
- Katras klases nepareizo pareģojumu kopskaits.
Pēc tam šie skaitļi tiek sakārtoti zemāk norādītajās metodēs:
- Katra matricas rinda ir saistīta ar paredzamo klasi.
- Katra matricas kolonna atbilst faktiskajai klasei.
- Pareizās un nepareizās klasifikācijas kopskaits tiek ievadīts tabulā.
- Pareizu klases pareģojumu summa nonāk šīs klases vērtības prognozētajā kolonnā un gaidāmajā rindā.
- Nepareizu klases pareģojumu summa nonāk paredzamajā rindā šai klases vērtībai un paredzamajā kolonnā šai konkrētajai klases vērtībai.
Citi svarīgi termini, izmantojot sajaukšanas matricu
- Pozitīvā paredzamā vērtība (PVV): tas ir ļoti tuvu precizitātei. Viena būtiska atšķirība starp diviem termiņiem ir tā, ka PVV ņem vērā izplatību. Situācijā, kad klases ir pilnīgi līdzsvarotas, pozitīvā paredzamā vērtība ir tāda pati kā precizitāte.
- Null kļūdu līmenis: Šis termins tiek izmantots, lai noteiktu, cik reizes jūsu prognoze būtu nepareiza, ja jūs varētu paredzēt vairākuma klasi. Jūs varat uzskatīt to par bāzes rādītāju, lai salīdzinātu savu klasifikatoru.
- F rādītājs: F1 rezultāts ir patiesā pozitīvā (atsaukuma) un precizitātes vidējais svērtais rezultāts.
- Roc līkne: Roc līkne parāda patiesos pozitīvos rādītājus attiecībā pret viltus pozitīvo rādītāju dažādos griezuma punktos. Tas arī parāda kompromisu starp jutīgumu (atsaukšanu un specifiskumu vai patieso negatīvo likmi).
- Precizitāte: Precizitātes metrika parāda pozitīvās klases precizitāti. Tas mēra, cik iespējams, ka pozitīvās klases prognoze ir pareiza.
Maksimālais punktu skaits ir 1, kad klasifikators perfekti klasificē visas pozitīvās vērtības. Tikai precizitāte nav īpaši noderīga, jo tā ignorē negatīvo klasi. Metrika parasti tiek savienota pārī ar atsaukšanas metriku. Atsaukšanu sauc arī par jutīgumu vai patieso pozitīvo līmeni.
- Jutīgums : Jutīgums aprēķina pareizi noteikto pozitīvo klašu attiecību. Šī metrika norāda, cik labs modelis ir pozitīvas klases atpazīšanai.
Kāpēc jums nepieciešama apjukuma matrica?
Šeit ir neskaidrības matricas izmantošanas plusi / priekšrocības.
- Tas parāda, kā jebkurš klasifikācijas modelis tiek sajaukts, veicot prognozes.
- Apjukuma matrica sniedz ne tikai ieskatu klasifikatora pieļautajās kļūdās, bet arī pieļauto kļūdu veidus.
- Šis sadalījums palīdz jums pārvarēt ierobežojumus, kas saistīti tikai ar klasifikācijas precizitātes izmantošanu.
- Katra sajaukšanas matricas kolonna attēlo šīs paredzamās klases gadījumus.
- Katra neskaidrības matricas rinda apzīmē faktiskās klases gadījumus.
- Tas sniedz ieskatu ne tikai klasifikatora kļūdās, bet arī kļūdās, kuras tiek pieļautas.