Kas ir uzraudzīta mašīnmācīšanās?
Pārraudzītās mācībās jūs apmācāt mašīnu, izmantojot datus, kas ir labi apzīmēti . Tas nozīmē, ka daži dati jau ir atzīmēti ar pareizo atbildi. To var salīdzināt ar mācīšanos, kas notiek vadītāja vai skolotāja klātbūtnē.
Uzraudzīts mācību algoritms mācās no marķētiem apmācības datiem, palīdz jums paredzēt neparedzētu datu rezultātus. Lai veiksmīgi izveidotu, mērogotu un ieviestu precīzu uzraudzītu mašīnmācīšanos Datu zinātnes modelis prasa laiku un tehniskas zināšanas no augsti kvalificētu datu zinātnieku komandas. Turklāt Datu zinātniekam ir jāpārbūvē modeļi, lai pārliecinātos, ka sniegtā atziņa paliek patiesa, līdz tās dati mainās.
Šajā apmācībā jūs uzzināsiet
- Kas ir uzraudzīta mašīnmācīšanās?
- Kas ir bez uzraudzības mācīšanās?
- Kāpēc uzraudzīta mācīšanās?
- Kāpēc jāmācās bez uzraudzības?
- Kā darbojas uzraudzītā mācīšanās?
- Kā darbojas nepieskatīta mācīšanās?
- Uzraugāmo mašīnmācīšanās paņēmienu veidi
- Nepieskatītu mašīnmācīšanās paņēmienu veidi
- Uzraudzīta un nepieskatīta mācīšanās
Kas ir bez uzraudzības mācīšanās?
Nepieskatīta mācīšanās ir mašīnmācīšanās tehnika, kur jums nav jāuzrauga modelis. Tā vietā jums jāļauj modelim darboties pašam, lai atklātu informāciju. Tas galvenokārt nodarbojas ar nemarķētiem datiem.
Bez uzraudzības mācību algoritmi ļauj veikt sarežģītākus apstrādes uzdevumus, salīdzinot ar uzraudzītu mācīšanos. Lai gan bez uzraudzības mācīšanās var būt neprognozējamāka salīdzinājumā ar citām dabiskās mācīšanās dziļajām mācībām un mācīšanās pastiprināšanas metodēm.
Kāpēc uzraudzīta mācīšanās?
- Mācīšanās ar uzraudzību ļauj apkopot datus vai iegūt datu izvadi no iepriekšējās pieredzes.
- Palīdz jums optimizēt veiktspējas kritērijus, izmantojot pieredzi
- Vadīta mašīnmācīšanās palīdz jums atrisināt dažāda veida reālās pasaules skaitļošanas problēmas.
Kāpēc jāmācās bez uzraudzības?
Šeit ir galvenie iemesli, kāpēc tiek izmantota bez uzraudzības:
- Nepieskatīta mašīnmācīšanās atrod visu veidu nezināmus modeļus datos.
- Nepieskatītas metodes palīdz atrast funkcijas, kas var noderēt kategorizēšanai.
- Tas notiek reāllaikā, tāpēc visi ieejas dati jāanalizē un jāapzīmē izglītojamo klātbūtnē.
- No etiķetēm nesaistītus datus no datora iegūt ir vieglāk nekā ar iezīmētiem datiem, kam nepieciešama manuāla iejaukšanās.
Kā darbojas uzraudzītā mācīšanās?
Piemēram, jūs vēlaties apmācīt mašīnu, lai palīdzētu jums paredzēt, cik ilgi jums būs jābrauc mājās no savas darbavietas. Šeit jūs vispirms izveidojat iezīmētu datu kopu. Šie dati ietver
- Laika apstākļi
- Dienas laiks
- Brīvdienas
Visa šī informācija ir jūsu ieguldījums. Rezultāts ir laiks, kas bija vajadzīgs, lai šajā konkrētajā dienā atgrieztos mājās.
Jūs instinktīvi zināt, ka, ja ārā līst lietus, tad jums būs nepieciešams ilgāks laiks, lai brauktu mājās. Bet mašīnai ir nepieciešami dati un statistika.
Apskatīsim, kā jūs varat izstrādāt šī piemēra uzraudzītu mācību modeli, kas palīdzēs lietotājam noteikt pārvietošanās laiku. Vispirms jums jāizveido apmācības datu kopa. Šajā apmācības komplektā būs kopējais brauciena laiks un atbilstoši faktori, piemēram, laika apstākļi, laiks utt. Pamatojoties uz šo apmācību komplektu, jūsu mašīna var redzēt, ka ir tieša saistība starp lietus daudzumu un laiku, kas jums būs nepieciešams, lai nokļūtu mājās.
Tātad, tas pārliecinās, ka jo vairāk līst lietus, jo ilgāk jūs brauksiet, lai atgrieztos savās mājās. Tas var arī redzēt saikni starp laiku, kad atstājat darbu, un laiku, kad būsiet ceļā.
Jo tuvāk jūs esat pulksten 18, jo ilgāks laiks nepieciešams, lai jūs nokļūtu mājās. Jūsu mašīna var atrast dažas saistības ar jūsu iezīmētajiem datiem.
Šis ir jūsu datu modeļa sākums. Tas sāk ietekmēt to, kā lietus ietekmē cilvēku braukšanas veidu. Tas arī sāk redzēt, ka vairāk cilvēku ceļo noteiktā dienas laikā.
Kā darbojas nepieskatīta mācīšanās?
Pieņemsim bērnu un viņas ģimenes suni.
Viņa pazīst un identificē šo suni. Dažas nedēļas vēlāk ģimenes draugs atved suni un mēģina rotaļāties ar bērnu.
Mazulis šo suni nav redzējis agrāk. Bet tas atzīst daudzas pazīmes (2 ausis, acis, staigāšana uz četrām kājām) ir kā viņas lolojumdzīvnieku suns. Viņa identificē jaunu dzīvnieku kā suni. Tā ir bez uzraudzības mācīšanās, kurā jūs nemāca, bet mācāties no datiem (šajā gadījumā dati par suni.) Ja tas būtu bijis uzraudzīts, ģimenes draugs būtu teicis mazulim, ka tas ir suns.
Uzraugāmo mašīnmācīšanās paņēmienu veidi
Regresija:
Regresijas paņēmiens paredz vienu izejas vērtību, izmantojot apmācības datus.
Piemērs: Jūs varat izmantot regresiju, lai prognozētu mājas cenu pēc apmācības datiem. Ievades mainīgie būs atrašanās vieta, mājas lielums utt.
Klasifikācija:
Klasifikācija nozīmē produkcijas grupēšanu klases iekšienē. Ja algoritms mēģina iezīmēt ievadi divās atšķirīgās klasēs, to sauc par bināro klasifikāciju. Izvēle starp vairāk nekā divām klasēm tiek dēvēta par daudzklasīgu klasifikāciju.
Piemērs : nosakot, vai kāds būs aizdevuma neizpildītājs.
Stiprās puses : izvadiem vienmēr ir varbūtības interpretācija, un algoritmu var regulēt, lai izvairītos no pārspīlēšanas.
Vājās puses : Loģistiskā regresija var izrādīties nepietiekama, ja ir vairākas vai nelineāras lēmuma robežas. Šī metode nav elastīga, tāpēc tā neuztver sarežģītākas attiecības.
Nepieskatītu mašīnmācīšanās paņēmienu veidi
Nepieskatītas mācīšanās problēmas tika grupētas grupēšanas un asociācijas problēmās.
Kopu veidošana
Klasteru veidošana ir svarīgs jēdziens, kad runa ir par bez uzraudzības. Tas galvenokārt nodarbojas ar struktūras vai modeļa atrašanu nekategorizētu datu kolekcijā. Klasterizācijas algoritmi apstrādās jūsu datus un atradīs dabiskās kopas (grupas), ja tādi pastāv. Varat arī modificēt, cik klasteru jūsu algoritmiem vajadzētu identificēt. Tas ļauj pielāgot šo grupu precizitāti.
Asociācija
Asociācijas noteikumi ļauj izveidot asociācijas starp datu objektiem lielās datu bāzēs. Šī neuzraudzītā tehnika ir par aizraujošu attiecību atklāšanu starp mainīgajiem lielās datu bāzēs. Piemēram, cilvēki, kuri iegādājas jaunu māju, visticamāk iegādāsies jaunas mēbeles.
Citi piemēri:
- Vēža slimnieku apakšgrupa, kas sagrupēta pēc viņu gēnu ekspresijas mērījumiem
- Pircēju grupas, pamatojoties uz viņu pārlūkošanas un pirkšanas vēsturi
- Filmu grupa pēc filmu skatītāju piešķirtā vērtējuma
Uzraudzīta un nepieskatīta mācīšanās
Parametri | Vadīta mašīnmācīšanās tehnika | Nepārraudzīta mašīnmācīšanās tehnika |
Process | Uzraudzītā mācību modelī tiks doti ievades un izvades mainīgie. | Nepārraudzītā mācību modelī tiks doti tikai ievaddati |
Ievades dati | Algoritmi tiek apmācīti, izmantojot marķētus datus. | Algoritmus izmanto pret datiem, kas nav marķēti |
Izmantotie algoritmi | Atbalsta vektoru mašīnu, neironu tīklu, lineāro un loģistikas regresiju, nejaušus mežus un klasifikācijas kokus. | Bez uzraudzības algoritmus var iedalīt dažādās kategorijās: piemēram, Klastera algoritmi, K-vidējie, Hierarhiskā kopu veidošana utt. |
Skaitļošanas sarežģītība | Mācīšanās ar uzraudzību ir vienkāršāka metode. | Nepārraudzīta mācīšanās ir skaitļošanas ziņā sarežģīta |
Datu izmantošana | Uzraudzītais mācību modelis izmanto apmācības datus, lai uzzinātu saikni starp ievadi un iznākumu. | Bez uzraudzības mācīšanās neizmanto izejas datus. |
Rezultātu precizitāte | Ļoti precīza un uzticama metode. | Mazāk precīza un uzticama metode. |
Mācīšanās reāllaikā | Mācību metode notiek bezsaistē. | Mācīšanās metode notiek reāllaikā. |
Nodarbību skaits | Nodarbību skaits ir zināms. | Nodarbību skaits nav zināms. |
Galvenais trūkums | Lielo datu klasificēšana var būt reāls izaicinājums uzraudzītajā mācībā. | Jūs nevarat iegūt precīzu informāciju par datu šķirošanu, un izvade, jo dati, kas tiek izmantoti bez uzraudzības, tiek apzīmēti un nav zināmi. |
Kopsavilkums
- Pārraudzītās mācībās jūs apmācāt mašīnu, izmantojot datus, kas ir labi apzīmēti.
- Nepieskatīta mācīšanās ir mašīnmācīšanās tehnika, kur jums nav jāuzrauga modelis.
- Mācīšanās ar uzraudzību ļauj apkopot datus vai iegūt datu izvadi no iepriekšējās pieredzes.
- Nepieskatīta mašīnmācīšanās palīdz jums atrast visa veida nezināmus modeļus datos.
- Piemēram, jūs varēsiet noteikt laiku, kas vajadzīgs, lai atgrieztos atpakaļ atkarībā no laika apstākļiem, dienas laikiem un svētku dienām.
- Piemēram, Baby var identificēt citus suņus, pamatojoties uz iepriekšēju uzraudzītu mācīšanos.
- Regresija un klasifikācija ir divu veidu uzraudzītas mašīnmācīšanās metodes.
- Klasteru veidošana un asociācija ir divi bez uzraudzības principi.
- Uzraudzītā mācību modelī ievades un izvades mainīgie tiks norādīti, savukārt, izmantojot bez uzraudzības mācību modeli, tiks doti tikai ievades dati