Lejupielādēt PDF
1) Kas ir mašīnmācīšanās?
Mašīnmācība ir datorzinātņu nozare, kas nodarbojas ar sistēmas programmēšanu, lai automātiski apgūtu un pilnveidotos ar pieredzi. Piemēram: Roboti ir ieprogrammēti tā, lai viņi varētu izpildīt uzdevumu, pamatojoties uz datiem, kurus viņi savāc no sensoriem. Tas automātiski apgūst programmas no datiem.
2) Pieminiet atšķirību starp datu ieguvi un mašīnmācīšanos?
Mašīnmācība ir saistīta ar tādu algoritmu izpēti, izstrādi un izstrādi, kas dod datoriem iespēju mācīties, nepārprotami nepieprogrammējot. Kaut arī datu ieguvi var definēt kā procesu, kurā nestrukturētie dati mēģina iegūt zināšanas vai nezināmus interesantus modeļus. Šīs procesa mašīnas laikā tiek izmantoti mācību algoritmi.
3) Kas mašīnmācībā ir “pārspīlēts”?
Mašīnmācībā, kad statistikas modelis apraksta nejaušu kļūdu vai troksni, nevis pamatsakarības, notiek “pārspīlēšana”. Ja modelis ir pārmērīgi sarežģīts, parasti tiek novērota pārspīlēšana, jo tam ir pārāk daudz parametru attiecībā uz apmācības datu tipu skaitu. Modeļa veiktspēja ir slikta, un tas ir pārāk piemērots.
4) Kāpēc notiek pārspīlēšana?
Pārspīlēšanas iespēja pastāv, jo modeļa apmācībai izmantotie kritēriji nav vienādi ar kritērijiem, kurus izmanto modeļa efektivitātes novērtēšanai.
5) Kā jūs varat izvairīties no pārmērīgas uzstādīšanas?
Izmantojot daudz datu, var izvairīties no pārmērīgas uzstādīšanas, pārmērīga uzstādīšana notiek salīdzinoši, jo jums ir maza datu kopa, un jūs mēģināt no tā mācīties. Bet, ja jums ir maza datu bāze, un jūs esat spiesti nākt ar to balstītu modeli. Šādā situācijā varat izmantot paņēmienu, kas pazīstams kā savstarpēja validācija . Šajā metodē datu kopa tiek sadalīta divās sadaļās - testēšanas un apmācības datu kopās. Testēšanas datu kopa pārbaudīs tikai modeli, savukārt apmācības datu kopā datepunkti nāks klajā ar modeli.
Šajā tehnikā modelim parasti tiek dota zināmu datu kopa, par kuru tiek veikta apmācība (apmācības datu kopa), un nezināmu datu datu kopa, pret kuru modelis tiek pārbaudīts. Krustotās validācijas ideja ir definēt datu kopu modeļa “pārbaudei” apmācības posmā.
6) Kas ir induktīvā mašīnmācīšanās?
Induktīvā mašīnmācīšanās ietver mācīšanās procesu ar piemēriem, kur sistēma no novēroto gadījumu kopuma mēģina izraisīt vispārēju likumu.
7) Kādi ir pieci populārie mašīnmācīšanās algoritmi?
- Lēmumu koki
- Neironu tīkli (muguras izplatīšanās)
- Varbūtības tīkli
- Tuvākais kaimiņš
- Atbalsta vektoru mašīnas
8) Kādas ir dažādas algoritmu metodes mašīnmācībā?
Dažādi mašīnmācīšanās paņēmieni ir
- Vadīta mācīšanās
- Bez uzraudzības mācīšanās
- Daļēji uzraudzīta mācīšanās
- Mācības pastiprināšanai
- Transdukcija
- Mācīties mācīties
9) Kādi ir trīs posmi, lai izveidotu hipotēzes vai modeli mašīnmācībā?
- Modeļa veidošana
- Modeļa testēšana
- Modeļa pielietošana
10) Kāda ir standarta pieeja uzraudzītai mācībām?
Standarta pieeja uzraudzītai mācībai ir sadalīt piemēru kopu apmācības komplektā un ieskaitē.
11) Kas ir “Apmācību komplekts” un “Pārbaudes komplekts”?
Dažādās informācijas zinātnes jomās, piemēram, mašīnmācīšanās, datu kopums tiek izmantots, lai atklātu potenciāli paredzamās attiecības, kas pazīstamas kā “apmācību kopa”. Apmācību kopa ir piemēri, kas tiek sniegti apmācāmajam, savukārt testa komplekts tiek izmantots, lai pārbaudītu apmācāmā radīto hipotēžu precizitāti, un tas ir piemērs, kuru attur no apmācāmā. Treniņu komplekts atšķiras no testa komplekta.
12) Uzskaitiet dažādas pieejas mašīnmācībai?
Mašīnmācīšanās dažādās pieejas ir
- Jēdziens Vs Klasifikācija Mācīšanās
- Simboliskā Vs statistiskā mācīšanās
- Induktīvā Vs analītiskā mācīšanās
13) Kas nav mašīnmācīšanās?
- Mākslīgais intelekts
- Noteikums balstīts secinājums
14) Paskaidrojiet, kāda ir „nepārraudzītas mācīšanās” funkcija?
- Atrodiet datu kopas
- Atrodiet datu zemu izmēru attēlojumu
- Datos atrodiet interesantus norādījumus
- Interesantas koordinātas un korelācijas
- Atrodiet jaunus novērojumus / datu bāzes tīrīšanu
15) Paskaidrojiet, kāda ir „Uzraudzītās mācīšanās” funkcija?
- Klasifikācijas
- Runas atpazīšana
- Regresija
- Paredzēt laika rindas
- Anotēt stīgas
16) Kas ir no algoritmiem neatkarīga mašīnmācīšanās?
Mašīnmācība, kur matemātiskie pamati nav atkarīgi no kāda konkrēta klasifikatora vai mācīšanās algoritma, tiek dēvēti par algoritmu neatkarīgu mašīnmācīšanos?
17) Kāda ir atšķirība starp mākslīgo un mašīnmācīšanos?
Algoritmu projektēšana un izstrāde atbilstoši uzvedībai, kas balstīta uz empīriskiem datiem, tiek dēvēta par mašīnmācīšanos. Mākslīgais intelekts papildus mašīnmācībai aptver arī citus aspektus, piemēram, zināšanu atspoguļošanu, dabiskās valodas apstrādi, plānošanu, robotiku utt.
18) Kas mašīnmācībā ir klasifikators?
Mašīnmācības klasifikators ir sistēma, kas ievada diskrētu vai nepārtrauktu pazīmju vērtību vektoru un izdod vienu atsevišķu vērtību - klasi.
19) Kādas ir Naive Bayes priekšrocības?
Naivajos Beilos klasifikators saplūdīs ātrāk nekā diskriminējoši modeļi, piemēram, loģistiskā regresija, tāpēc jums ir nepieciešams mazāk apmācības datu. Galvenā priekšrocība ir tā, ka tā nevar iemācīties mijiedarbību starp funkcijām.
20) Kurās jomās tiek izmantota rakstu atpazīšana?
Rakstu atpazīšanu var izmantot
- Datora redze
- Runas atpazīšana
- Datu ieguve
- Statistika
- Neformāla izguve
- Bioinformātika
21) Kas ir ģenētiskā programmēšana?
Ģenētiskā programmēšana ir viena no divām mašīnmācībā izmantotajām metodēm. Modeļa pamatā ir testēšana un labāko rezultātu izvēle starp rezultātu kopumu.
22) Kas ir induktīvās loģikas programmēšana mašīnmācībā?
Induktīvās loģikas programmēšana (ILP) ir mašīnmācīšanās apakšlauks, kurā tiek izmantota loģiskā programmēšana, kas atspoguļo pamatzināšanas un piemērus.
23) Kas ir modeļa atlase mašīnmācībā?
Modeļu atlases process starp dažādiem matemātiskiem modeļiem, kas tiek izmantoti vienas un tās pašas datu kopas aprakstīšanai, ir pazīstams kā modeļa atlase. Modeļa atlase tiek piemērota statistikas, mašīnmācīšanās un datu ieguves jomām.
24) Kādas ir divas metodes, kas tiek izmantotas kalibrēšanai uzraudzītajā mācībā?
Divas metodes, kas tiek izmantotas, lai prognozētu labu varbūtību uzraudzītā mācībā, ir
- Plākšņu kalibrēšana
- Izotoniskā regresija
Šīs metodes ir paredzētas binārai klasifikācijai, un tas nav mazsvarīgi.
25) Kuru metodi bieži izmanto, lai novērstu pārmērīgu uzstādīšanu?
Ja ir pietiekami daudz datu, tiek izmantota “izotoniskā regresija”, lai novērstu pārlieku piemērotu problēmu.
26) Kāda ir atšķirība starp heiristiku likumu apguvei un heiristiku lēmumu kokiem?
Atšķirība ir tāda, ka lēmumu koku heiristikā tiek vērtēta vairāku nesaistītu kopu vidējā kvalitāte, savukārt noteikumu apguvēji vērtē tikai to gadījumu kopu kvalitāti, uz kuriem attiecas kandidāta kārtula.
27) Kas mašīnmācībā ir Perceptron?
Mašīnmācībā Perceptron ir algoritms ievades uzraudzītai klasificēšanai vienā no vairākiem iespējamiem ne bināriem rezultātiem.
28) Izskaidrojiet abas Bajesa loģikas programmas sastāvdaļas?
Bajesa loģikas programma sastāv no diviem komponentiem. Pirmais komponents ir loģisks; tas sastāv no Bajesa klauzulu kopas, kas atspoguļo domēna kvalitatīvo struktūru. Otrais komponents ir kvantitatīvs, tas kodē kvantitatīvo informāciju par domēnu.
29) Kas ir Bajesa tīkli (BN)?
Bajesa tīkls tiek izmantots, lai attēlotu grafisko modeli varbūtības attiecībai starp mainīgo kopu.
30) Kāpēc uz gadījumiem balstītu mācību algoritmu dažreiz dēvē par slinku mācību algoritmu?
Uz mācību gadījumiem balstītu algoritmu dēvē arī par slinku mācību algoritmu, jo tie aizkavē ievadīšanas vai vispārināšanas procesu līdz klasifikācijas veikšanai.
31) Kādas ir divas klasifikācijas metodes, ar kurām SVM (Support Vector Machine) var rīkoties?
- Bināro klasifikatoru apvienošana
- Binārā pārveidošana, lai tajā iekļautu daudzklasīgu mācīšanos
32) Kas ir ansambļa mācīšanās?
Lai atrisinātu konkrētu skaitļošanas programmu, stratēģiski tiek ģenerēti un apvienoti vairāki modeļi, piemēram, klasifikatori vai eksperti. Šis process ir pazīstams kā ansambļa mācīšanās.
33) Kāpēc tiek izmantota ansambļa mācīšanās?
Ansambļa mācīšanās tiek izmantota, lai uzlabotu modeļa klasifikāciju, prognozēšanu, funkciju tuvināšanu utt.
34) Kad izmantot ansambļa mācīšanos?
Ansambļa mācīšanās tiek izmantota, veidojot precīzākus un neatkarīgi cits no cita esošos komponentu klasifikatorus.
35) Kādas ir divas ansambļa metožu paradigmas?
Abas ansambļa metožu paradigmas ir
- Secīgas ansambļa metodes
- Paralēlu ansambļu metodes
36) Kāds ir ansambļa metodes vispārējais princips un kas ir maisa un veicināšana ansambļa metodē?
Ansambļa metodes vispārējais princips ir apvienot vairāku ar konkrētu mācību algoritmu veidotu modeļu prognozes, lai uzlabotu robustumu attiecībā pret vienu modeli. Maisīšana ir metode kopā, lai uzlabotu nestabilas novērtēšanas vai klasifikācijas shēmas. Kaut arī palielināšanas metode tiek izmantota secīgi, lai samazinātu kombinētā modeļa neobjektivitāti. Gan palielināšana, gan iesaiņošana var samazināt kļūdas, samazinot dispersijas termiņu.
37) Kāda ir klasifikācijas kļūdas novirzes-dispersijas sadalīšanās ansambļa metodē?
Paredzamo mācību algoritma kļūdu var sadalīt aizspriedumos un dispersijās. Aizspriedumu termins mēra, cik precīzi mācību algoritma radītais vidējais klasifikators atbilst mērķa funkcijai. Dispersijas termins mēra, cik daudz mācību algoritma prognoze svārstās dažādiem apmācību komplektiem.
38) Kas ir papildmācīšanās algoritms kopā?
Papildu mācīšanās metode ir algoritma spēja mācīties no jauniem datiem, kas var būt pieejami pēc tam, kad klasifikators jau ir izveidots no jau pieejamās datu kopas.
39) Kāpēc lieto PCA, KPCA un ICA?
PCA (galveno komponentu analīze), KPCA (uz kodola balstīta galveno komponentu analīze) un ICA (neatkarīgo komponentu analīze) ir svarīgas iezīmju iegūšanas metodes, ko izmanto izmēru samazināšanai.
40) Kas ir dimensiju samazināšana mašīnmācībā?
Mašīnmācībā un statistikā dimensiju samazināšana ir gadījuma mainīgo skaita samazināšanas process, ko var apsvērt, un to var iedalīt iezīmju atlasē un iezīmju iegūšanā.
41) Kas ir atbalsta vektoru mašīnas?
Atbalsta vektoru mašīnas ir uzraudzīti mācību algoritmi, ko izmanto klasifikācijai un regresijas analīzei.
42) Kādas ir relāciju novērtēšanas tehnikas sastāvdaļas?
Relāciju vērtēšanas paņēmienu svarīgākie komponenti ir
- Datu ieguve
- Zemes patiesības iegūšana
- Krustu validācijas tehnika
- Vaicājuma veids
- Vērtēšanas metrika
- Nozīmības pārbaude
43) Kādas ir secīgas uzraudzītas mācīšanās metodes?
Dažādas metodes ir secīgas uzraudzītas mācīšanās problēmu risināšanai
- Bīdāmo logu metodes
- Atkārtoti bīdāmi logi
- Slēpto Markow modeļi
- Maksimālais entropijas Markow modeļi
- Nosacīti nejauši lauki
- Grafu transformatoru tīkli
44) Kādas ir robotikas un informācijas apstrādes jomas, kurās rodas secīgas prognozēšanas problēmas?
Robotikas un informācijas apstrādes jomas, kurās rodas secīgas prognozēšanas problēmas, ir
- Mācīšanās imitācija
- Strukturēta prognoze
- Mācīšanās uz modeļa bāzes
45) Kas ir sērijveida statistiskā mācīšanās?
Statistiskās mācīšanās metodes ļauj apgūt funkciju vai pareģotāju no novēroto datu kopas, kas var prognozēt par neredzētiem vai nākotnes datiem. Šīs metodes nodrošina garantijas par iemācītā prognozētāja veiktspēju attiecībā uz nākotnes neredzētajiem datiem, pamatojoties uz statistikas pieņēmumu par datu ģenerēšanas procesu.
46) Kas ir PAC mācīšanās?
PAC (iespējams, aptuveni pareizi) mācīšanās ir mācību sistēma, kas ir ieviesta, lai analizētu mācību algoritmus un to statistisko efektivitāti.
47) Kādas ir dažādas kategorijas, kuras varat iedalīt secības apguves procesā?
- Secības prognozēšana
- Secības ģenerēšana
- Secības atpazīšana
- Secīgs lēmums
48) Kas ir secības mācīšanās?
Secības mācīšanās ir loģiskas mācīšanas un mācīšanās metode.
49) Kādas ir divas mašīnmācīšanās metodes?
Divi mašīnmācīšanās paņēmieni ir
- Ģenētiskā programmēšana
- Induktīvā mācīšanās
Lielāko e-komercijas vietņu ieviestais ieteikumu dzinējs izmanto mašīnmācīšanos.