25 labākie ETL intervēšanas jautājumu testēšanas & Atbildes

Anonim

Šie ir bieži uzdotie jautājumi intervijās, kas paredzētas iesācējiem, kā arī pieredzējušiem ETL testētājiem un izstrādātājiem.

1) Kas ir ETL?

Datu noliktavu arhitektūrā ETL ir svarīga sastāvdaļa, kas pārvalda jebkura biznesa procesa datus. ETL nozīmē Extract, Transform un Load . Ekstrakts veic datu nolasīšanas procesu no datu bāzes. Transform konvertē datus tādā formātā, kas varētu būt piemērots ziņošanai un analīzei. Kamēr slodze veic datu ierakstīšanu mērķa datu bāzē.

2) Paskaidrojiet, kas ietver ETL testēšanas darbības?

ETL testēšana ietver

  • Pārbaudiet, vai dati tiek pareizi pārveidoti atbilstoši biznesa prasībām
  • Pārbaudiet, vai projicētie dati tiek ielādēti datu noliktavā bez saīsināšanas un datu zaudēšanas
  • Pārliecinieties, ka ETL lietojumprogramma ziņo par nederīgiem datiem un aizstāj ar noklusējuma vērtībām
  • Pārliecinieties, ka dati tiek ielādēti paredzētajā laika posmā, lai uzlabotu mērogojamību un veiktspēju

3) Pieminiet, kādi ir datu noliktavas lietojumprogrammu veidi un kāda ir atšķirība starp datu ieguvi un datu noliktavu?

Datu noliktavas lietojumprogrammu veidi ir

  • Informācijas apstrāde
  • Analītiskā apstrāde
  • Datu ieguve

Datu ieguvi var definēt kā slēptas prognozēšanas informācijas iegūšanas procesu no lielām datubāzēm un interpretēt datus, savukārt datu noliktavā datu analītiskai apstrādei ātrākā veidā var izmantot datu raktuves. Datu noliktava ir process, kurā datus no vairākiem avotiem apkopo vienā kopīgā krātuvē

4) Kādi ir dažādi ETL izmantotie rīki?

  • Cognos lēmumu straume
  • Oracle Warehouse Builder
  • Biznesa objekti XI
  • SAS biznesa noliktava
  • SAS Enterprise ETL serveris

5) Kas ir fakts? Kādi ir faktu veidi?

Tā ir daudzdimensiju modeļa galvenā sastāvdaļa, kas satur analizējamos pasākumus. Fakti ir saistīti ar izmēriem.

Faktu veidi ir

  • Fakti par piedevām
  • Fakti par puspiedevu
  • Fakti, kas nav piedevas

6) Paskaidrojiet, kas ir kubi un OLAP kubi?

Kubi ir datu apstrādes vienības, kas sastāv no faktu tabulām un datu noliktavas izmēriem. Tas nodrošina daudzdimensionālu analīzi.

OLAP apzīmē tiešsaistes analīzes apstrādi, un OLAP kubs lielus datus daudzdimensionālā veidā saglabā ziņošanas vajadzībām. Tas sastāv no faktiem, kurus sauc par mērījumiem, kas kategorizēti pēc dimensijām.

7) Paskaidrojiet, kas ir izsekošanas līmenis un kādi ir veidi?

Izsekošanas līmenis ir žurnāla failos saglabāto datu daudzums. Izsekošanas līmeni var klasificēt divās Normal un Verbose. Normal level detalizēti izskaidro izsekošanas līmeni, bet verbose izskaidro izsekošanas līmeņus katrā rindā.

8) Paskaidrojiet, kas ir faktu grauds?

Graudu faktu var definēt kā līmeni, kurā tiek glabāta faktu informācija. To sauc arī par faktu precizitāti

9) Paskaidrojiet, kas ir bez faktu shēma un kas ir Pasākumi?

Faktu tabula bez mēriem tiek dēvēta par faktu faktu tabulu. Tas var apskatīt notiekošo notikumu skaitu. Piemēram, to izmanto, lai reģistrētu tādu notikumu kā darbinieku skaits uzņēmumā.

Skaitliskie dati, kuru pamatā ir faktu tabulas kolonnas, ir pazīstami kā Pasākumi

10) Paskaidrojiet, kas ir transformācija?

Transformācija ir repozitorija objekts, kas ģenerē, modificē vai nodod datus. Pārveidošana ir divu veidu aktīvā un pasīvā

11) Izskaidrojiet uzmeklēšanas pārveidošanas izmantošanu?

Uzmeklēšanas pārveidošana ir noderīga

  • Saistītās vērtības iegūšana no tabulas, izmantojot kolonnas vērtību
  • Atjauniniet lēnām mainīgo kategoriju tabulu
  • Pārbaudiet, vai tabulā jau ir ieraksti

12) Paskaidrojiet, kas ir sadalīšana, hash sadalīšana un apaļo robin sadalīšana?

Lai uzlabotu veiktspēju, darījumi tiek sadalīti pa daļām, to sauc par sadalīšanu. Dalīšana ļauj Informatica Server izveidot vairāku savienojumu ar dažādiem avotiem

Starpsienu veidi ir

Round-Robin sadalīšana:

  • Pēc informatikas dati tiek vienmērīgi sadalīti starp visām nodalījumiem
  • Katrā nodalījumā, kurā apstrādājamo rindu skaits ir aptuveni vienāds, ir piemērots šis sadalījums

Hash sadalīšana:

  • Informatica serveris, lai sadalītu atslēgas datu grupēšanai starp nodalījumiem, izmanto jaucējfunkciju
  • To lieto, nodrošinot, ka jānodrošina procesu rindu grupas ar vienu un to pašu nodalījuma atslēgu vienā nodalījumā

13) Pieminiet, kāda ir DataReader galamērķa adaptera izmantošanas priekšrocība?

DataReader galamērķa adaptera izmantošanas priekšrocība ir tā, ka tā atmiņā aizpilda ADO ierakstu kopu (sastāv no ierakstiem un kolonnām) un atklāj datus no uzdevuma DataFlow, ieviešot saskarni DataReader, lai cita lietojumprogramma varētu patērēt datus.

14) Kādi ir tabulas atjaunināšanas veidi, izmantojot SSIS (SQL Server Integration Service)?

Lai atjauninātu tabulu, izmantojot SSIS, iespējamie veidi ir šādi:

  • Izmantojiet SQL komandu
  • Izmantojiet iestudēšanas galdu
  • Izmantojiet kešatmiņu
  • Izmantojiet skripta uzdevumu
  • Ja tiek izmantota MSSQL, atjaunināšanai izmantojiet pilnu datu bāzes nosaukumu

15) Ja meklēšanai ir avots, kas nav OLEDB (objektu saistīšanas un iegulšanas datu bāze), ko jūs darītu?

Gadījumā, ja meklēšanai jums nav OLEBD avota, datu ielādei un kā avotam jāizmanto kešatmiņa

16) Kādā gadījumā savienotajās un nesavienotajās transformācijās izmantojat dinamisko kešatmiņu un statisko kešatmiņu?

  • Dinamiskā kešatmiņa tiek izmantota, ja jāatjaunina galvenā tabula un 1. tipa lēnām mainās izmēri (SCD)
  • Plakaniem failiem tiek izmantota statiskā kešatmiņa

17) Paskaidrojiet, kādas ir atšķirības starp nesaistītu un savienotu meklēšanu?

Savienotā meklēšana

Nesaistīts uzmeklējums

  • Savienojums uzmeklēšanā piedalās kartēšanā

- Tas tiek izmantots, ja kartēšanas laikā izteiksmes transformācijas vietā tiek izmantota uzmeklēšanas funkcija

  • Var atgriezt vairākas vērtības

- Atgriež tikai vienu izejas portu

  • To var savienot ar citu transformāciju un atgriezt vērtību
  • Citu transformāciju nevar savienot
  • Savienotajai uzmeklēšanai var izmantot statisko vai dinamisko kešatmiņu
  • Nav savienots kā tikai statiskā kešatmiņa
  • Savienotā meklēšana atbalsta lietotāja definētas noklusējuma vērtības
  • Nesaistīta meklēšana neatbalsta lietotāja definētās noklusējuma vērtības
  • Kolonnā Connected Lookup multiple var atgriezties no vienas rindas vai ievietot dinamiskās uzmeklēšanas kešatmiņā
  • Nesaistīts uzmeklējums norāda vienu atgriešanās portu un atgriež vienu kolonnu no katras rindas

18) Paskaidrojiet, kas ir datu avota skats.

Datu avota skats ļauj noteikt relāciju shēmu, kas tiks izmantota analīzes pakalpojumu datu bāzēs. Dimensijas un kubi tiek veidoti nevis no datu avota objektiem, bet tieši no datu avota skatiem.

19) Paskaidrojiet, kāda ir atšķirība starp OLAP rīkiem un ETL rīkiem?

Atšķirība starp ETL un OLAP rīku ir tā

ETL rīks ir paredzēts datu iegūšanai no mantotajām sistēmām un ielādēšanai norādītajā datu bāzē ar kādu datu attīrīšanas procesu.

Piemērs: Datu stadija, Informatica utt.

Kamēr OLAP ir paredzēts ziņošanas mērķiem OLAP datos, kas pieejami daudzvirzienu modelī.

Piemērs: Biznesa objekti, Cognos uc

20) Kā jūs varat iegūt SAP datus, izmantojot Informatica?

  • Izmantojot opciju barošanas savienojums, SAP datus iegūstat, izmantojot informātiku
  • Instalējiet un konfigurējiet PowerConnect rīku
  • Importējiet avotu avota analizatorā. Starp Informatica un SAP Powerconnect darbojas kā sliežu ceļš. Nākamais solis ir ABAP koda ģenerēšana kartēšanai, tad tikai informatika var iegūt datus no SAP
  • Avotu savienošanai un importēšanai no ārējām sistēmām tiek izmantots Power Connect

21) Pieminiet, kāda ir atšķirība starp Power Mart un Power Center?

Jaudas centrs

Spēks Marts

  • Pieņemsim, ka tiks apstrādāts milzīgs datu apjoms
  • Pieņemsim, ka tiks apstrādāts mazs datu apjoms
  • Tas atbalsta ERP avotus, piemēram, SAP, cilvēkus mīkstus utt.
  • Tas neatbalsta ERP avotus
  • Tas atbalsta vietējo un globālo repozitoriju
  • Tas atbalsta vietējo repozitoriju
  • Tas pārveido vietējo par globālo krātuvi
  • Tam nav specifikācijas, lai vietējo pārveidotu globālajā krātuvē

22) Paskaidrojiet, kas ir iestudējuma laukums un kāds ir pieturvietas mērķis?

Datu izvietošana ir apgabals, kurā datus uz laiku glabājat datu noliktavas serverī. Datu pakāpe ietver šādas darbības

  • Sākotnējo datu iegūšana un datu pārveidošana (pārstrukturēšana)
  • Datu transformācija (datu attīrīšana, vērtības pārveidošana)
  • Surogāta atslēgu piešķiršana

23) Kas ir autobusu shēma?

Dažādiem biznesa procesiem, lai noteiktu kopīgās dimensijas, tiek izmantota BUS shēma. Tam ir atbilstoši izmēri un standartizēta informācijas definīcija

24) Paskaidrojiet, kas ir datu attīrīšana?

Datu tīrīšana ir datu dzēšanas process no datu noliktavas. Tas izdzēš nevēlamo datu līdzīgas rindas ar nulles vērtībām vai papildu atstarpēm.

25) Paskaidrojiet, kas ir shēmas objekti?

Shēmas objekti ir loģiskā struktūra, kas tieši atsaucas uz datu bāzu datiem. Shēmas objektos ietilpst tabulas, skati, secības sinonīmi, indeksi, kopas, funkciju paketes un datu bāzes saites

26) Paskaidrojiet šos terminus Session, Worklet, Mapplet un Workflow?

  • Mapplet: Tas sakārto vai izveido transformāciju kopas
  • Darblapa: tā attēlo noteiktu uzdoto uzdevumu kopumu
  • Darbplūsma: tas ir instrukciju kopums, kas serverim norāda, kā izpildīt uzdevumus
  • Sesija: tā ir parametru kopa, kas serverim stāsta, kā datus pārvietot no avotiem uz mērķauditoriju

Bezmaksas PDF lejupielāde: ETL intervijas jautājumu un atbilžu pārbaude