30 galvenie Hbase intervijas jautājumi un amp; Atbildes

Anonim

Lejupielādēt PDF

Sekojošie ir bieži uzdotie jautājumi intervijās, kas paredzētas iesācējiem, kā arī pieredzējušiem HBase izstrādātājiem.

1) Paskaidrojiet, kas ir Hbase?

Hbase ir uz kolonnām orientēta datu bāzes pārvaldības sistēma, kas darbojas virs HDFS (Hadoop Distribute File System). Hbase nav relāciju datu krātuve, un tā neatbalsta strukturētu vaicājumu valodu, piemēram, SQL.

Programmā Hbase galvenais mezgls regulē kopu un reģionu serverus, lai uzglabātu tabulu daļas, un veic darbu pie datiem.

2) Paskaidrojiet, kāpēc lietot Hbase?

  • Lielas ietilpības uzglabāšanas sistēma
  • Izplatīts dizains lielu galdu apkalpošanai
  • Uz kolonnām orientēti veikali
  • Horizontāli mērogojams
  • Augsta veiktspēja un pieejamība
  • Hbase pamatmērķis ir miljoniem kolonnu, tūkstošiem versiju un miljardiem rindu
  • Atšķirībā no HDFS (Hadoop Distribute File System) tā atbalsta izlases reāllaika CRUD operācijas

3) Pieminiet, kādas ir galvenās Hbase sastāvdaļas?

  • Zookeeper: Tas veic koordinācijas darbu starp klientu un Hbase Maser
  • Hbase Master: Hbase Master uzrauga reģiona serveri
  • RegionServer: RegionServer uzrauga reģionu
  • Reģions: tas satur atmiņas datu krātuvē (MemStore) un Hfile.
  • Katalogu tabulas: Katalogu tabulas sastāv no ROOT un META

4) Paskaidrojiet, no kā sastāv Hbase?

  • Hbase sastāv no tabulu komplekta
  • Katrā tabulā ir rindas un kolonnas, piemēram, tradicionālā datu bāze
  • Katrā tabulā jābūt elementam, kas definēts kā primārā atslēga
  • Hbase kolonna apzīmē objekta atribūtu

5) Pieminiet, cik operatīvo komandu Hbase?

Operatīvā komanda Hbases ir aptuveni pieci veidi

  • gūt
  • Put
  • Dzēst
  • Skenēt
  • Pieaugums

6) Paskaidrojiet, kas Hbase ir WAL un Hlog?

WAL (Write Ahead Log) ir līdzīgs MySQL BIN žurnālam; tas reģistrē visas izmaiņas, kas notiek datos. Tas ir Hadoop standarta secības fails, un tajā tiek glabāti HLogkey faili. Šīs atslēgas sastāv no kārtas numura, kā arī faktiskajiem datiem, un tās tiek izmantotas, lai atkārtotu vēl neizturētos datus pēc servera avārijas. Tātad, servera kļūmes gadījumā WAL darbojas kā dzīves līnija un atgūst zaudētos datus.

7) Kad jums vajadzētu izmantot Hbase?

  • Datu lielums ir milzīgs: kad jums ir daudz tonnu un miljonu ierakstu, ko darboties
  • Pilnīga pārveidošana: pārvietojot RDBMS uz Hbase, jūs to uzskatāt par pilnīgu pārveidošanu, pēc tam vienkārši mainiet porti
  • SQL-Less komandas: jums ir vairākas funkcijas, piemēram, darījumi; iekšējie savienojumi, drukātās kolonnas utt.
  • Infrastruktūras investīcijas: Lai Hbase būtu patiešām noderīga, jums jābūt pietiekami daudzām kopām

8) Kas Hbase ir kolonnu ģimenes?

Kolonnu saimes veido Hbase fiziskās glabāšanas pamatvienību, kurai tiek piemērotas tādas funkcijas kā saspiešana.

9) Paskaidrojiet, kas ir rindas taustiņš?

Rindas atslēgu nosaka lietojumprogramma. Tā kā kombinētā atslēga ir iepriekš fiksēta rindas atslēgā, tā ļauj lietojumprogrammai noteikt vēlamo kārtošanas secību. Tas arī ļauj loģiski grupēt šūnas un pārliecināties, vai visas šūnas ar vienu un to pašu rindu atrodas vienā serverī.

10) Izskaidrojiet dzēšanu Hbase? Pieminiet, kādi ir trīs kapa pieminekļu marķieru veidi Hbase?

Dzēšot šūnu Hbase, dati faktiski netiek izdzēsti, bet tiek iestatīts kapa pieminekļa marķieris, padarot izdzēstās šūnas neredzamas. Dzēstā Hbase tiek faktiski noņemta blīvēšanas laikā.

Ir trīs veidu kapu pieminekļu marķieri:

  • Versijas dzēšanas marķieris: dzēšanai tas apzīmē vienu kolonnas versiju
  • Kolonnas dzēšanas marķieris: dzēšanai tas apzīmē visas kolonnas versijas
  • Ģimenes dzēšanas marķieris: dzēšanai tas atzīmē visu kolonnu grupas kolonnu

11) Paskaidrojiet, kā Hbase faktiski izdzēš rindu?

Programmā Hbase viss, ko jūs rakstīsit, tiks saglabāts no RAM uz disku, šie diska raksti ir nemaināmi, neļaujot blīvēt. Dzēšanas procesa laikā Hbase galvenajā blīvēšanas procesā tiek dzēsts marķieris, bet nelieliem blīvējumiem tas nav. Parasti dzēšot, tiek izdzēsts kapa pieminekļa marķieris - šie izdzēstie dati, kurus tie pārstāv, tiek noņemti blīvēšanas laikā.

Turklāt, ja izdzēsīsit datus un pievienosiet vairāk datu, bet ar agrāku laika zīmogu nekā kapa pieminekļa laika zīmogs, turpmākais Gets var tikt maskēts ar dzēšanas / kapa pieminekļa marķieri, un tādējādi jūs saņemsit ievietoto vērtību tikai pēc galvenā blīvēšanas.

12) Paskaidrojiet, kas notiek, ja maināt kolonnu grupas bloka lielumu jau aizņemtā datu bāzē?

Mainot kolonnu saimes bloka lielumu, jaunie dati aizņem jauno bloka izmēru, kamēr vecie dati paliek vecā bloka lielumā. Datu blīvēšanas laikā vecajiem datiem tiks noteikts jauns bloka lielums. Jauni faili tiek izskaloti, tiem ir jauns bloka izmērs, turpretī esošie dati joprojām tiks pareizi lasīti. Pēc nākamās lielās blīvēšanas visi dati jāpārveido uz jauno bloka izmēru.

13) Pieminiet atšķirību starp Hbase un Relāciju datu bāzi?

Hbase Relāciju datu bāze
  • Tas ir bez shēmas
  • Tas ir uz kolonnām orientēts datu krājums
  • To izmanto, lai uzglabātu de-normalizētus datus
  • Tajā ir reti apdzīvotas tabulas
  • Automatizētā sadalīšana tiek veikta Hbase
  • Tā ir uz shēmas balstīta datu bāze
  • Tas ir uz rindu orientēts datu krājums
  • To izmanto normalizētu datu glabāšanai
  • Tajā ir plāni galdi
  • Sadalīšanai nav šāda nodrošinājuma vai iebūvēta atbalsta

14) Kas ir HBaseFsck klase?

HBase ir pieejams rīka nosaukums, ko sauc par atpakaļ, kuru īsteno HBaseFsck klase. Tas piedāvā vairākus komandrindas slēdžus, kas ietekmē tā uzvedību.

15) Kādas ir galvenās HBase galvenās struktūras?

Rindas taustiņš un kolonnas taustiņš ir divas vissvarīgākās atslēgu struktūras, kuras tiek izmantotas HBase

16) Apspriediet, kā jūs varat izmantot filtrus Apache HBase

Filtri HBase apvalkā. Tas tika ieviests Apache HBase 0.92, kas palīdz jums veikt servera puses filtrēšanu, lai piekļūtu HBase virs HBase apvalka vai taupības.

17) HBase atbalsta sintakses struktūra, piemēram, SQL jā vai nē?

Nē, diemžēl SQL atbalsts HBase pašlaik nav pieejams. Tomēr, izmantojot Apache Phoenix, mēs varam iegūt datus no HBase, izmantojot SQL vaicājumus.

18) Ko nozīmē blīvēšana HBase?

Laikā, kad tiek saņemti smagi ienākoši ieraksti, nav iespējams sasniegt optimālu veiktspēju, ja katram veikalam ir viens fails. HBase palīdz jums apvienot visus šos HF failus, lai samazinātu diska sēklu skaitu katrai lasīšanai. Šis process ir pazīstams kā blīvēšana HBase.

19) Kā jūs īstenosiet iestāšanos HBase?

HBase, kas neatbalsta pievienošanos tieši, bet izmanto MapReduce darbavietas, pievienošanās vaicājumus var īstenot, izgūstot datus, izmantojot dažādas HBase tabulas.

20) Paskaidrojiet JMX par HBSE

Java pārvaldības paplašinājumi jeb JMX ir Java lietojumprogrammu eksporta statuss.

21) Kāda ir MasterServer izmantošana?

Master sever palīdz jums piešķirt reģionu arī reģiona serverim. Tas arī palīdz jums tikt galā ar slodzes līdzsvarošanu, ko mēs izmantojam MasterServer.

22) Definējiet taupības terminu

Apache Thrift ir rakstīts C ++. Tas nodrošina shēmu kompilatorus dažādām programmēšanas valodām, piemēram, C ++, Perl, PHP, Python, Ruby un citām.

23) Kāpēc jāizmanto klase HColumnDescriptor?

Sīkāka informācija par kolonnu saimi, piemēram, saspiešanas iestatījumi, Versiju skaits, tiek saglabāta. HColumnDescriptor.

24) Kas ir šūna HBase?

Šūna HBase ir mazākā Hbase tabulas vienība. Tas palīdz jums turēt datu kopu kā rindiņu {rinda, kolonna, versija}.

25) Kas ir Bloom filtrs?

HBase atbalsta Bloom filtru, kas palīdz uzlabot kopas kopējo caurlaidspēju. HBase Bloom Filter ir kosmosa ziņā efektīvs mehānisms, lai pārbaudītu, vai HFile satur noteiktu rindu vai rindu-kolu šūnu.

26) Pastāsti man par HBase darbību veidiem?

Ans. Divi HBase darbību veidi ir:

  • Izlasiet darbību
  • Rakstīšanas operācija

27) Kāda ir HBase HMaster izmantošana?

Galvenie kapteiņa pienākumi ir:

  1. Reģiona serveru koordinēšana
  2. Administratora funkcijas

28) Kādu tehniku ​​jūs varat izmantot HBase, lai tieši piekļūtu HFile bez HBase palīdzības?

Lai piekļūtu HFile tieši, neizmantojot HBase, mēs izmantojam metodi HFile.main ().

29) Vai reģiona serveris var atrasties visos DataNodes?

Jā, reģiona serveri darbojas tajos pašos serveros kā DataNodes

30) Nosauciet filtru, kas lapas parametrus pieņem kā parametru HBase

Filtrs ar nosaukumu PageFilter kā parametru pieņem lapas izmēru.

Šis dokuments ir sastādīts, izmantojot tūlītējos HTML pārveidotāja rīkus.