Zvaigžņu un sniegpārslu shēma datu noliktavā ar piemēriem

Satura rādītājs:

Anonim

Kas ir daudzdimensionāla shēma?

Daudzdimensionālā shēma ir īpaši izstrādāta, lai modelētu datu noliktavas sistēmas. Shēmas ir izstrādātas, lai apmierinātu ļoti lielu datu bāzu, kas paredzētas analītiskiem mērķiem (OLAP), unikālās vajadzības.

Datu noliktavas shēmas veidi:

Tālāk ir norādīti 3 galvenie daudzdimensionālo shēmu veidi, kuriem katram ir savas unikālās priekšrocības.

  • Zvaigžņu shēma
  • Sniegpārslu shēma
  • Galaxy shēma

Šajā apmācībā jūs uzzināsiet vairāk par

  • Kas ir zvaigžņu shēma?
  • Kas ir sniegpārslu shēma?
  • Zvaigžņu shēmas Vs sniegpārslu shēma: galvenās atšķirības
  • Kas ir Galaxy shēma?
  • Kas ir Zvaigžņu kopu shēma?

Kas ir zvaigžņu shēma?

Zvaigžņu shēma datu noliktavā, kurā zvaigznes centrā var būt viena faktu tabula un vairākas saistītas dimensiju tabulas. Tas ir pazīstams kā zvaigžņu shēma, jo tā struktūra atgādina zvaigzni. Zvaigžņu shēmas datu modelis ir vienkāršākais datu noliktavas shēmas veids. Tas ir arī pazīstams kā Star Join Schema un ir optimizēts lielu datu kopu vaicājumiem.

Šajā Zvaigžņu shēmas piemērā faktu tabula atrodas centrā, kurā ir katras dimensijas tabulas atslēgas, piemēram, Dīlera_ID, Modeļa ID, Datuma_ID, Produkta_ID, Nozares_ID un citi atribūti, piemēram, Pārdotās vienības un ieņēmumi.

Zvaigžņu shēmas diagrammas piemērs

Zvaigžņu shēmas raksturojums:

  • Katra zvaigžņu shēmas dimensija tiek attēlota ar vienīgo dimensiju tabulu.
  • Dimensiju tabulā jābūt atribūtu kopai.
  • Dimensiju tabula ir savienota ar faktu tabulu, izmantojot svešu atslēgu
  • Dimensiju tabula nav savstarpēji savienota
  • Faktu tabulā būtu iekļauta atslēga un mērs
  • Star shēma ir viegli saprotama un nodrošina optimālu diska lietojumu.
  • Dimensiju tabulas nav normalizētas. Piemēram, iepriekš redzamajā attēlā Country_ID nav valsts uzmeklēšanas tabulas, kāda būtu OLTP noformējumam.
  • Shēmu plaši atbalsta BI rīki

Kas ir sniegpārslu shēma?

Sniegpārslu shēma datu noliktavā ir loģisks tabulu izvietojums daudzdimensionālā datu bāzē tā, ka ER diagramma atgādina sniegpārslas formu. Sniegpārslu shēma ir Zvaigžņu shēmas paplašinājums, un tā pievieno papildu dimensijas. Dimensiju tabulas tiek normalizētas, kas datus sadala papildu tabulās.

Šajā sniegpārslas shēmas piemērā valsts tiek tālāk normalizēta atsevišķā tabulā.

Sniegpārslu shēmas piemērs

Sniegpārslu shēmas raksturojums:

  • Galvenais sniegpārslas shēmas ieguvums ir mazāka diska vieta.
  • Shēmai tiek pievienota dimensijas vienkāršāka ieviešana
  • Vairāku tabulu dēļ vaicājumu veiktspēja ir samazināta
  • Galvenais izaicinājums, ar kuru nāksies saskarties, lietojot sniegpārslu shēmu, ir tas, ka jāveic vairāk apkopes, jo ir vairāk uzmeklēšanas tabulu.

Zvaigžņu shēmas Vs sniegpārslu shēma: galvenās atšķirības

Tālāk ir galvenā atšķirība starp Zvaigžņu shēmu un Sniegpārslu shēmu:

Zvaigžņu shēma Sniegpārslu shēma
Dimensiju hierarhijas tiek saglabātas izmēru tabulā. Hierarhijas ir sadalītas atsevišķās tabulās.
Tajā ir faktu tabula, ko ieskauj izmēru tabulas. Viena faktu tabula, ko ieskauj dimensiju tabula, kuru savukārt ieskauj dimensiju tabula
Zvaigžņu shēmā tikai viena savienošana rada attiecības starp faktu tabulu un visām dimensiju tabulām. Sniegpārslas shēmai nepieciešami daudzi savienojumi, lai iegūtu datus.
Vienkāršs DB dizains. Ļoti sarežģīts DB dizains.
Denormalizētā datu struktūra un vaicājumi darbojas arī ātrāk. Normalizēta datu struktūra.
Augsts datu atlaišanas līmenis Ļoti zema līmeņa datu atlaišana
Vienas dimensijas tabulā ir apkopoti dati. Dati sadalīti dažādās dimensiju tabulās.
Kubu apstrāde notiek ātrāk. Kubu apstrāde var būt lēna sarežģītās savienojuma dēļ.
Piedāvā labākos vaicājumus, izmantojot Star Join Query Optimization. Galdi var būt savienoti ar vairākām dimensijām. Sniegpārslas shēmu attēlo centralizēta faktu tabula, kas, visticamāk, nav saistīta ar vairākām dimensijām.

Kas ir Galaxy shēma?

Galaxy shēma ir divi faktu tabula ka akciju dimensiju tabulas starp tiem. To sauc arī par faktu zvaigznāju shēmu. Shēma tiek uzskatīta par zvaigžņu kolekciju, tāpēc nosaukums ir Galaxy Schema.

Galaxy Schema piemērs

Kā redzat iepriekšējā piemērā, ir divas faktu tabulas

  1. Ieņēmumi
  2. Produkts.

Galaxy shēmā koplietošanas dimensijas sauc par Conformed Dimensions.

Galaxy shēmas raksturojums:

  • Šīs shēmas izmēri ir sadalīti atsevišķās dimensijās, pamatojoties uz dažādiem hierarhijas līmeņiem.
  • Piemēram, ja ģeogrāfijai ir četri hierarhijas līmeņi, piemēram, reģions, valsts, štats un pilsēta, tad Galaxy shēmai jābūt četrām dimensijām.
  • Turklāt ir iespējams izveidot šāda veida shēmu, sadalot vienas zvaigznes shēmu vairākās Star shēmās.
  • Šajā shēmā, kas ir nepieciešama, lai izveidotu, pamatojoties uz hierarhijas līmeņiem, izmēri ir lieli.
  • Šī shēma ir noderīga faktu tabulu apkopošanai, lai labāk izprastu.

Kas ir Zvaigžņu kopu shēma?

Sniegpārslu shēma satur pilnībā paplašinātas hierarhijas. Tomēr tas var padarīt shēmu sarežģītāku un prasa papildu pievienošanās. No otras puses, zvaigžņu shēma satur pilnībā sabrukušas hierarhijas, kas var novest pie atlaišanas. Tātad labākais risinājums var būt līdzsvars starp šīm divām shēmām, kas ir Zvaigžņu kopas shēmas dizains.

Zvaigžņu kopas shēmas piemērs

Dimensijas, kas pārklājas, hierarhijās var atrast kā dakšiņas. Dakša notiek, ja uzņēmums darbojas kā vecāks divās dažādās dimensiju hierarhijās. Pēc tam dakšu vienības tiek identificētas kā klasifikācijas ar attiecībām viens pret daudziem.

Kopsavilkums:

  • Daudzdimensionāla shēma ir īpaši izstrādāta, lai modelētu datu noliktavas sistēmas
  • Zvaigžņu shēma ir vienkāršākais datu noliktavas shēmas veids. Tas ir pazīstams kā zvaigžņu shēma, jo tā struktūra atgādina zvaigzni.
  • Sniegpārslu shēma ir Zvaigžņu shēmas paplašinājums, un tā pievieno papildu dimensijas. To sauc par sniegpārsliņu, jo tā diagramma atgādina sniegpārsliņu.
  • Zvaigžņu shēmā tikai viens savienojums nosaka attiecības starp faktu tabulu un visām dimensiju tabulām.
  • Zvaigžņu shēma satur faktu tabulu, kuru ieskauj dimensiju tabulas.
  • Sniegpārslu shēmu ieskauj izmēru tabula, kuru savukārt ieskauj izmēru tabula
  • Sniegpārslas shēmai nepieciešami daudzi savienojumi, lai iegūtu datus.
  • Galaxy Schema satur divas faktu tabulas, kas koplieto dimensiju tabulas. To sauc arī par faktu zvaigznāju shēmu.
  • Zvaigžņu kopas shēma satur zvaigžņu un sniegpārslu shēmas atribūtus.