Was läuft im Hintergrund der Lösungen ab, an denen wir für Sie tüfteln? Erfahren Sie mehr in den Tech-Talk Beiträgen.
In der Technologiebranche ist Thomas Dierl zuhause, in Datenbanken kennt er sich hervorragend aus.
Große Datenmengen rasch und intuitiv analysieren: mit einem Cube ist das möglich. Vor allem dann, wenn es um die Erfassung der Informationen aus mehreren Perspektiven (Dimensionen) geht. Worauf sollten Sie bei der Datenablage im Cube besonders achten? Was haben tabulare und multidimensionale Modelle damit zu tun - und welche Option empfehlen wir? In wenigen Minuten wissen Sie mehr.
Der Cube ist eine multidimensionale Datenbank. Demnach lassen sich Daten auf verschiedene Art und Weise in einem Cube ablegen. Je nach dem, für welche Ablage Sie sich entscheiden, hat das Auswirkungen auf zwei Dinge:
Verschiedene Aufgaben erfordern besondere Eigenschaften bei der Verarbeitung. Es gilt also zu überlegen, welche Aufgaben Sie mit dem Cube lösen wollen. Je nach Anforderungen stehen zwei unterschiedliche Modelle zur Verfügung.
Grundsätzlich stehen zwei Arten an Modellen zur Auswahl, mit denen Sie Ihre Daten im Cube ablegen können: tabulare Modelle und multidimensionale Modelle.
Tabulare Modelle speisen die Daten aus relationalen Datenbanken. Die Metadaten übernehmen sie dabei von OLAP-Konstrukten. Der Begriff „OLAP“ steht für „Online Analytical Processing“ und bezeichnet die multidimensionale Datenspeicherung.
Der SQL Server kennt verschiedene Versionen von Tabularen Modellen:
Alle drei Versionen haben jeweils verschiedene Funktionsumfänge.
Ab SQL Server 2016 gibt es zwei wesentliche Entwicklungen, die für die Definition des Cubes verwendet werden:
Das sind entscheidende Umstellungen zur älteren Version. Damit einher gehen viele neue Funktionen, wie z.B. die Nutzung von Power Query (M).
Diese Modellart basiert vollständig auf OLAP-Konstrukten, also auf multidimensionaler Datenspeicherung. Multidimensionale Modelle existieren seit dem SQL Server 2000 - und sind seitdem kaum wesentlich verändert worden.
Eine Variante von OLAP ist ROLAP (Relational Online Analytical Processing). Diese Art der Datenverarbeitung verbindet manche Eigenschaften von relationalen und multidimensionalen Tabellen.
Multidimensionale Modelle bieten teils andere Möglichkeiten als tabulare Modelle. Entnehmen Sie die primären Unterschiede der nachfolgenden Tabelle (kein Anspruch auf Vollständigkeit).
Multidimensionale vs. Tabulare Modelle: wesentliche Unterschiede
Funktion | Multidimensionale Modelle | Tabulare Modelle |
---|---|---|
Aktionen | Ja | Nein |
Aggregationen | Ja | Nein |
Berechnete Spalten | Nein | Ja |
Berechnete Tabelle | Nein | Ja, ab 2016 |
Power Query (M) | Nein | Ja, ab 2017 |
M:N Beziehungen | Ja | Nein |
Daten zurückschreiben | Ja | Nein |
Die Auswahl des Modell-Typs hängt im Wesentlichen von der Datenmenge und der Art der Daten ab, die verarbeitet werden sollen. Auch Überlegungen zur Query Language und den Sicherheitseinstellungen bieten sich an.
Daten in Tabularen Modellen lassen sich mittels zwei verschiedener Methoden abfragen: In-Memory oder Direct Query. Wie bereits im Blogbeitrag SSAS: In-Memory vs. Live-Query Abfragen beschrieben, verursacht das große Unterschiede im Ressourcenverbrauch.
OLAP Modelle sind für sehr große Datenmengen konzipiert und bewältigen daher das Laden der Daten auf die Festplatte sowie die Verarbeitung In-Memory.
Multidimensionale Modelle vermögen es, Daten aus Relationalen Datenquellen mittels OLE DB zu laden.
Tabulare Modelle wiederum laden die Daten aus Relationalen Datenquellen und weiteren, wie zum Beispiel REST APIs. Vor allem ab Kompatibilitätslevel 1400 kommen vielen neue Datenquellen hinzu, die im Standard unterstützt werden.
Neben Datenmenge und -quelle unterscheiden sich Tabulare und Multidimensionale Modelle auch im Punkt "Query Language". Je nach Modell stehen andere zur Verfügung.
Verfügbare Query-Languages je Modell
Tabulare Modelle | Multidimensionale Modelle |
---|---|
DAX | DAX |
MDX | MDX |
ASSL (ab Kompatibilitätslevel 1050) | ASSL |
TMSL (ab Kompatibilitätslevel 1200) |
Last but not least: die beiden Modelltypen bringen verschiedene Möglichkeiten an Sicherheitseinstellungen mit sich.
Tabulare Modelle können auf Zeilen-Level eingeschränkt werden. Das funktioniert bei Multidimensionalen Modellen auch. Darüber hinaus lassen sich dort die Zugriffe auch auf Zellen-Ebene regeln.
Welches Modell empfehlen wir Ihnen jetzt? Eine klare Antwort gibt es nicht. Die Entscheidung hängt von mehreren Faktoren ab:
Sie wünschen eine professionelle Beratung zur Verbesserung Ihres Workflows mit dem Cube? Kontaktieren Sie uns noch heute.