GNU/Linux >> LINUX-Kenntnisse >  >> Linux

Was ist eine verteilte Datenbank und wozu dienen verteilte Datensysteme?

Verteilte Datenbanken bieten einige entscheidende Vorteile gegenüber zentralisierten Datenbanken. Viele Unternehmen wechseln aus verschiedenen Gründen zu verteilten Datenbanken (bei denen die Datenbank, wie der Name schon sagt, über eine Reihe von Servern an verschiedenen Standorten verteilt ist). Betrachten wir einige der grundlegenden Vorteile verteilter Datenbanken, ein typisches Szenario, in dem sie verwendet werden, und die verschiedenen Formate, in denen Daten über das verteilte Datensystem verteilt werden.

Warum verteilte Datenbanken immer beliebter werden

Hier sind die Hauptgründe, warum viele Organisationen das zentralisierte Modell zugunsten der Datenbankverteilung hinter sich lassen:

  1. Zuverlässigkeit – Der Aufbau einer Infrastruktur ähnelt einer Investition:Diversifizieren Sie, um Ihre Verlustchancen zu verringern. Insbesondere wenn ein Ausfall in einem Verteilungsgebiet auftritt, erfährt die gesamte Datenbank keinen Rückschlag.
  2. Sicherheit – Sie können einzelnen Abschnitten der gesamten Datenbank Berechtigungen erteilen, um den internen und externen Schutz zu verbessern.
  3. Kostengünstig – Die Bandbreitenpreise sinken, da Benutzer seltener auf Remote-Daten zugreifen.
  4. Lokaler Zugriff – Ähnlich wie bei Nr. 1 oben können Sie bei einem Ausfall des Umbrella-Netzwerks immer noch auf Ihren Teil der Datenbank zugreifen.
  5. Wachstum – Wenn Sie Ihrem Unternehmen einen neuen Standort hinzufügen, ist es einfach, einen zusätzlichen Knoten innerhalb der Datenbank zu erstellen, wodurch die Verteilung hochgradig skalierbar wird.
  6. Geschwindigkeit und Ressourceneffizienz – Die meisten Anfragen und andere Interaktionen mit der Datenbank werden lokal ausgeführt, wodurch der Remote-Datenverkehr verringert wird.
  7. Verantwortung und Eindämmung – Da Störungen oder Ausfälle lokal auftreten, ist das Problem eingedämmt. Es kann möglicherweise von den IT-Mitarbeitern gehandhabt werden, die für diesen Teil des Unternehmens bestimmt sind.

Wer verwendet verteilte Datenbanken?

Häufig werden verteilte Datenbanken von Organisationen verwendet, die zahlreiche Büros oder Ladenfronten an verschiedenen geografischen Standorten haben. Typischerweise interagiert eine einzelne Niederlassung hauptsächlich mit den Daten, die ihren eigenen Betrieb betreffen, wobei allgemeine Unternehmensdaten viel seltener benötigt werden.
In diesem Fall besteht ein uneinheitlicher Bedarf an zentralen Informationen aus den Niederlassungen. Das Home Office des Unternehmens muss jedoch weiterhin einen stetigen Informationsfluss von jedem Standort haben.
Um dieses Problem zu lösen, funktioniert eine verteilte Datenbank normalerweise so, dass jeder Unternehmensstandort während der Arbeitszeit direkt mit seiner eigenen Datenbank interagieren kann. Außerhalb der Spitzenzeiten erhält die gesamte Datenbank jeden Tag einen Stapel Daten von jeder Filiale.

Arten verteilter Daten

Replizierte Daten – Die Replikation von Daten wird verwendet, um zusätzliche Dateninstanzen in verschiedenen Teilen der Datenbank zu erstellen. Mit dieser Taktik kann eine verteilte Datenbank übermäßigen Datenverkehr vermeiden, da auf identische Daten lokal zugegriffen werden kann. Verteilte Daten können wie unten beschrieben in fünf Grundtypen unterteilt werden:

Diese Form von Daten wird in zwei unterschiedliche Typen unterteilt:schreibgeschützte und schreibbare Daten. Beschreibbare Versionen können angepasst werden, wodurch die erste Instanz sofort geändert wird, mit verschiedenen Konfigurationen dafür, wie und wann alle Replikationen im gesamten System das Update erfahren. Nur-Lese-Versionen erlauben auch Überarbeitungen der ersten Instanz, und dann werden die Replikationen entsprechend angepasst.

In diesem verteilten Datensystem können Aktualisierungen basierend darauf konfiguriert werden, wie wichtig es ist, dass die Datenbank von Moment zu Moment (oder über einen beliebigen Zeitraum) die richtigen Angaben enthält. Beachten Sie, dass die Replikation besonders wertvoll ist, wenn Sie keine Revisionen benötigen, die im gesamten verteilten Datensystem in Echtzeit erscheinen.

Diese Art von Daten macht es einfach, Daten aus einem beliebigen Abschnitt an einen anderen Abschnitt der größeren Datenbank zu liefern, wenn die Daten des letzteren Abschnitts durch einen Fehler beeinträchtigt sind. Beachten Sie jedoch, dass es bei der Replikation zu Kollisionen kommt kann auftreten. Es müssen Sicherheitsvorkehrungen getroffen werden, um sie zu verhindern/zu lösen.

Horizontal fragmentierte Daten – Diese Kategorie der Datenverteilung beinhaltet die Verwendung von Primärschlüsseln (die sich jeweils auf einen Datensatz in der Datenbank beziehen). Die horizontale Fragmentierung wird häufig in Situationen verwendet, in denen bestimmte Unternehmensstandorte normalerweise nur Zugriff auf die Datenbank ihrer spezifischen Branche benötigen.

Vertikal fragmentierte Daten – Bei der vertikalen Fragmentierung werden wieder Primärschlüssel verwendet. In diesem Fall sind jedoch Kopien des Primärschlüssels in jedem Abschnitt der Datenbank verfügbar (zugänglich für jeden Zweig). Diese Art von Format eignet sich gut für Situationen, in denen eine Zweigstelle eines Unternehmens und der zentrale Standort mit denselben Konten interagieren, jedoch möglicherweise auf unterschiedliche Weise (z. B. Änderungen der Kontaktinformationen des Kunden im Vergleich zu Änderungen der Finanzzahlen).

Reorganisierte Daten – Reorganisation bedeutet, dass Daten auf die eine oder andere Weise angepasst wurden, wie es für Entscheidungsunterstützungsdatenbanken typisch ist. In einigen Fällen gibt es zwei unterschiedliche Systeme, die Transaktionen und Entscheidungshilfen handhaben. Während Entscheidungsunterstützungssysteme technisch schwieriger zu warten sein können, erfordert die Online-Transaktionsverarbeitung (OLTP) häufig eine Neukonfiguration, um große Mengen von Anfragen zu ermöglichen.

Separate Schemadaten – Diese Kategorie unterteilt die Datenbank und die Software, die für den Zugriff verwendet wird, um sie an verschiedene Abteilungen und Situationen anzupassen – beispielsweise Benutzerdaten vs. Produktdaten. Normalerweise überschneiden sich die verschiedenen Datenbanken innerhalb dieser Art von Verteilung.

Weitere Informationen zu den Arten von verteilten Datenbanken und Sicherheit finden Sie in unserem Blogbeitrag dazu hier. Atlantic.Net verpflichtet sich, über unsere Ressourcenseite, die Anleitungen, Artikel und häufig gestellte Fragen enthält, mit den besten neuen Fortschritten in der Technologie Schritt zu halten.

***

Wie Sie sehen können, stellen verteilte Datenbanken einen enormen technologischen Fortschritt dar. Es überrascht nicht, dass sich Unternehmen von zentralisierten Datenbanken abwenden und das verteilte Modell annehmen. Atlantic.net bietet viele Hosting-Optionen für verschiedene Unternehmen, darunter Windows Private Cloud-Hosting, virtuelle private Server, verwaltetes Cloud-Server-Hosting, HIPAA-konformes Hosting und unsere preisgekrönten superschnellen SSD-VPS-Hosting-Server.


Linux
  1. Wann ist Dd zum Kopieren von Daten geeignet? (oder wann sind Read() und Write() partiell)?

  2. Wofür sind Inodes gut?

  3. Elasticsearch Distributed NoSQL Database – Was ist das und sollten Sie es verwenden?

  4. Wozu dient die .la-Datei von libtool?

  5. Oberster Linux-Befehl:Was sind us, sy, ni, id, wa, hi, si und st (für die CPU-Auslastung)?

Was ist eine Dokumentendatenbank?

Was ist eine OLTP-Datenbank?

Was ist Datenbank-Denormalisierung?

Was ist eine Datenbank?

Die 15 besten Datenbankverwaltungssysteme für Linux Desktop

Übersicht über verteilte Datenbanktypen und Sicherheit