Klasyfikacja baz danych: opcje, modele danych i kluczowe cechy

Baza danych oznacza zbiór danych, które muszą być zorganizowane, a system zarządzania bazą danych (DBMS) jest odpowiedzialny za administrowanie nimi, a więc definiowanie struktury, porządku, praw dostępu i zależności. Wykorzystywany jest do tego celu własny kompilator i odpowiedni model - określa to architekturę systemu bazodanowego. Na podstawie architektury dokonuje się klasyfikacji baz danych.

Historia tworzenia

Bazy danych (DB) to systemy o strukturze logicznej do elektronicznej administracji, która odbywa się za pomocą systemu zarządzania bazą danych (DBMS), poprzez dodanie go do repozytorium. Większość baz danych może być otwierana, edytowana i konsultowana tylko za pomocą określonej aplikacji. Zasady te są wykorzystywane do klasyfikacji baz danych. W latach 60. XX w. zaczęto rozwijać koncepcję elektronicznej bazy danych jako oddzielnej warstwy oprogramowania pomiędzy systemem operacyjnym a programem użytkowym.

Idea elektronicznego systemu baz danych stała się jedną z najistotniejszych innowacji w rozwoju komputerów. Pierwszymi modelami, które powstały, były hierarchiczne i sieciowe bazy danych. IBM zrewolucjonizował ten sektor w latach siedemdziesiątych, opracowując model relacyjnej bazy danych. Najbardziej udanymi produktami w tym czasie były: język zapytań bazy danych Oracle SQL oraz następcy IBM, SQL/DS i DB2.

Pojęcie baz danych i klasyfikacja baz danych

Systemy baz danych są dziś ważne w wielu dziedzinach nauki, techniki i zastosowań użytkowych. Każdy rodzaj oprogramowanie, przeznaczony dla firm, oparty na solidnej bazie danych z wieloma opcjami i narzędziami do administratorzy systemu. Coraz większe znaczenie ma również bezpieczeństwo danych, hasła, dane osobowe, a nawet waluty elektroniczne są przechowywane i szyfrowane w elektronicznych bazach danych.

Współczesny system finansowy to nic innego jak sieć baz danych, w której duża część pieniędzy istnieje wyłącznie w postaci elektronicznych jednostek danych, których ochrona za pomocą bezpiecznej bazy danych jest jednym z głównych zadań instytucji finansowych.

Pojęcie bazy danych i klasyfikacja baz danych

W zależności od zmienności bazy danych, jej typ jest klasyfikowany jako statyczny lub dynamiczny.

Statyczne funkcje bazy danych:

  1. Zezwolenie tylko na odczyt danych, z wyłączeniem modyfikacji.
  2. Używane do biografii i faktów historycznych lub skryptów, do których można sięgnąć w celach badawczych, bez konieczności zmiany treści.
  3. Są one bezpieczne i łatwe w użyciu podczas łączenia się z siecią.

Funkcje dynamicznej bazy danych:

  1. Mają pojęcie samorządności.
  2. Możliwość łączenia się w dynamiczne sieci.
  3. Ta asocjacja strukturalna umożliwia przechowywanie i aktualizację informacji o bazie danych.
  4. Wykorzystuje HTML jako język komunikacji pomiędzy siecią a dynamiczną bazą danych.
  5. Najczęściej używane języki dla Dynamiczne sieci związane z BBDD: Perl, CGI, PHP, JSP i ASP.

Główne DBMS-y współpracujące z dynamicznymi stronami internetowymi to PostgresQL, MySQL, Oracle i Microsoft SQL.

Aby zrozumieć, jakie są możliwości klasyfikacji baz danych używanych w środowiskach naukowych i edukacyjnych, należy rozważyć:

  • Bibliograficzne;
  • Dokument;
  • Specjalizacja;
  • katalogi.

Funkcjonalność bibliograficznych baz danych:

  1. Powiązanie ze starymi zapisami, które zawierają informacje o lokalizacji książki lub dokumentu.
  2. Nie zawierają pełnego tekstu, a jedynie odnośnik.
  3. Dzięki formatom takim jak PDF, umożliwia dostęp do oryginalnych artykułów, na które się powołuje.
  4. Wraz z postępem technologicznym pojawiają się odniesienia z innych mediów.

Cechy specjalistycznych baz danych:

  1. Zawiera precyzyjne informacje i jest zorientowany na temat.
  2. Stosowane w środowiskach akademickich i naukowych.
  3. W niektórych przypadkach nie są brane pod uwagę jako prawidłowy BBDD: np. książka telefoniczna, lista kontaktów firmy lub firmy międzynarodowej.

Elektroniczne modele przetwarzania

Chcąc szczegółowo zbadać kwestię, jakie są możliwości klasyfikacji baz danych, nie można ominąć tematu modeli. Hierarchiczne bazy danych jako pierwsze zostały opracowane w latach 60. XX wieku w pismach Holleritha, zależą one od rodzaju przechowywania informacji 1N/ NN w postaci odwróconego drzewa.

Relacja jest typu 1N, gdzie węzeł rodzica może mieć kilka węzłów dzieci, ale węzeł dziecka nie może należeć do więcej niż jednego węzła rodzica. Ich wadą jest to, że redundancja danych nie jest dobrze reprezentowana.

Model sieci baz danych zaproponowany przez CODASYL jest jego pierwszym systemem zarządzania (IMS), pojawił się w 1968 roku dla programu NASA "Apollo". Rozwiązał on niektóre problemy poprzedniego modelu hierarchicznego, które w nowoczesnym procesie IT nie są już prawie stosowane.

Aby zrozumieć nowoczesny model, musimy zastanowić się, jakie relacje istnieją między węzłami rodzicami i dziećmi w klasyfikacji bazy danych. Obecnie stosuje się relacje typu NN, gdzie węzeł podrzędny dziecka może należeć do więcej niż jednego węzła nadrzędnego. Wraz z modelem hierarchicznym tworzy pierwszą generację bazy danych.

Zalety modelu: oferują doskonałą stabilność, dobrą wydajność i lepszą redundancję przetwarzania. Wadą modelu jest złożoność systemu, który wymaga wiedzy programistycznej.

Cechy transakcyjnych baz danych:

  1. Jedynym celem jest wysyłanie i odbieranie danych z dużą prędkością.
  2. Koncentrują się na analizie jakości i danych produkcyjnych.
  3. Unikatowym celem jest gromadzenie i pobieranie danych tak szybko jak to możliwe, więc redundancja i powielanie informacji nie jest problemem, jak w przypadku innych baz danych.
  4. Umożliwić połączenie z relacyjnymi bazami danych.
  5. Transakcje są atomowe, w tym typie możliwe jest tylko wykonanie ich w całości (integralność) lub wcale.

Główne różnice w bazach danych

Dokumentalista - zwraca treści, pracuje z dokumentami poznawczymi i koncepcyjnymi, należy do środowiska intelektualnego i akademickiego. Posiadają menedżery dokumentów i treści, takie jak CDS/ISIS, Filemaker, Knosys lub Imagic Text do kontroli terminologii. Są one łatwo dostępne przy użyciu standardowych języków zapytań i posiadają klasyfikację bazy danych według typu modelu danych.

Relacyjne opierają się na tworzeniu powiązań między zbiorami danych, zorganizowanymi w tabelach spełniających pewne podstawowe wymagania. Mają one stałą liczbę pól. Każdy atrybut ma nazwę i wiele możliwych wartości. Każdy rekord jest unikalny i identyfikowany przez klucz. Implementują one język zapytań SQL i opierają się na modelu opracowanym w latach 70. przez Edgara Codda.

Złota zasada

Obiektowe bazy danych zwracają fizyczne pliki lub kod programu i zostały wdrożone pod koniec XX wieku. Stosowane w produkcji przemysłowej i projektowaniu. Operować w języku zorientowanym obiektowo, takim jak C++ lub Python. Comply "złota zasada": spójność, menedżer pamięci wtórnej, współbieżność, odzyskiwanie i obiekt zapytań.

Systemy zarządzania DBMS

Systemy zarządzania DBMS

System zarządzania bazą danych (DBMS) to termin określający funkcje i wymagania dotyczące transakcji w systemie zarządzania bazą danych, w skrócie ACID od Atomicity, Consistency, Isolation i Durability. Te cztery parametry obejmują najważniejsze wymagania dotyczące baz danych zgodnych z ACID:

  1. Atomowość oznaczające właściwość "wszystko albo nic" menedżerów bazy danych, aby zapytanie było poprawne, transakcja wykonana prawidłowo i zrealizowana z zachowaniem odpowiedniej kolejności procedur.
  2. spójność, czyli koherencja, gdzie transakcja w bazie danych pozostaje stabilna, co wymaga ciągłego monitorowania wszystkich operacji.
  3. Izolacja to warunek i gwarancja, że transakcje nie będą ze sobą kolidować, co zwykle osiąga się przez blokowanie pewnych funkcji, które izolują dane biorące udział w transakcji.
  4. Długowieczność oznacza, że DBMS zachowuje wszystkie dane w długim okresie czasu, nawet po dokonaniu transakcji, a także w przypadku awarii systemu, jeśli DBMS ulegnie awarii. Dla ten warunek wymagane są rejestry transakcji, które rejestrują wszystkie zachodzące procesy.

Klasyfikacja funkcji i wymagań

Baza danych przechowuje informacje i wiąże je w logiczną całość wraz z metadanymi, konieczny dla przetwarzanie. Jest to bardzo przydatne narzędzie do zarządzania dużymi plikami za pomocą prostego zapytania, z systemem uprawnień, który określa, którzy użytkownicy lub programy mają prawa dostępu.

Klasyfikacja funkcji i wymagań

Klasyfikacja bazy danych:

Funkcja

Miejsce przeznaczenia

Dane o sklepie

Teksty, dokumenty, hasła są przechowywane w bazie danych. Elektroniczny dostęp do danych możliwy jest poprzez konsultacje.

Modyfikacja danych

W zależności od tego, jakie uprawnienia są dostępne, większość baz danych pozwala na edycję filtrów ochrony danych.

Czyste dane

Wpisy w większości opcji klasyfikacji bazy danych mogą być całkowicie usunięte, nie pozostawiając żadnych braków. W niektórych przypadkach usunięte dane można odzyskać, ale w innych są one trwale usuwane.

Zarządzaj metadanymi

Informacje są zwykle przechowywane z metadanymi lub metatagami, które utrzymują porządek w bazie danych i umożliwiają funkcję wyszukiwania. Metadane są również często wykorzystywane do regulowania uprawnień.

Bezpieczeństwo danych

Bazy danych muszą być chronione, aby uniemożliwić nieupoważnionym osobom dostęp do przechowywanych w nich informacji.

integralność danych

Integralność danych oznacza, że muszą one spełniać określone zasady dla zapewnienie ich poprawności oraz zdefiniowanie logiki biznesowej banku danych.

Funkcja Multiuser

Aplikacje bazodanowe umożliwiają dostęp z różnych urządzeń. Przydzielanie uprawnień i bezpieczeństwo danych są elementarne w multi-tenancy.

Optymalizacja zapytań

Technicznie baza danych musi być w stanie przetwarzać zapytania w najlepszy możliwy sposób, aby zagwarantować dobre wydajność.

Wyzwalacze i procedury przechowywane

Te dwie procedury są mini-aplikacjami przechowywanymi w bazie danych. Wyzwalacze i procedury przechowywane są typowymi procesami relacyjnych baz danych.

Przejrzystość systemu

Przejrzystość systemu jest istotna, zwłaszcza w modelach klasyfikacji rozproszonych baz danych.

model hierarchiczny

Model hierarchiczny

Różnice między najczęściej spotykany Modele DB są wynikiem technicznej ewolucji elektronicznego transferu danych, która nie tylko realizowała cele wydajności i łatwości zarządzania, ale także rozszerzyła możliwości najbardziej znanych dostawców. Jest to najstarszy model i obecnie znacznie przewyższa model relacyjny, choć ostatnio nastąpił wzrost jego popularności.

XML wykorzystuje ten system do przechowywania informacje. Niektóre firmy ubezpieczeniowe i banki mają dostęp do hierarchicznych baz danych w najstarszych aplikacjach. Najbardziej znaną jest baza IBM IMS/DB.

W modelu klasyfikacji danych hierarchicznej bazy danych występują ścisłe i jednoznaczne zależności. Każdy wpis ma tylko jeden precedens (Parent-Child Relationships, PCR), oprócz korzenia, który tworzy schemat drzewa. Chociaż każdy węzeł dziecięcy może mieć tylko jeden węzeł rodzicielski, "rodzice" mogą mieć dowolną liczbę węzłów dziecięcych.

Biorąc pod uwagę ścisłe uporządkowanie hierarchiczne, poziomy, które nie są bezpośrednio połączone, nie oddziałują ze sobą, więc nie jest łatwo połączyć dwa różne drzewa. Hierarchiczne struktury baz danych są niezwykle elastyczne i proste. Wpisy z "dzieci" nazywane są rekordami, a te bez nich nazywane są liśćmi i są zwykle dokumentami w rekordzie dla liści w klasyfikacji bazy danych. Zapytania do hierarchicznej bazy danych docierają do liści, zaczynając od korzenia i przechodząc przez poszczególne rekordy.

Graficznie zorientowany DMS

Model sieciowy ewoluował niemal równocześnie z modelem relacyjnym, choć z czasem został pokonany przez konkurentów. W przeciwieństwie do modelu hierarchicznego, zapisy nie ujawniają tu ścisłych zależności "rodzic - dziecko", ale każdy z nich może mieć więcej niż jeden precedens, co daje mu strukturę sieciową do jego nazwy. Istnieje również unikalna i niezmienna ścieżka dostępu do rekordu.

W modelu sieciowej bazy danych nie ma stałej hierarchii, więc istnieje kilka ścieżek prowadzących do tego samego celu. Do rekordu znajdującego się w centrum obrazu teoretycznie można uzyskać dostęp z pięciu innych rekordów, a uzyskując dostęp do niego, można uzyskać dostęp do pięciu innych rekordów.

Zależności mogą być również zdefiniowane w modelu sieciowym - przypadek jw. Nie jest on bezpośrednio związany z rejestrem znajdującym się w skrajnie prawej pozycji, więc aby do niego dotrzeć musi przejść przez rejestr znajdujący się w centrum, który może go przyjąć lub odrzucić. Możesz połączyć się z tym w lewym górnym rogu. W modelu sieciowym rekordy są dodawane lub usuwane bez wpływu na globalną strukturę.

Ten model jest dziś stosowany w dużych komputerach. Inne obszary nadal opierają się na modelu hierarchicznym lub zwracają się ku modelowi relacyjnemu, który jest znacznie bardziej elastyczny i łatwy w użyciu. Niektóre znane modele sieciowych baz danych to UDS Siemens i DMS Sperry Univac. Z czasem obaj producenci opracowali również ciekawe formy mieszane pomiędzy modelem sieciowym a relacyjnym. Baza danych zorientowana na grafy, ze względu na swoją siatkową strukturę, jest uważana za współczesną ewolucję modelu sieciowego.

Graficznie zorientowany DMS Sperry Univac

Skalowalność pamięci masowej

W modelu bazy danych opartej na dokumentach dokumenty są podstawową jednostką przechowywania informacji. Są to jednostki, które nadają strukturę danym i nie należy ich mylić z dokumentami programów do obróbki tekstu. Tutaj dane są przechowywane w tzw. parach "klucz - wartość".

Ponieważ ani struktura, ani liczba par nie są zdefiniowane, dokumenty tworzące bazę danych zorientowaną na dokumenty mogą się bardzo różnić od siebie. Każdy dokument sam w sobie jest zamkniętą jednostką, a ustalenie relacji między dokumentami nie jest łatwe.

Bazy danych dokumentów przeżyły w ostatnich latach duży boom dzięki sukcesowi NoSQL, zwłaszcza ze względu na ich dobrą skalowalność. Przykład systemu bazodanowego tego typu to MongoDB. Model bazy danych zorientowany na dokumenty przechowuje dane w pojedynczych dokumentach, a nie w tabelach jak w modelu relacyjnym.

Systemy te są szczególnie interesujące dla aplikacji internetowych, ponieważ pozwalają na przechowywanie kompletnych formularzy HTML. Należy podkreślić, że istnieją zauważalne różnice pomiędzy różnymi systemami opartymi na dokumentach, od składni do wewnętrznej struktury, więc nie wszystkie bazy danych zorientowane na dokumenty nadają się do tego scenariusza. To właśnie z powodu tych różnic istnieje kilka systemów baz danych zorientowanych na reputację Lotus Notes, Amazon SimpleDB, MongoDB, CouchDB, Riak, ThruDB i OrientDB.

Zalety i wady

Mocne i słabe strony

Odpowiednie systemy zarządzania bazami danych pomagają uzyskać lepszy dostęp do danych i zoptymalizować zarządzanie nimi. Z kolei dostęp punktowy pomaga użytkownikom końcowym szybko i sprawnie wymieniać dane w ramach misji organizacji.

Model bazy danych

Rok utworzenia

Zalety

Wady

Hierarchiczny

1960-й

Bardzo szybki dostęp do odczytu, przejrzysta struktura, prosta technicznie.

Stała struktura w drzewie, która nie pozwala na połączenia między drzewami.

Sieć

Wczesne lata 70

Obsługuje kilka sposobów dostęp do zapisu, bez ścisłej hierarchii.

Słaby przegląd przy dużych bazach danych.

Relacyjny

1970-й

Proste, elastyczne tworzenie i edycja, łatwe rozszerzanie, szybkie uruchamianie, łatwa rozbudowa, szybkie uruchamianie, bardzo dynamiczny kontekst.

Niezarządzalne przy dużych ilościach danych, słabej segmentacji, sztucznych kluczowych atrybutach, zewnętrznym interfejsie programowania, słabych właściwościach i zachowaniu obiektów.

Zorientowany na podmiot

Koniec lat osiemdziesiątych

Lepsze wsparcie dla obiektowych języków programowania, przechowywania treści multimedialnych. Obsługuje języki programowania zorientowane obiektowo, Umożliwia przechowywanie treści multimedialnych.

Niższa wydajność przy dużych ilościach danych, niewiele kompatybilnych interfejsów.

Zorientowany na dokumenty

1980-е

Istotne dane są przechowywane centralnie w niezależnych dokumentach, wolna struktura, koncepcja multimedialna, odnosi się do klasyfikacji podmiotów bazy danych.

Praca organizacyjna jest stosunkowo duża, często wymaga umiejętności programowania.

Obszary zastosowania

Aplikacje

Ludzie mogą nie zdawać sobie z tego sprawy, ale bazy danych są wszędzie. Niezależnie od tego, czy ktoś wie o nich cokolwiek, czy nie, ich wpływ na codzienne życie jest ogromny. Od aplikacji pogodowych po filmy online, bazy danych odpowiadają za wiele usług, z których ludzie korzystają każdego dnia, a żeby nie pogubić się w rosnącej ilości informacji, stosuje się klasyfikację danych w bazach danych.

Obszary zastosowań systemów DBMS:

  1. Bankowość - dla informacji o klientach, rachunkach i kredytach oraz transakcjach bankowych.
  2. Linie lotnicze - informacje o rezerwacjach i rozkładach jazdy. Linie lotnicze były jednymi z pierwszych, które używały baz danych w sposób rozproszony geograficznie: terminale zlokalizowane na całym świecie miały dostęp do centralnego systemu baz danych poprzez linie telefoniczne i inne sieci transmisji danych.
  3. Uniwersytety - w celu uzyskania informacji o studentach, rejestracji na kursy i ocenach.
  4. Transakcje kartą kredytową - za zakupy kartą kredytową i miesięczne wyciągi.
  5. Telekomunikacja - do prowadzenia ewidencji wykonanych połączeń, przygotowywania miesięcznych rachunków, utrzymywania sald na przedpłaconych kartach telefonicznych oraz przechowywania informacji o sieci.
  6. Finanse - do przechowywania informacji o stanach, sprzedaży i zakupach instrumentów finansowych, takich jak akcje i obligacje.
  7. Sprzedaż - informacje o klientach, produktach i zakupach.
  8. Produkcja - do zarządzania łańcuchem dostaw i śledzenia produkcji towarów w fabrykach, zapasów w magazynach, sklepach i zamówień towarów.
  9. Zasoby ludzkie - dla informacji o pracownikach, płacach, podatkach od wynagrodzeń i świadczeniach.

Przyszłe trendy

Przyszłe trendy

W przyszłościowym obrazie świata baz danych, World Wide Web (WWW, w skrócie Web) będzie nadal ważnym aspektem jako środek publikacji dokumentów oraz jako środek wymiany informacji. WWW dostarcza jednego z najbardziej heterogeniczny i złożonych środowisk interoperacyjnych.

Ostatnio pojawiły się technologie i standardy, dzięki którym sieć staje się skalowalną i zarządzalną infrastrukturą. Jedną z takich technologii jest XML, który przekształcony w system bazodanowy, w stylu tradycyjnych manipulatorów baz danych, daje znacznie lepsze wyniki niż wyszukiwarki. Wyzwaniem jest zintegrowanie tej funkcjonalności z XML i maksymalne wykorzystanie strategicznych informacji, które użytkownik może znaleźć w Internecie.

Nowe trendy to proaktywna i predykcyjna analiza wydajności, testowanie obciążenia baz danych, wykorzystanie NOSQL - mongodb i cassandra oraz BigData (Hadoop) w środowiskach korporacyjnych i chmurowych.

Artykuły na ten temat