Duomenų bazė – tai sistemingai organizuotų duomenų (bet kokios rūšies informacijos) saugojimo ir tvarkymo sistema. Duomenys gali būti skirtingų tipų — tekstas, skaičiai, datos, media failai ar struktūruoti įrašai — ir gali būti saugomi centralizuotai arba paskirstytai.

Kas atlieka duomenų bazės darbą?

Duomenų bazių sistema (DBVS) yra kompiuterinė programa, skirta duomenų bazių kūrimui, prieigai, saugojimui, tvarkymui ir apsaugai. DBVS atlieka užklausas, rūšiavimą, filtravimą, duomenų keitimą, transakcijų valdymą ir prieigos kontrolę. Paprastas DBVS pavyzdys būtų elektroninė adresų knyga, kurioje galite ieškoti, redaguoti ar pridėti kontaktus.

Kaip žmonės anksčiau saugojo duomenis

Prieš skaitmeninių kompiuterių eros duomenys buvo kaupiami fiziškai — kortelių bylose, spausdintose knygose ar kitais būdais. Dabar dauguma duomenų saugoma kompiuterinėse bylose arba duomenų bazėse, kurios leidžia greitai rasti, atnaujinti ir analizuoti informaciją. Prieš kompiuterių laikus darbuotojų duomenys dažnai būdavo laikomi bylų spintose: kiekvienam darbuotojui skirta viena kortelė su tokiomis savybėmis kaip gimimo data, vardas, pavardė ir pan.

Duomenų organizavimas ir modeliai

Duomenų bazėje informacija taip pat yra suskirstyta į atskirus įrašus (lyg „kortelės“), tačiau kompiuteris juos saugo optimizuotai skirtingais formatais. Kiekvienas iš šių saugojimo būdų vadinamas duomenų bazės modeliu. Pagrindiniai modeliai:

  • Reliacinis modelis – duomenys saugomi lentelėse (eilutės = įrašai, stulpeliai = laukai) ir susiejami per ryšius.
  • Hierarchinis modelis – duomenys organizuojami medžio struktūra (tėvas-vaikas).
  • Tinklinis modelis – panašus į hierarchinį, bet leidžia sudėtingesnius ryšius tarp įrašų.
  • Dokumentų modelis – duomenys saugomi dokumentuose (pvz., JSON, XML) ir tinka nestruktūruotiems arba semi-structūruotiems duomenims.
  • Raktas‑reikšmė (key‑value) – paprasta saugykla, kur duomenys pasiekiami pagal raktą.
  • Stulpelių (columnar) modelis – optimizuotas analitiniams užklausoms dideliuose duomenų rinkiniuose.
  • Grafų modelis – skirtas saugoti ir analizuoti sudėtingus tinklinius ryšius (pvz., socialinius tinklus).

Reliacinis duomenų bazės modelis

Dažniausiai naudojamas duomenų bazės modelis vadinamas reliaciniu duomenų bazės modeliu. Jame duomenims saugoti naudojami ryšiai ir rinkiniai. Praktiniu požiūriu vartotojai apie reliacines bazes dažniausiai kalba paprastai — kaip apie duomenų bazės lenteles, kuriose:

  • stulpeliai atitinka laukus (atributus),
  • eilutės atitinka įrašus (rows arba records),
  • kiekvienai lentelės eilutei dažnai priskiriamas unikalus identifikatorius – pirminis raktas (primary key),
  • lentelės siejamos tarpusavyje per užsienio raktus (foreign keys), leidžiančius išlaikyti duomenų vientisumą.

Duomenų bazės pagrindinės sąvokos

  • Užklausa – komanda sistemai išrinkti ar pakeisti duomenis (dažniausiai naudojama SQL kalba reliacinėse bazėse).
  • Indeksai – duomenų struktūros, greitinančios paieškas ir užklausas.
  • Normalizacija – procesas, kuriuo siekiama sumažinti duomenų dubliavimą ir pagerinti vientisumą.
  • Transakcijos ir ACID – savybės, garantuojančios, kad keli sujungti veiksmai bus atlikti teisingai ir patikimai.
  • Atsarginės kopijos ir atkūrimas – svarbūs duomenų saugumui ir prieinamumui užtikrinti.
  • Prieigos teisės ir šifravimas – apsaugo duomenis nuo neautorizuotos prieigos.

Pavyzdžiai ir panaudojimo sritys

Duomenų bazės naudojamos beveik visose šiuolaikinėse programose ir paslaugose: internetinėse parduotuvėse, bankuose, ligoninių informacinėse sistemose, įmonių apskaitoje, socialiniuose tinkluose, mobiliųjų programėlių gale ir kt. Populiarios DBVS: MySQL, PostgreSQL, SQLite, Oracle Database, Microsoft SQL Server, taip pat NoSQL sprendimai kaip MongoDB, Redis ar Cassandra.

Apibendrinimas

Duomenų bazė yra pagrindinė priemonė tvarkyti didelius kiekius informacijos taip, kad juos būtų lengva saugoti, atkurti, analizuoti ir saugiai dalintis. Pasirinktas duomenų bazės modelis ir DBVS priklauso nuo duomenų pobūdžio, našumo reikalavimų ir saugumo poreikių.