En relationsdatabas består av en samling tabeller som lagrar särskilda uppsättningar data. Uppfinningen av detta databassystem har standardiserat hur data lagras och bearbetas. Konceptet med en relationsdatabas härrör från principerna för relationalgebra, realiserade som en helhet av relationsdatabasernas fader, EF Codd. De flesta av de databassystem som används idag är baserade på relationssystemet; relationsdatabaser är dock inbyggda i programvara som människor och företag köper, så databasen är i allmänhet osynlig för allmänheten.
Historien om relationsdatabasen började med Codds artikel från 1970, A Relational Model of Data for Large Shared Data Banks. Denna teori fastställde att data bör vara oberoende av någon hårdvara eller lagringssystem, och tillhandahålls för automatisk navigering mellan dataelementen. I praktiken innebar detta att data skulle lagras i tabeller och att det skulle finnas relationer mellan de olika datamängderna, eller tabellerna.
Databasinnehåll
Relationen, som är en tvådimensionell tabell, är den primära lagringsenheten i en relationsdatabas. En relationsdatabas kan innehålla en eller flera av dessa tabeller, där varje tabell består av en unik uppsättning rader och kolumner. En enskild post lagras i en tabell som en rad, även känd som en tupel, medan attribut för data definieras i kolumner, eller fält, i tabellen. Datas egenskaper, eller kolumnen, relaterar en post till en annan. Varje kolumn har ett unikt namn och innehållet i den måste vara av samma typ.
Korsreferenstabeller
Tabeller kan relateras till varandra på en mängd olika sätt. Funktionella beroenden bildas när ett attribut för en tabell relaterar till attribut för andra tabeller. Den enklaste relationen är en-till-en-relationen, där en post i en tabell är relaterad till en annan post i en separat tabell. En en-till-många-relation är en där en post i en tabell är relaterad till flera poster i en annan tabell. En många-till-en relation definierar den omvända situationen; mer än en post i en enda tabell hänför sig till endast en post i en annan tabell. Slutligen, i en många-till-många-relation, relaterar mer än en post i en tabell till mer än en post i en annan tabell.
Differentiera data
När man refererar till en relationsdatabas är en nyckel en enhet i en tabell som skiljer en rad med data från en annan. Nyckeln kan vara en enda kolumn, eller så kan den bestå av en grupp kolumner som unikt identifierar en post. Tabeller kan innehålla primärnycklar såväl som främmande nycklar. Primära nycklar tjänar till att skilja poster från varandra; de kan vara ett individuellt attribut eller en kombination av attribut. Främmande nycklar relaterar tabeller i databasen till varandra och definierar generellt förälder-till-barn-relationerna mellan tabeller. Dessutom kan en främmande nyckel i en tabell vara en primärnyckel i en annan.
Organisera data
Data som lagras i tabeller är organiserade på ett logiskt sätt baserat på ett särskilt syfte för att hjälpa till att minimera dubbelarbete, minska dataavvikelser och stärka dataintegriteten. Processen genom vilken data organiseras logiskt kallas normalisering; det förenklar inte bara hur data definieras, utan det reglerar också dess struktur. Det finns fem former i normaliseringsprocessen, där varje form uppfyller ett mer krävande villkor. Den första normala formen, 1NF, uppfyller minimikraven för normalitet och har minst dataintegritet, medan den femte normalformen, eller 5NF, strukturerar data med minsta anomalier och bästa integritet.
Lagrade data manipuleras med hjälp av ett programmeringsspråk som kallas Structured Query Language, eller SQL. Det finns många varianter av SQL, men de flesta är baserade på mängdteoretiska relationsoperatorer som och, eller, inte, och i, som alla används för att utföra operationer på data. De operationer som kan användas i relationsdatabaser inkluderar infoga, välj, uppdatera och ta bort privilegier.
Produktalternativ
I början av 2010-talet var RDBMS (Relational Database Management System) det vanligaste databasformatet; det används ofta av företag och företag för att uppdatera och administrera relationsdatabaser. Historiskt sett har det funnits tre ledande RDBMS-företag: Oracle®, som skapade den första kommersiella relationsdatabasen 1979; IBM®, som följde efter 1982 med SQL Data System, bytte senare namn till DB2®; och Microsoft®, som gick med i SQL Server® 4.2 1992. Andra företag erbjuder också RDBMS-produkter, av vilka de flesta kan köpas från företagets webbplats eller i butiker som säljer datorprogramvara, och priserna varierar beroende på företaget.