Begrepsapparat for data i tilknytning til datautveksling

Det finnes ulike definisjoner av data i forhold til informasjon.

I tilknytning til datautveksling er ikke alle distinksjonene nødvendigvis relevante. Så langt det gir mening, benyttes begrepet data heller enn informasjon.

Figuren nedenfor introduserer noen begreper som anses som nyttige og nødvendige i tilknytning til datautveksling.

Hva er data for datautveksling image
Figur 1. Hva er data for datautveksling

At det gjøres en forskjell på Forretningsobjekt og Dataobjekt følger av aktuelle modelleringsstandarder, men kan ses som mindre viktig her. Spesielt interesserte kan finne mer om temaet under Modelleringskonvensjoner.

Data kan samles i datasett, som beskrives i form av metadata og datamodeller.

Data og datasett er å oppfatte som "logiske" definisjoner, uten binding til representasjon, teknisk løsning eller fysiske forekomster.

Innholdet i datasett ("selve dataene") kan redegjøres for i form av tidsstemplede øyeblikksbilder eller ved endringslogger ut fra gitte øyeblikksbilder.

Begrepet datadistrubusjon tilsvarer begrepet distribution i DCAT-standarden. Dette kan f.eks. være dokumenter i et dokumentarkiv eller tabeller i en database.

Det er den fysiske forekomsten av data i ulike systemer som må sikres, enten det dreier seg om data som er lagret over tid (data at rest) eller data som finnes midlertidig mellom systemer i en datautveksling (data in motion).

Det skilles videre mellom autoritative datasett (masterdata) og avledete data (slavedata).

Det er vanlig å skille mellom mellom data, informasjon og kunnskap. Det gir f.eks. mening å si informasjonssikkerhet, mens en snakker om sikring av data for å oppnå informasjonssikkerhet. En skiller også gjerne mellom konseptuelle, logiske og fysiske data.
Data kan finnes med større eller mindre grad av struktur, og det er en flytende overgang mellom ustrukturerte, semistrukturerte og strukturerte data. Med nyere teknologier innen maskinlæring kan en også tolke og gi struktur og mening til data som en tidligere har definert som ustrukturerte.
Det finnes ulik praksis for bruk av begrepet dokument. Dette begrepet brukes ikke i sammenheng med referansearkitekturer for datautveksling.