Webissä on paljon tietoa helposti hyödynnettävässä muodossa, esim. säätiedotukset, lentoaikataulut tai talousuutiset. Semanttinen web pyrkii saattamaan tämän saman tiedon myös koneiden ja tiedonhakurobottien hyödynnettäviksi, kuvaamalla tiedon tarkemmin koneiden ymmärtämässä muodossa.

Tiedon 100 % hyödyntäminen ei voi perustua arvaukseen, vaan sen on perustuttava sisällön yksikäsitteiseen kuvaukseen ja tiedon muihin tietoihin kohdistuvien suhteiden kuvaukseen.

RESOURCE DESCRIPTION FRAMEWORK (RDF)

RDF on tietomalli, jonka World Wide Web Consortium (W3C) määritti jo vuonna 1999. Tietomalli on yksinkertainen, ollakseen kuitenkin tarpeeksi voimakas kuvaamaan webin sisältöjen ominaisuuksia. RDF käyttää kolmikoita (triples), jotka identifioivat sisällön, sen ominaisuuden (property) ja ominaisuuden arvon. Arvo voi vuorostaan olla toinen sisältö, joka mahdollistaa yksinkertaisten tai monimutkaistenkin suhteiden kuvaamisen käyttöalueen tarpeiden mukaisesti.

RDF voisi toimia sellaisenaan, mikäli kaikki käyttäisivät samoja URI-osoitteita (Uniform Resource Identifier) viitatessaan samoihin asioihin ja ominaisuuksiin. Koska näin ei ole, eri lähteistä peräisin olevan tiedon yhteensovittamisessa hyödynnetään ontologioita ja päättelysääntöjä. Ontologia on formaali kuvaus käsitteistä ja ominaisuuksista, joita käytetään semanttisen metatiedon kuvauksessa. Ontologiat antavat meille lisäksi työkalut implisiittisten eli asiayhteydestä pääteltävissä olevien asioiden suhteiden havaitsemiseen.

JSON-LD

JSON (JavaScript Object Notation) on yleistynyt kevyenä tiedonsiirtoformaattina, jota on helppo luoda ja käsitellä erilaisissa ohjelmointiympäristöissä.

JSON-LD laventaa JSON:in ilmaisukykyä Linked Data -tekniikoihin missä JSON-tietorakenteet voivat sisältää kontekstin (context) joka yksikäsitteisesti tunnistetaan International Resource Identifier (IRI) -tunnisteilla. Tämä lähestymistapa sallii JSON-LD:n tehdä kuvauksia yksikäsitteisistä objekteista ja myös viitata muihin objekteihin, mikä ei pelkällä JSON:Ila ole ollut mahdollista.

Resource Description Framework (RDF) tietomallia hyödyntäneet kehittäjät pystyvät ilmaisemaan RDF-tietomallin JSON-LD:n avulla, jolloin JSON-LD:tä hyödyntävien kehittäjien ei tarvitse olla käyttänyt RDF-tietomallia aikaisemmin.

WEB ONTOLOGY LANGUAGE (OWL)

Olemassa olevista tietoresursseista voi saada lisäarvoa OWL-yhteensopivan päättelykoneen avulla. OWL tarjoaa testatut ontologiset primitiivit, joiden avulla RDF-datasta voidaan luoda uutta RDF-dataa.

Yritysten sivut voivat näin pienin kustannuksin löytyä paremmin, koska rikasta metatietoa voi nyt liittää osaksi entisiä ulkoasultaan monipuolisia, mutta semanttisesti puutteellisia sivuja. Hakukoneiden tulosten parantamiseksi sekä semanttisen webin visioiden toteen saattamiseksi W3C on luonut myös RDFa-tekniikan, jonka avulla RDF-kuvauksia voi liittää HTML-dokumentteihin.

SPARQL-KYSELYKIELI

SPARQL tulee sanoista SPARQL Protocol and RDF Query Language. Vastaavaan tapaan kuin SQL (Structured Query Language) on ollut merkittävässä roolissa relaatioalgebran kehityksessä ja sen toteuttamisessa relaatiotietokannoissa, SPARQL tarjoaa julkisen liittymän RDF-tietovarastoihin. Nämä voivat olla joko natiiveja RDF-tietokantoja tai tarjota SPARQL-liittymän esim. relaatiotietokantaan.

W3C:n SPARQL-määrityksessä on kolme osaa: (1) kyselykieli ja sen semantiikka, (2) kyselyn tulosten esitystapa, sekä (3) sidonta HTTP-protokollaan, jonka avulla kyselyt ja kyselytulokset voidaan kuljettaa internetissä olevien koneiden välillä.