• English
  • Suomi

Semanttinen Web

Webissä on paljon tietoa helposti hyödynnettävässä muodossa, esim. säätiedotukset, lentoaikataulut tai talousuutiset. Semanttinen web pyrkii saattamaan tämän saman tiedon myös koneiden ja tiedonhakurobottien hyödynnettäviksi, kuvaamalla tiedon tarkemmin koneiden ymmärtämässä muodossa.

Tiedon 100 % hyödyntäminen ei voi perustua arvaukseen, vaan sen on perustuttava sisällön yksikäsitteiseen kuvaukseen ja tiedon muihin tietoihin kohdistuvien suhteiden kuvaukseen.

RESOURCE DESCRIPTION FRAMEWORK (RDF)

RDF on tietomalli, jonka World Wide Web Consortium (W3C) määritti jo vuonna 1999. Tietomalli on yksinkertainen, ollakseen kuitenkin tarpeeksi voimakas kuvaamaan webin sisältöjen ominaisuuksia. RDF käyttää kolmikoita (triples), jotka identifioivat sisällön, sen ominaisuuden (property) ja ominaisuuden arvon. Arvo voi vuorostaan olla toinen sisältö, joka mahdollistaa yksinkertaisten tai monimutkaistenkin suhteiden kuvaamisen käyttöalueen tarpeiden mukaisesti.

RDF voisi toimia sellaisenaan, mikäli kaikki käyttäisivät samoja URI-osoitteita (Uniform Resource Identifier) viitatessaan samoihin asioihin ja ominaisuuksiin. Koska näin ei ole, eri lähteistä peräisin olevan tiedon yhteensovittamisessa hyödynnetään ontologioita ja päättelysääntöjä. Ontologia on formaali kuvaus käsitteistä ja ominaisuuksista, joita käytetään semanttisen metatiedon kuvauksessa. Ontologiat antavat meille lisäksi työkalut implisiittisten eli asiayhteydestä pääteltävissä olevien asioiden suhteiden havaitsemiseen.

WEB ONTOLOGY LANGUAGE (OWL)

Olemassa olevista tietoresursseista voi saada lisäarvoa OWL-yhteensopivan päättelykoneen avulla. OWL tarjoaa testatut ontologiset primitiivit, joiden avulla RDF-datasta voidaan luoda uutta RDF-dataa.

Yritysten sivut voivat näin pienin kustannuksin löytyä paremmin, koska rikasta metatietoa voi nyt liittää osaksi entisiä ulkoasultaan monipuolisia, mutta semanttisesti puutteellisia sivuja. Hakukoneiden tulosten parantamiseksi sekä semanttisen webin visioiden toteen saattamiseksi W3C on luonut myös RDFa-tekniikan, jonka avulla RDF-kuvauksia voi liittää HTML-dokumentteihin.

SPARQL-KYSELYKIELI

SPARQL tulee sanoista SPARQL Protocol and RDF Query Language. Vastaavaan tapaan kuin SQL (Structured Query Language) on ollut merkittävässä roolissa relaatioalgebran kehityksessä ja sen toteuttamisessa relaatiotietokannoissa, SPARQL tarjoaa julkisen liittymän RDF-tietovarastoihin. Nämä voivat olla joko natiiveja RDF-tietokantoja tai tarjota SPARQL-liittymän esim. relaatiotietokantaan.

W3C:n SPARQL-määrityksessä on kolme osaa: (1) kyselykieli ja sen semantiikka, (2) kyselyn tulosten esitystapa, sekä (3) sidonta HTTP-protokollaan, jonka avulla kyselyt ja kyselytulokset voidaan kuljettaa internetissä olevien koneiden välillä.