Aihekartat
(→Aiheen nimet) |
(→Aiheen nimet) |
||
Line 58: | Line 58: | ||
Nimistön ekstensio on niiden olioiden joukko, joihin nimistöllä voidaan viitatata. Aiheen nimistön ektension tulisi olla sama kuin subjektin aiottu ekstensio ts. aiheen tulisi nimistönsä puolesta edustaa mahdollisimman tarkasti subjektiaan. Nimistön muodostamisen kriteerinä tulisi painottaa nimien syntaktisia eroja semanttisten erojen sijaan. Aiheiden nimeämismalli mahdollistaa semanttisia vivahteita sisältävien nimien käytön, jolloin nimistön ekstensio saattaa todellisuudessa olla huomattavasti laajempi kuin aiheen aiottu, subjektilla määritelty ekstensio. Nimeämismallia on mahdollista käyttää vahingossa tai tarkoituksellisesti väärin, määrittelemällä aiheen nimistöön aito semanttinen verkko, joka tulisi kuvata aiheiden ja assosiaatioiden avulla. Aiheen nimistön rakentaminen edellyttää huolellisuutta. | Nimistön ekstensio on niiden olioiden joukko, joihin nimistöllä voidaan viitatata. Aiheen nimistön ektension tulisi olla sama kuin subjektin aiottu ekstensio ts. aiheen tulisi nimistönsä puolesta edustaa mahdollisimman tarkasti subjektiaan. Nimistön muodostamisen kriteerinä tulisi painottaa nimien syntaktisia eroja semanttisten erojen sijaan. Aiheiden nimeämismalli mahdollistaa semanttisia vivahteita sisältävien nimien käytön, jolloin nimistön ekstensio saattaa todellisuudessa olla huomattavasti laajempi kuin aiheen aiottu, subjektilla määritelty ekstensio. Nimeämismallia on mahdollista käyttää vahingossa tai tarkoituksellisesti väärin, määrittelemällä aiheen nimistöön aito semanttinen verkko, joka tulisi kuvata aiheiden ja assosiaatioiden avulla. Aiheen nimistön rakentaminen edellyttää huolellisuutta. | ||
− | Kuvassa 25 on esimerkki aiheesta Syödä, joka sisältää hyvin laajan nimistön. Aiheella on kolme perusnimeä: ätä, eat ja syödä. Perusnimillä on edelleen useita nimimuunnelmia. Nimimuunnelmat ovat perusnimen semanttisia vivahteita. Onkin mahdollista, että nimistön ekstensio on laajempi kuin aiheen tavoiteltu subjekti. Kuvan 25 nimistöä voidaan siten pitää äärimmäisenä esimerkkinä aihekarttojen mahdollistamasta aiheiden nimeämisestä. Selkeyden vuoksi kuvasta on jätetty pois kaarien nimet eli nimien näkyvyysalueet. | + | Kuvassa 25 on esimerkki aiheesta Syödä, joka sisältää hyvin laajan nimistön. Aiheella on kolme perusnimeä: ''ätä'', ''eat'' ja ''syödä''. Perusnimillä on edelleen useita nimimuunnelmia. Nimimuunnelmat ovat perusnimen semanttisia vivahteita. Onkin mahdollista, että nimistön ekstensio on laajempi kuin aiheen tavoiteltu subjekti. Kuvan 25 nimistöä voidaan siten pitää äärimmäisenä esimerkkinä aihekarttojen mahdollistamasta aiheiden nimeämisestä. Selkeyden vuoksi kuvasta on jätetty pois kaarien nimet eli nimien näkyvyysalueet. |
Revision as of 13:45, 11 October 2008
Tämä wikisivu sisältää suomenkielisen esittelyn aihekartoista (Topic Maps). Esittely on osa Aki Kivelän Helsingin yliopistoon valmistelemasta pro gradu -tutkielmaa:
Kivelä A.: OBO-ontologioiden kuvaaminen Topic Map-muotoon. MSc Theses, 2008.
Contents |
Topic Maps
Tietojenkäsittelyssä ja erityisesti tekoälytutkimuksessa on kehitetty runsaasti erilaisia verkkorakenteisiin perustuvia tietämyksen esitysmalleja. Yksi ensimmäisistä oli amerikkalaisen filosofin Charles Sanders Peircen 1900-luvun alussa kehittämä, symbolisen logiikan graafinen esitys Existential Graphs. Muita tietämyksen verkkoesitysmalleja ovat mm. semanttiset verkot (semantic networks) [Sow92] ja käsitekartat (concept maps) [Con]. Jopa epäformaaleja ajatuskarttoja (mind maps) [Min] voidaan pitää verkkomaisena tietämyksen esitysmuotona. Myös aihekartat (Topic Maps) [Pep00] lukeutuvat verkkorakenteisiin tietämyksen esitysmuotoihin.
Aihekartat sisältävät nimensä mukaisesti aiheita (topic) ja aiheiden välisiä assosiaatioita (association). Aihekartta visualisoidaan verkkona, jossa aiheet vastaavat verkon solmuja ja assosiaatiot solmujen välisiä kaaria (Kuva 23). Seuraavissa kappaleissa käsittelen tarkemmin aihekartan rakenteita. Ensin käsittelen subjektia ja tämän kone-esitysmuotoa aihetta.
Kuva 23: Aihekartta voidaan visualisoida verkkona.
Subjekti
Subjektilla tarkoitetaan aihekarttojen yhteydessä jotain, johon on mahdollista viitata inhimillisen käsityskyvyn avulla. Subjektilta ei edellytetä nimettävyyttä tai fyysistä olomuotoa. Subjekti voi olla esimerkiksi keltainen, kenkä, rauha tai Helsinki. ISO-määritelmä [ISO13250] subjektista on
Subjektit voidaan jakaa osoitteellisiin ja osoitteettomiin subjekteihin. Osoitteellisella subjektilla on yksiselitteinen, kone-esitettävässä muodossa oleva osoite. Esimerkiksi WWW-sivusta puhuttaessa subjektin osoite (subject address) on WWW-sivun URL-osoite. Kone-esitettävä osoite identifioi subjektin yksikäsitteisesti.
Suurin osa inhimillisen kokemuspiirimme subjekteista ei ole identifioitavissa kone-esitettävällä osoitteella. Tälläiset subjektit ovat osoitteettomia. Osoitteettomia subjekteja ovat esimerkiksi rauha, keltainen ja Elvis Presley. Osoitteeton subjekti identifioidaan epäsuoraan subjektiviittausten (subject identifier) avulla. Epäsuorat subjektiviittaukset osoittavat subjekti-indikaattoreihin (subject indicator), jotka sisältävät subjektin määrittelyn ihmisen tulkittavassa muodossa, kuten vapaamuotoisena tekstinä [ISO13250, XTM]. Subjekti-indikaattorin tulkinta on aina moniselitteinen ja riippuu ihmistulkitsijasta.
Ajatellaan esimerkiksi aihetta keltainen. Aihe kuuluu inhimilliseen kokemuspiiriimme, eikä ole olemassa yksikäsitteisesti aihetta määrittelevää koneosoitetta. Aiheen mukainen subjekti on osoitteeton. Voimme kuitenkin määritellä subjektin keltainen viittaamalla esimerkiksi paikallisen maalitehtaan WWW-sivuilta löytyvän värikartan keltaiseen väriin. Värikartan keltaiseen väriin osoittava URL-osoite on tällöin subjektiviite ja värikartassa oleva keltaisen värin määritelmä subjekti-indikaattori. Tulkinta on kuitenkin moniselitteinen. Onko indikaattorin subjekti keltainen maali, WWW-teknologia vai keltainen väri? Kysymys on loppujen lopuksi sopimuksesta ja sopimuksen noudattamisesta.
Julkaistu subjektiviite (published subject indentifier) on kone-esitettävä URI-osoite julkaistuun subjekti-indikaattoriin (published subject indicator). Julkaistu subjekti-indikaattori määrittelee osoitteettoman subjektin ihmisen ymmärrettävässä muodossa. Julkaistu subjektiviite on kuitenkin julkaisijan näkemys subjektista ja koska määritelmien julkaisua ei ole rajoitettu on todennäköistä, että samoja subjekteja määritellään usean julkaisijan toimesta hieman eri tavalla. Julkaistujen subjekti-indikaattorien käyttäjät päättävät, mitkä määritelmät säilyvät käytössä ja mitkä häviävät käytön puutteessa [Pep03]. Näkemys muistuttaa lamarckilaista evoluutiota [Lam]. Hankittujen yksilöominaisuuksien sijaan luonnollisen valinnan kohteena ovat subjektiviitteet. Vielä lähempänä näkemys on kulttuurievoluutiota, jossa evolutionäärisen valinnan kohteena ovat kulttuurigeenit eli meemit [Bla99]. Subjektiviitteiden voidaan ajatella olevan konemaailman meemejä.
Ajatellaan esimerkiksi WWW-dokumenttia lohikaarmeet.html (Kuva 24). Siihen on mahdollista viitata yksikäsitteisellä URI-osoitteella. Tämä URI-osoite on WWW-dokumentin subjektiosoite. Sen sijaan lapsena saduissa kohtaamaamme lohikäärme-subjektiin ei ole olemassa URI-osoitetta, sillä kyseessä on inhimillisen maailman käsite. Voimme kuitenkin sopia, että lohikäärme-subjektiin osoitetaan subjektiviitteellä, joka on myös URI-osoite. Kun kerromme tästä subjektiviitteestä ystävällemme niin julkaisemme subjektiviitteen. Tämän jälkeen ystävämme voi sitoutua käyttämään meidän subjektiviitettämme tai meidän epäonneksemme hän voi keksiä lohikäärmeelle oman subjektiviitteen ja meidän on itse sitouduttava käyttämään hänen subjektiviitettään säilyttääksemme yhteisymmärryksen. Jo aikaisemmin mainitsin, että kysymys on loppujen lopuksi sopimuksesta ja sopimuksen noudattamisesta.
Julkaistut subjektiviitteet ja -indikaattorit määrittelevät konesanastoa inhimillisen maailman ilmiöille. Konesanastot ovat erittäin merkittävässä roolissa esimerkiksi ontologioissa, eikä ole liioiteltua väittää subjektiviitteiden ja -indikaattorien laajamittaisen julkaisun ja käytön olevan välttämätön edellytys ontologioiden julkaisulle ja käytölle. Subjektikeskeinen laskenta (subject centric computing) on paradigma, jossa subjektin merkitys on korostettu kun tietoa osoitetaan, haetaan ja käsitellään [Pep07]. Paradigmaa perustellaan ihmiskeskeisyydellä. Ihminen on loppujen lopuksi kiinnostunut subjekteista eikä tietokoneista, tiedostoista tai hakemistoista etsiessään ja käyttäessään tietoa.
Kuva 24: Esimerkki erilaisten subjektiviitteiden käytöstä.
Aihe
Aihekarttojen tietomalli on subjektikeskeinen. Subjektia edustaa aihekartassa aihe (topic1). Tapahtumaa, jossa subjektista tuotetaan aihe kutsutaan konkretisoinniksi (reification). Konkretisoinnissa subjektin osoite tai subjekti-indikaattorit kiinnitetään luotuun aiheeseen. Kun aiheen edustama subjekti on osoitteellinen sanotaan, että aihe määrittelee (constitutes) subjektin. Osoitteellista subjektia edustavalla aiheella on aina täsmälleen yksi subjektiosoite. Kun aiheen edustama subjekti määritellään subjekti-indikaattorien avulla sanotaan, että aihe viittaa (indicates) subjektiin. Osoitteetonta subjektia edustavalla aiheella on yksi tai useampi subjekti-indikaattori. Subjektiosoite ja -indikaattori ovat subjektitunnisteita. Subjektitunnisteet esitetään vakiintuneen käytännön mukaan URI-osoitteina [PH03].
Ajatellaan esimerkiksi, että haluan luoda aiheen Helsingin yliopisto-subjektille. Kyseessä ei ole konemaailman subjekti ja minun on käytettävä subjekti-indikaattoria subjektin osoittamiseen. Helsingin yliopiston URL-osoite soveltuu tähän hyvin. Konkretisoin Helsingin yliopisto-subjektille aiheen käyttäen subjekti-indikaattoria http://www.helsinki.fi/yliopisto/. Aiheella voi olla useampia subjekti-indikaattoreja ja voin vahvistaa konkretisointia subjekti-indikaattoreilla
Ajatellaan toista esimerkkiä. Haluan luoda aiheen Steve Pepperin verkkoartikkelille [Pep00]. Artikkelilla on yksikäsitteinen verkko-osoite ja voin käyttää sitä konkretisoitavan aiheen subjektiosoitteena. Subjektiosoite riittää subjektin yksikäsitteiseen identifiointiin, joten subjektia ei tarvitse vahvistaa ylimääräisillä subjekti-indikaattoreilla.
Konkretisoinnin jälkeen aiheella on subjekti ja aiheen edustamasta subjektista voidaan keskustella tarkemmin. Aiheelle voidaan antaa nimiä, se voidaan linkittää toisiin aiheisiin ja siihen voidaan liittää ilmentymiä. Aihekartan sanotaan olevan konsistentti (consistent) kun aihekartta sisältää ainoastaan yhden aiheen jokaista subjektia kohden.
Muita aiheiden ominaisuuksia ovat nimet ja esiintymät. Nimet ovat aiheen esitysmuotoja. Esiintymät ovat aiheisiin liittyviä vapaamuotoisia resursseja, kuten dokumentteja. Seuraavaksi tarkastelen tarkemmin aiheiden ominaisuuksia.
Aiheen nimet
Aiheen nimi on subjektin esitysmuoto (external representation). Nimi on vapaamuotoinen merkkijono. Subjektin esitysmuoto riippuu esimerkiksi käytettävästä kielestä, käyttötarkoituksesta, painotuksesta ja aiheella voi olla vaihteleva määrä eri käyttötarkoituksiin ja asiayhteyksiin soveltuvia nimiä. Nimiä käytetään esimerkiksi kun halutaan esittää aihe aihekarttoja käyttävässä sovelluksessa.
Aiheen nimistö on kaksitasoinen. Aiheella voi olla perusnimiä (base name) ja jokaisella perusnimellä voi olla useita muunnelmanimiä (variant name). Jokaiseen perus- ja muunnelmanimeen on mahdollista liittää näkyvyysalue (scope). Näkyvyysalue on moniarvoinen. Usein näkyvyysalue määrittelee kielen, jolla nimi on ilmaistu. Nimi on esimerkiksi englanninkielinen. Lisäksi näkyvyysalueeseen liitetään usein nimen tyyppi. Aihekarttastandardi määrittelee kaksi nimityyppiä: näyttönimen (display name) ja aakkostusnimen (sort name). Standardi ei kuitenkaan rajoita uusien nimityyppien määrittelyä. Nimen näkyvyysalue on kokoelma aiheita.
Nimistön ekstensio on niiden olioiden joukko, joihin nimistöllä voidaan viitatata. Aiheen nimistön ektension tulisi olla sama kuin subjektin aiottu ekstensio ts. aiheen tulisi nimistönsä puolesta edustaa mahdollisimman tarkasti subjektiaan. Nimistön muodostamisen kriteerinä tulisi painottaa nimien syntaktisia eroja semanttisten erojen sijaan. Aiheiden nimeämismalli mahdollistaa semanttisia vivahteita sisältävien nimien käytön, jolloin nimistön ekstensio saattaa todellisuudessa olla huomattavasti laajempi kuin aiheen aiottu, subjektilla määritelty ekstensio. Nimeämismallia on mahdollista käyttää vahingossa tai tarkoituksellisesti väärin, määrittelemällä aiheen nimistöön aito semanttinen verkko, joka tulisi kuvata aiheiden ja assosiaatioiden avulla. Aiheen nimistön rakentaminen edellyttää huolellisuutta.
Kuvassa 25 on esimerkki aiheesta Syödä, joka sisältää hyvin laajan nimistön. Aiheella on kolme perusnimeä: ätä, eat ja syödä. Perusnimillä on edelleen useita nimimuunnelmia. Nimimuunnelmat ovat perusnimen semanttisia vivahteita. Onkin mahdollista, että nimistön ekstensio on laajempi kuin aiheen tavoiteltu subjekti. Kuvan 25 nimistöä voidaan siten pitää äärimmäisenä esimerkkinä aihekarttojen mahdollistamasta aiheiden nimeämisestä. Selkeyden vuoksi kuvasta on jätetty pois kaarien nimet eli nimien näkyvyysalueet.
Kuva 25: Esimerkki aiheen nimistöstä.
Aiheen esiintymät
Esiintymä (occurrence) on aiheeseen, erityisesti aiheen mukaiseen subjektiin liittyvä vapaamuotoinen informaatioresurssi, kuten WWW-sivu, kuva tai teksti. Esiintymiä käytetään esimerkiksi tekstimassojen liittämiseen aiheisiin. Kuten aiheen nimellä, myös esiintymällä on moniarvoinen näkyvyysalue ja sillä määritellään esimerkiksi esiintymässä käytetty kieli ja tyyppi.
Aihekarttojen käyttö dokumenttien julkaisussa perustuu esiintymiin. Kun esiintymää säilytetään aihekartan ulkopuolella, aihekartan voidaan ajatella muodostavan esiintymädokumenttien välille metaverkon, joka linkittää dokumentit uudella, dokumenttien sisäisestä linkityksestä riippumattomalla tavalla. Samaan dokumenttikokoelmaan voidaan luoda uusia linkitysverkkoja määrittelemällä aiheiden väliset assosiaatiot uudelleen. Aikaisemmin esitetyssä kuvassa 23 esiintymät on kuvattu aiheista riippuvina dokumentteina, jotka voivat sijaita aihekartan sisällä tai ulkopuolella.
Aiheiden väliset yhteydet
Aiheiden välinen yhteys eli assosiaatio on yhden tai useamman aiheen välinen relaatio. Assosiaatiolla on tyyppi (association type), joka ilmaisee tarkemmin yhteyden laadun. Kun aihe on mukana assosiaatiossa, sanotaan että aihe on assosiaation esiintyjä (association player). Assosiaation esiintyjällä on rooli (association role), joka määrittelee tarkemmin esiintyjän paikan assosiaatiossa. Assosiaation tyyppi ja roolit ovat myös aiheita. Jos kaikilla esiintyjillä on eri rooli, vastaa assosiaatio symmetristä suunnattua graafia (symmetric directed graph). Assosiaation esiintyjän ja roolin muodostamaa kokonaisuutta kutsutaan assosiaation jäseneksi (association member).
Kuvassa 26 on esitetty graafina yksinkartainen assosiaation, jossa on kaksi esiintyjää A ja B sekä näiden roolit ja assosiaation tyyppi. Esimerkkinä kuvan kaltaisesta assosiaatiosta voimme ajatella vaikkapa aikaisemmin konkretisoimaamme Helsingin yliopisto-aihetta. Konkretisoidaan lisäksi pro gradun mukainen aihe pro gradu sopivalla subjekti-indikaattorilla. Nyt voimme luoda assosiaation, joka yhdistää pro gradun ja Helsingin yliopiston. Voimme antaa assosiaatiolle tyypin korkeakouluun tehty opinnäyte. Voimme antaa pro gradulle roolin opinnäyte ja Helsingin yliopistolle roolin korkeakoulu.
Kuva 26: Kaksipaikkainen assosiaatio ja assosiaation osat.
Assosiaation paikkaluku on sen sisältämien jäsenten lukumäärä. Assosiaation paikkalukua ei ole rajoitettu. Usein assosiaatiot ovat kuitenkin kaksipaikkaisia eli binäärisiä. Assosiaatiolle voidaan antaa näkyvyysalue, joka rajaa assosiaation voimassaoloa. Assosiaation näkyvyys voi olla rajattu esimerkiksi maantieteellisen paikan tai käytetyn kielen suhteen. Näkyvyysalue on kokoelma aiheita.
Aiheeseen on lisäksi mahdollista kiinnittää tyypittäviä aiheita. Aiheen ja tyypin välinen suhde (topic type) voidaan ajatella assosiaationa, jossa assosiaation tyyppi ja roolit on kiinnitetty. Assosiaation rakenne saattaa vaikuttaa monimutkaiselta. Monimutkaisuus kuitenkin hälvenee jos assosiaatio visualisoidaan kuvan 27 mukaisena taulurakenteena. Taulun otsikko vastaa assosiaation tyyppiä, sarakkeiden otsikot rooleja ja sarakkeiden sisällöt assosiaation esiintyjiä.
Kuva 27: Assosiaatio voidaan visualisoida tauluna.
Edellä on esitetty aihekarttojen keskeiset piirteet. Aihekartta koostuu aiheista ja assosiaatioista. Aiheen ominaisuuksia ovat subjektin määrittelevät URI-osoitteet, nimet ja ilmentymät. Assosiaatiot ovat aiheiden välisiä nimettyjä relaatioita, joissa jokaisella relaation esiintyjällä on rooli.
Aihekarttastandardissa [ISO13250] on aiheiden ominaisuuksien yhteydessä maininta myös faseteista (facet types). Faseteilla tarkoitetaan aihekarttarakenteisiin kiinnitettäviä ominaisuus-arvo -pareja. Fasetteja käyttäviä sovelluksia on kuitenkin vähän. Esimerkiksi aihekarttojen yleisin tallennusmuoto, XTM ei tue fasetteja.
Aihekarttojen esitys- ja tallennusmuodot
Aihekarttastandardi [ISO13250] ei määrittele millaisessa muodossa aihekartat tulisi esittää tai tallentaa. Aihekartoille onkin kehitetty useita erilaisia esitys- ja tallennusmuotoja. Yhteistä näille kaikille muodoille on sarjallisuus. Ne on mahdollista esittää tekstinä. Keskeisimmät aihekarttojen tallennusmuodot ovat XTM ja LTM. Esittelen seuraavaksi kummankin lyhyesti.
XTM (XML Topic Maps) on aihekarttojen esittämiseen käytetty XML-skeema. XTM-esitysmuotoa on kehitetty vuodesta 2000 alkaen TopicMaps.Org Authoring Groupin toimesta. Ensimmäinen määrittely, XTM 1.0, julkaistiin joulukuussa 2000 [XTM]. XMT mukailee XML-periaatteita [XML] ja pyrkii edesauttamaan aihekarttojen internet- ja WWW-käyttöä. Koska XML soveltuu itsessään vain puurakenteiden kuvaamiseen, ei sillä ole mahdollista kuvata suoraan verkkorakenteita ilman lisämäärittelyjä. XTM soveltaa Xlink- ja URI-määrittelyjä verkkorakenteen kuvaamiseen.
Kuvassa 28 on esitetty esimerkki XTM-aihekartasta, joka määrittelee eksplisiittisesti yhden aiheen Hamlet, Prince of Denmark ja yhden assosiaation, jonka tyyppi on written-by ja esiintyjät shakespeare sekä Hamlet, Prince of Denmark. Esiintyjän Shakespeare rooli on author. Esiintyjän Hamlet, Prince of Denmark rooli on work. Written-by, shakespeare, author, work ja play ovat myös aiheita, mutta niillä ei ole eksplisiittistä määrittelyä aihekartassa.
Kuva 28: Esimerkki XTM-dokumentista.
LTM (Linear Topic Maps) on kompakti aihekarttojen kuvauskieli. LTM on kehitetty Ontopiassa1, eikä sitä ole toistaiseksi standardoitu. LTM on kuitenkin kohtuullisen suosittu helpon toteutettavuuden ja käytön vuoksi. LTM-dokumentteja on mahdollista tuottaa esimerkiksi yksinkertaisella tekstieditorilla. LTM on BNF-määritelty (Backus-Naur form). LTM-jäsentäjien toteuttaminen on siten helppoa. [Gar06]. Kuvassa 29 on esitetty LTM-aihekartta, jossa on sama eksplisiittinen aihe ja assosiaatio kuin kuvassa 28. Aiheen ja assosiaation lisäksi kuvassa 29 on esitetty aiheeseen Hamlet, Prince of Denmark kiinnitetty URL-esiintymä, jonka jonka tyyppi on script.
Kuva 29: Esimerkki LTM-dokumentista.
Aihekarttojen yhdistämissäännöt
Aihekartan tulisi aina olla konsistentti eli jokaista aihekartan subjektia pitäisi aihekartassa vastata täsmälleen yksi aihe. Aihekarttojen yhdistämissäännöillä (merge rules) varmistetaan, ettei aihekarttaan synny useampia samaa subjektia vastaavia aiheita. Kun aihekarttaan lisätään aihe, jonka subjekti on ennestään aihekartassa, aihe yhdistetään automaattisesti subjektia vastaavaan, aihekartassa jo olevaan aiheeseen. Käytännössä aiheen subjektin määrittelevät
- subjektiosoite
- subjektitunnisteet
- perusnimet
Aihekarttojen yhdistämissäännöt voidaan esittää seuraavasti: kun aihekartassa on kaksi aihetta, joilla on sama subjektiosoite, subjektitunniste tai perusnimi niin aiheet edustavat samaa subjektia, ja aiheet on yhdistettävä. Aihekarttojen yhdistämissäännöt mahdollistavat tiedon inkrementaalisen keräämisen ja tietoaineistojen joustavan yhdistelyn.
Kuvassa 30 on esitetty esimerkki tilanteesta, jossa kaksi erillistä aihekarttaa yhdistetään. Kumpikin aihekartta sisältää aiheen, jonka subjekti-indikaattori on http://www.helsinki.fi/yliopisto. Aiheet yhdistetään yhdistesääntöjen perusteella ja yhdistetyssä aihekartassa on vain yksi aihe, jonka subjekti-indikaattori on http://www.helsinki.fi/yliopisto. Tämä yhdisteaihe on perinyt kaikki ominaisuutensa kummaltakin alkuperäiseltä aiheelta.
Yhdistesääntöjä sovelletaan aihekarttojen yhdistämisen lisäksi myös kun aihekarttaan luodaan uusia aiheita ja aiheita muokataan esimerkiksi subjektitunnisteiden osalta. Kun aiheeseen lisätään subjektitunniste niin seurauksena voi olla aiheen automaattinen yhdistyminen toiseen aiheeseen.
Kuva 30: Esimerkki kahden aihekartan yhdistämisestä.
Aihekarttojen käyttösovelluksia
Aihekartat kehitettiin alkujaan eri menetelmillä toteutettujen sähköisten hakemistojen yhdistämiseen [OL03]. Alkuperä näkyy vielä esimerkiksi aiheiden nimeämiskäytännössä ja yhdistämissäännöissä. Aihekarttoja voidaan käyttää monipuolisesti erilaisissa tiedon keräämiseen, hallintaan ja julkaisuun liittyvissä sovelluksissa. Aihekarttojen käyttösovelluksia ovat esimerkiksi:
- Aihekartat soveltuvat hyvin inkrementaaliseen tiedon keräämiseen ja erilaisten tietoaineistojen integrointiin. Kun subjekti-indikaattorit harmonisoidaan sopivasti, eri lähteistä kerätystä tiedoista rakentuu aihekarttojen yhdistämissääntöjen ansiosta eheä tietokokonaisuus. Lisäksi uusien assosiaatio- ja esiintymätyyppien käyttöönotto on helppoa, mikä tekee aihekarttojen tietomallista joustavan. Kaikkia yhdisteeseen liitettäviä tietoaineistoja ei tarvitse tuntea etukäteen.
- Aihekarttoja voidaan käyttää tietokantojen mallintamiseen. Pieniä aihekarttoja on nopea tuottaa ja varioida esimerkiksi käytettyjen assosiaatiotyyppien suhteen. Tietomallia on mahdollista muuttaa helposti mallissa havaittujen puutteiden perusteella.
- Aiheiden esiintymiksi on mahdollista linkittää aihekartan ulkopuolisia dokumentteja. Aihekartta on esiintymäjoukon metaverkko. Se sisältää dokumentteihin liittyvää, mutta niistä riippumatonta tietoa. Aihekarttoja voidaan käyttää esimerkiksi dokumenttien annotointiin.
- Aihekarttoja voidaan käyttää tiedon julkaisuun. XTM-aihekarttoja voidaan muuntaa XSL-muunnoksin esimerkiksi HTML-dokumenteiksi.
- Aihekartat soveltuvat hyvin monikielisiin projekteihin. Aihekartoissa on valmis tuki aiheiden erikielisille nimille ja esiintymille.
Edellä kuvattuja käyttötarpeita on esimerkiksi WWW-palveluissa ja -portaaleissa sekä uutis-, ontologia-, julkaisu- ja sanastosovelluksissa.