Semantic web, social media – SemantycznyWeb

Linked Open Numbers

przez admin dnia kwi.04, 2010, w Ogólnie

AIFB (Institute of Applied Informatics and Formal Description Methods) z Karlsruhe w Niemczech, 1 kwietnia udostępnił swój projekt o nazwie Linked Open Numebrs (LON). Dzięki temu do „chmury” Linked Open Data (LOD) dodano 14 bilionów nowych trójek opisujących liczby naturalne…

Do budowy ontologii opisującej liczby, zostały wzięte pod uwagę poniższe kwestie:

  • każda liczba określana nazwą NLE (Non Lexical Entity) powinna posiadać swój zasób (URI)
  • liczby są uporządkowane według kolejności od najmniejszej do największej oraz powinna być możliwość zidentyfikowania dla każdej z nich jej poprzednika (predecessor) oraz następce (succesor)
  • zgodnie z zasadą divide-and-conquer, dla każdej liczby powinien być dostępny jej rozkład na czynniki pierwsze
  • każda liczba powinna być opisana za pomocą nazwy w kilku językach
  • aby była zgodność ze „starymi” oznaczeniami, każda z nich powinna posiadać rzymski odpowiednik
  • z powodu użyteczności logarytmu naturalnego w takich dziedzinach nauki jak biologia, psychologia czy muzyka, każda liczba powinna być opisana swoim logarytmem naturalnym

W implementacji projektu, który można znaleźć pod adresem http://km.aifb.kit.edu/projects/numbers/ został użyty następujący schemat URI (przykładowe URI dla liczby 7):

  • http://km.aifb.kit.edu/projects/numbers/n7 jest identyfikatorem liczby (URI), który kieruje do elektronicznej reprezentacji liczby w postaci HTML lub RDF, których URL znajduje się poniżej…
  • http://km.aifb.kit.edu/projects/numbers/web/n7 to reprezentacja liczby w postaci HTML
  • http://km.aifb.kit.edu/projects/numbers/data/n7 to reprezentacja liczby w postaci RDF, czyli formacie który „rozumieją” maszyny

Dla każdego NLE jest dostępnych minimum 14 trójek (dla większych liczb otrzymujemy np. coraz większy rozkład na czynniki pierwsze). Jako, że opisanych jest 1,000,000,000 NLE mamy więc 14 bilionów opublikowanych trójek. Jest to do tej pory największy zastrzyk do „chmury” LOD. Oszacowano, że LOD powiększyło się o około 87,5% …

Póki co dostępne są opisy w formacie RDX/XML ale rozważane są ich odpowiedniki w innych formatach takich jak JSON, OWL 2 Manchester Syntax oraz Microformats np. hCard lub hReceipe. Aktualny LON nie jest ostateczny. Jego twórcy chcą aby był on niejako punktem startowym dla nowej dziedziny badań nad Semantic Web.

Pod adresem http://www.aifb.kit.edu/web/Article3017 można przeczytać oficjalną publikacje dotyczącą tego projektu.

I na koniec rzut okiem na przykładowy RDF dla liczby 7:

<?xml version="1.0" encoding="iso-8859-1"?>
<rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
xmlns:rdfs="http://www.w3.org/2000/01/rdf-schema#"
xmlns:owl="http://www.w3.org/2002/07/owl#"
xmlns:n="http://km.aifb.kit.edu/projects/numbers/number#">
<n:NaturalNumber rdf:about="http://km.aifb.kit.edu/projects/numbers/n7">
<rdfs:label>7</rdfs:label>
<rdfs:seeAlso rdf:resource="http://km.aifb.kit.edu/projects/numbers/web/n7" />
<rdf:value rdf:datatype="http://www.w3.org/2001/XMLSchema#int">7</rdf:value>
<n:value rdf:datatype="http://www.w3.org/2001/XMLSchema#int">7</n:value>
<n:previous rdf:resource="http://km.aifb.kit.edu/projects/numbers/n6" />
<n:next rdf:resource="http://km.aifb.kit.edu/projects/numbers/n8" />
<owl:sameAs rdf:resource="http://dbpedia.org/resource/7_(number)" />
<rdfs:label xml:lang="en">seven</rdfs:label>
<rdfs:label xml:lang="de">sieben</rdfs:label>
<rdfs:label xml:lang="es">siete</rdfs:label>
<rdfs:label xml:lang="it">sette</rdfs:label>
<rdfs:label xml:lang="fr">sept</rdfs:label>
<rdfs:label xml:lang="lt">septyni</rdfs:label>
<rdfs:label xml:lang="pt">sete</rdfs:label>
<rdfs:label xml:lang="cs">sedm</rdfs:label>
<rdfs:label xml:lang="et">seitse</rdfs:label>
<n:roman rdf:datatype="http://www.w3.org/2001/XMLSchema#string">VII</n:roman>
<n:log rdf:datatype="http://www.w3.org/2001/XMLSchema#float">1.94591014906</n:log>
<n:primefactor rdf:resource="http://km.aifb.kit.edu/projects/numbers/n7" />
</n:NaturalNumber>
</rdf:RDF>
:, , ,

1 Comment for this entry

  • apohllo

    Jak dla mnie użyteczność tego systemu wątpliwa. Wszystkie udostępnione informacje (poza nazwami w różnych językach) są przecież obliczalne i to w czasie znacznie krótszym niż zapytanie wykonane do bazy (może z wyjątkiem rozkładu na czynniki pierwsze…) A schemat nazewnictwa w pewnym sensie też jest obliczalny. Co więcej liczby nie są wieloznaczne, zatem kiedy pojawiają się w danych źródłowych, nie ma wątpliwości o jaką liczbę chodzi (w przeciwieństwie do innych zasobów).
    Pomysł jest dla mnie dosyć dziwny.

Zostaw komentarz

Spam protection by WP Captcha-Free




Szukasz czegoś?

Użyj formularza:

Jeśli nadal nie możesz nic znaleźć, napisz do mnie!

Polecane strony