Semantic web, social media – SemantycznyWeb

Jak opublikować i zaindeksować semantyczną stronę www zgodną ze standardami web 3.0 (LOD) ?

przez admin dnia wrz.24, 2010, w Ogólnie

Wiele czasu trzeba poświęcić na stworzenie semantycznego opisu swojej strony www, dzięki czemu nadamy znaczenie temu co się na niej znajduje. Proces pracochłonny jeśli chcemy wprowadzać semantyczne znaczniki różnych ontologii (SIOC, FOAF, Good Relations, SKOS itd. ) ręcznie bezpośrednio w kodzie HTML wykorzystując standardy RDFa, Microdata czy znaczniki Microformats. Można również wykorzystać generatory, które zrobią to za nas. Można też to zrobić  przez umieszczenie semantycznego opisu w oddzielnych plikach .rdf i umieszczenie ich pod określoną lokalizacją na serwerze wraz ze stroną.

I co dalej ? Jak powiedzieć robotom semantycznych wyszukiwarek/składnic danych o naszej stronie dzięki czemu zwiększymy jej widoczność i użyteczność ?


Jeśli zdecydowaliśmy się na wprowadzanie znaczników RDFa bezpośrednio w kodzie na swojej stronie wykorzystując różne ontologie wystarczy wykonać następujące kroki:

1) uzupełniamy nagłówek strony, DOCTYPE:

<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML+RDFa 1.0//EN" "http://www.w3.org/MarkUp/DTD/xhtml-rdfa-1.dtd">
<html xmlns="http://www.w3.org/1999/xhtml" version="XHTML+RDFa 1.0" xml:lang="en">
<head>
<meta http-equiv="Content-Type" content="text/html; charset=UTF-8"/>
</head>

2) Opisujemy kod wykorzystując np. ontologię DC i FOAF:

<p>Nazywam się <span property="foaf:nick">Kowalski Jan</span> i lubię słuchać
<a href="http://www.neubauten.org/" rel="foaf:interest"
xml:lang="de">Einstürzende Neubauten</a>.
</p>
<p>
Moja<span rel="foaf:interest" resource="urn:ISBN:0752820907">ulubiona książka to<span about="urn:ISBN:0752820907"><cite
property="dc:title">Weaving the Web</cite> autorstwa
<span property="dc:creator">Tim Berners-Lee</span></span>
</span>
</p>

Powyższe dwa kroki pokazują przykład wykorzystania kodu źródłowego strony i jej lekką modyfikację przez odpowiednie znaczniki. Jest to jedna z możliwości publikacji RDF (Embedded RDF).

Druga metoda nie polega na zagnieżdżaniu semantyki w istniejącym kodzie lecz na podaniu przed znacznikiem zamykającym stronę fragmentu, który zawiera tylko i wyłącznie opis z wykorzystaniem wybranej ontologii. Taka możliwość powoduje jednak redundancje danych na stronie lecz jest bardziej czytelna dla człowieka.
Przykładem takiej możliwości jest wykorzystanie automatycznego generatora ontologii Good Relations, który tworzy nam przeźroczystego div’a gotowego do wklejenia na stronę.
Generator dostępny pod tym adresem – http://www.ebusiness-unibw.org/tools/grsnippetgen/. Istnieją też inne generatory do konwersji plików RDF na kod RDFa takie jak RDF2RDFa, który można użyć na stronie http://www.ebusiness-unibw.org/tools/rdf2rdfa/.

Druga z metod umieszczenia semantycznych danych polega na stworzeniu pliku RDF/XML np. semanticweb.rdf. W tym przypadku wystarczy dodać tylko jedną linijke w nagłówku strony:

<head>
<link rel="meta" type="application/rdf+xml" title="dane RDF/XML naszej firmy" href="http://www.seoshop.org/semanticweb.rdf" />
</head>

Koniecznie trzeba się upewnić czy serwer na którym znajduje się strona zwraca odpowiedni typ podczas pobierania pliku semanticweb.rdf (Content-Type: application/rdf+xml):

przykład pliku .htaccess:
AddType application/rdf+xml .rdf

Opisanie swoich danych na stronie nie oznacza, że zostanie ona dodana do chmury Linked Open Data i stanie się częścią semantycznej sieci www. Jak to zwykle bywa trzeba się samemu o to postarać…

W obu przypadkach publikacji danych na stronie, można odwiedzić następujące adresy www w celu zaindeksowania swojej strony:

Sindice – http://sindice.com

- semantyczna wyszukiwarka, która umożliwia bezpośrednie przesłanie swojej strony przez formularz lub też umożliwia przesłanie pliku .rdf zgodnie z druga opisywaną metodą. Można też ten proces zautomatyzować przez wykorzystanie udostępnionego interfejsu REST API lub RPC API:

przesłanie jednego lub więcej adresów przez plik tekstowy:
curl -H "Accept: text/plain" --data-binary @urls.txt  http://sindice.com/api/v2/ping
lub gotowy skrypt np. w PHP:
...
$client = new xmlrpc_client(" http://sindice.com/xmlrpc/api");
$payload = new xmlrpcmsg("weblogUpdates.ping");
...

Yahoo Search Monkey

- http://siteexplorer.search.yahoo.com/submit

URIBurner – http://uriburner.com/

- URIBurner to serwis, który posiada chyba najprostsza metodę wysłania swoich semantycznych stron do jego składnic danych. Oparty jest on o technologię Virtuoso’s Sponger, który jest wręcz semantycznym kombajnem zbierającym prawie wszystko co się da. Jest on w stanie pobrać semantyczne opisy zarówno z dokumentów html, plików .doc, .ppt jak i plików multimedialnych. Tworzy z nich odpowiedni graf RDF a następnie ponownie przekształca do postaci HTML lub do RDF w różnych postaciach (RDF/XML, text/n3, turtle, JSON). Prezentacje owego „kombajnu” można znaleźć na stronie http://virtuoso.openlinksw.com/dataspace/dav/wiki/Main/VirtSponger.

Aby dodać stronę do URIBurner’a wystarczy wpisać następujący adres w swojej przeglądarce:

http://linkeddata.uriburner.com/about/html/<nasza strona>
gdzie <nasza strona> to oczywiście URI naszej strony www np.:
http://linkeddata.uriburner.com/about/html/http://semantictechnology.eu
http://linkeddata.uriburner.com/about/html/<nasza strona>

PingTheSemanticWeb.com

- umożliwia przesyłanie swoich grafów w plikach .rdf oraz podobnie jak Syndice udostępnia swoje API do pingowania.

Swoogle

- jedna z pierwszych wyszukiwarek semantycznych. Swoją stronę można dodać pod następującym adresem http://swoogle.umbc.edu/index.php?option=com_swoogle_service&service=submit

Opisywane metody indeksacji semantycznej strony www nie są zapewne jedynymi metodami a opisane serwisy jedynymi istniejącymi. Jeśli znalazłeś jakieś inne ciekawe miejsca, które to umożliwiają daj znać ! : )
Warto już dziś tworzyć semantyczne Web, które staną się częścią powiększającej się chmury Linked Open Data. O korzyściach SEO płynących z takiej reprezentacji danych typu widoczność i użyteczność nie trzeba po raz kolejny powtarzać…

:, , , , , , , , , ,

1 Comment for this entry

Zostaw komentarz

Spam protection by WP Captcha-Free




Szukasz czegoś?

Użyj formularza:

Jeśli nadal nie możesz nic znaleźć, napisz do mnie!

Polecane strony