Własna trybuna

Wszyscy jesteśmy świadkami transformacji zachodzącej w formach publikowania informacji w Internecie. Choć większość danych wciąż jeszcze jest przekazywana przez strony WWW, to sytuacja ta szybko się zmienia. Dzieje się tak dlatego, że przeglądanie kolejnych witryn jest procesem, który wymaga od internauty pewnej aktywności. Zamiast więc liczyć na to, że ktoś się pofatyguje, odwiedzi naszą stronę i dotrze do publikowanej tam informacji, stwórzmy warunki, w których wiadomość dotrze do niego sama. Tylko co zrobić, by nie zostać posądzonym o spamerstwo?

Informacja w kanale

Wykorzystajmy w tym celu technologię RSS. Pozwala ona na bieżące informowanie zainteresowanych osób o tym, że na danych stronach WWW pojawiły się nowe treści. Odbiorcy mogą również dokonać wstępnej selekcji tego materiału. Jeżeli dana witryna udostępnia kanał RSS, to dzięki czytnikowi takich kanałów będziemy mogli zapoznać się z krótkimi notkami, sygnalizującymi treść wiadomości. Zawierają one tytuł i jednozdaniowy opis informacji. Kiedy stwierdzimy, że warto przeczytać całą informację, po prostu klikamy dostarczony odnośnik.

Warto rozważyć uruchomienie kanału RSS w naszej witrynie. Podniesie to atrakcyjność serwisu i pozwoli na szybsze dotarcie do opublikowanej tam informacji. Jeszcze więcej internautów przyciągnie informacja dźwiękowa. Kanał RSS zawierający dane audio nazywa się podcastem, a serwisy udostępniające takie kanały zamieniają się w internetowe rozgłośnie radiowe.

Nauka XML-a

RSS (Really Simple Syndication) bazuje na szerokiej specyfikacji XML-a, którą wykorzystuje się do opisanych powyżej celów. Na początku podajmy najważniejsze kwestie związane z XML-em:

  • dokumenty XML-owe służą do opisu informacji podzielonej na części. Każda część opatrywana jest nazwą, np. nagłówek, tytuł etc.;
  • nazwie w języku XML odpowiada pojęcie znacznika. Znacznik okala informację i wraz z nią tworzy tzw. węzeł: <znacznik>informacja</znacznik>;
  • dokument XML-owy może zawierać jeden węzeł główny – tzn. węzeł, w którym znajdują się wszystkie inne węzły;
  • każdy węzeł musi być zamknięty: <węzeł atrybut=”wartość”> zamykamy znacznikiem </węzeł>;
  • należy zamknąć wszystkie węzły potomne danego węzła, nim zamkniemy jego samego:

Dokument poprawny     Dokument błędny

                 

                 

             

Skok w kod

Za pomocą dowolnego edytora utwórzmy plik rss.xml. Zacznijmy od nagłówka określającego, którą wersję XML-a będziemy wykorzystywali i jakiego używamy kodowania dokumentu:

<?xml version=”1.0″ encoding=”ISO-
       8859-2″?>

W kolejnej linii należy utworzyć węzeł główny dokumentu, w którym dodatkowo uściślamy rodzaj specyfikacji:

<rss version=”2.0″>

. Poniżej znajduje się węzeł, który zawiera już opisywane znacznikami i atrybutami informacje:

<channel>
  <title>Tytuł naszego kanału</title>
  <link>http://www.stronaWWW</link>
  <description>Opis kanału
        </description>
  <language>pl</language>
  <webMaster>Filip Zagórski
        </webMaster>
  <copyright>Copyright 2005 by Filip
        Zagórski</copyright>
  <lastBuildDate>Wed, 19 Nov 2005
        13:20:48 +0100</lastBuildDate>
  <image>
   <title>Nazwa obrazka</title>
   <url>http://www.stronaWWW/logo.
        gif</url>
  <link>http://www.stronaWWW</link>
  <width>68</width>
  <height>25</height>
 </image>
 <item>Treść wiadomości</item>
</channel>

Pozostaje nam zamknąć węzeł główny:

</rss>

. Tak wygląda nagłówek kanału RSS. Część węzłów jest wymagana przez specyfikację, pozostałe mogą (ale nie muszą) występować. W naszym przykładzie węzłami obligatoryjnymi są:

  • <title> – określamy w nim nazwę kanału. Dobrym zwyczajem jest nadanie kanałowi i stronie WWW tej samej nazwy;
  • <link> – zawiera odnośnik do strony, na której udostępniono dokument;
  • <description> – krótkie streszczenie tego, co w danym kanale jest prezentowane.
  • Węzłami dodatkowymi (nie musimy ich umieszczać, a jeśli nawet umieszczamy, to nie musimy skorzystać ze wszystkich) są:

    • <language> – określa, jaki język jest używany w dokumencie;
    • <copyright> – zawiera informację na temat praw autorskich dotyczących udostępnianych treści;
    • <lastBuildDate> – data (w formacie zgodnym z RFC 822) ostatniej modyfikacji kanału;
    • <managingEditor> – adres e-mailowy do osoby odpowiedzialnej za zawartość kanału. Tę informację należy udostępniać ostrożnie, gdyż adres może paść łatwym łupem spamerów (tak samo jak adresy umieszczane na stronach WWW);
    • <webMaster> – adres e-mailowy osoby odpowiedzialnej za techniczne zaplecze kanału;
    • <category> – określa kategorię tematyczną, do której należy kanał;
    • <image> – jest węzłem zawierającym węzły potomne. Służy do określenia formatu obrazka (PNG, GIF bądź JPEG), który zostanie wyświetlony wraz z kanałem przez czytnik RSS. Składa się z następujących podwęzłów:
        • <title> – odpowiednik atrybutu ALT składni HTML, określający nazwę obrazka;
        • <url> – wskazuje na lokalizację obrazka (należy podać pełny adres http://…);
        • <link> – określa adres strony, na którą trafi osoba po kliknięciu logo naszego kanału;
        • <width> – określa szerokość obrazka w pikselach. Jeżeli nie podamy żadnej liczby, zostanie przyjęta domyślna wartość równa 88. Maksymalna szerokość to 144;
        • <height> – jest parametrem odpowiedzialnym za wysokość prezentowanego logo (w pikselach). Domyślną wartością jest 31, a maksymalną 400.

    Nie są to wszystkie dostępne elementy, z których korzystamy podczas tworzenia kanału. Wymieniliśmy tu najważniejsze i najczęściej używane. Podczas generowania zaawansowanych serwisów internetowych z wieloma kanałami RSS wykorzystuje się też inne elementy. Pełną specyfikację formatu można znaleźć w Sieci (patrz: ramka “Więcej informacji”).

    Więcej:bezcatnews