Sieć dla eksperta

Casaubon, główny bohater “Wahadła Fou-caulta” Umberto Eco, prowadzi niewielką firmę, która zajmuje się poszukiwaniem informacji. Jego biuro wypełnione jest encyklopediami, słownikami, atlasami i pudełkami z tysiącami fiszek. Uważa on, że nie ma informacji niepotrzebnych, wszystkie trzeba gromadzić w kartotece. Ale to było jeszcze przed erą Internetu.

Wertujemy katalogi

Zasoby Sieci możemy przeszukiwać, używając katalogów ogólnych (general directories), wyszukiwarek (search engines) oraz wyspecjalizowanych katalogów tematycznych (specialized directories). Listy odnośników do wybranych stron, pogrupowane w kategorie tematyczne, to katalogi ogólne. Mają one dwie podstawowe cechy: są selektywne (znajdziemy tam tylko strony, które zostały wybrane ze względu na ich przydatność i zawartość) oraz skategoryzowane (odsyłacze zostały umieszczone w grupach tematycznych). Sprawia to, że choć zawierają one znacznie mniejszą liczbę witryn niż indeksy wyszukiwarek, to ich jakość jest lepsza. Podział na kategorie pozwala na rozpoczęcie poszukiwań od kwestii najbardziej ogólnych, a skończenie na szczegółowych. Katalogi ogólne zostały zaprojektowane z myślą o przeglądaniu podanych stron i są przydatne, gdy poszukujemy informacji podstawowych w obrębie konkretnej problematyki. Ich słabą stroną jest to, że często właściciele katalogów pobierają opłaty za wysokie miejsce na liście, bywa więc, że względy ekonomiczne wygrywają z jakością. Przykładem katalogu, którego właściciele pobierają opłatę za umieszczenie w nim odnośnika, jest Looksmart (looksmart.com).

Jeżeli nasze poszukiwania dotyczą określonych zagadnień, skorzystajmy z katalogu. Kiedy nie mamy sprecyzowanych oczekiwań, zdajmy się raczej na wyszukiwarki. Dzięki nim będziemy mogli zawęzić kryteria wyszukiwania. Narzędzia te oferują również możliwość znajdowaniafraz, dat czy plików według rozszerzeń. Żadna wyszukiwarka nie indeksuje wszystkich istniejących stron na dany temat. By otrzymać pełniejsze wyniki, posłużmy się tzw. metawyszukiwarkami, poszukującymi odpowiedzi za pomocą wielu narzędzi równocześnie. Dobrze jest też skorzystać z oprogramowania, które spełnia funkcje podobne do wyszukiwarek, ale możemy do niego dodać własne engine’y przeszukujące, a program będzie usuwał dublujące się rezultaty. Przykładami takich aplikacji są Copernic Agent (darmowa wersja Basic znajduje się na stronie www.copernic.com) czy BullsEye. Pamiętajmy też, że gdy używamy wyszukiwarki, to my, jako poszukujący, selekcjonujemy strony.

Wyspecjalizowane katalogi tematyczne to strony szczególnie przydatne dla osób poszukujących informacji naukowej w Sieci. Znane również jako resource guides, webliographies czy też cyberguides są zbiorami odnośników do internetowych zasobów o ściśle określonej tematyce. Występują jako portale lub bramki tematyczne i koncentrują się wokół danej dyscypliny albo typu dokumentów. Często są bardzo wyspecjalizowane, a ich duża selektywność zapewnia informacje na wysokim poziomie mimo stosunkowo niewielkiej liczby zamieszczonych w nich stron. Katalogów tematycznych możemy szukać poprzez wyszukiwarki (np. w podkategorii “Web directories” na www.yahoo.com), w profesjonalnych publikacjach czy poprzez katalogi katalogów (patrz: ramka obok). Katalogi tematyczne różnią się też od siebie rozmiarami, jednak nie zawsze jest tak, że liczba zgromadzonych odnośników gwarantuje wartościowe informacje. Dlatego niektóre z nich zaopatrzono w wyszukiwarki, a my nie jesteśmy skazani na przeglądanie wszystkich zasobów. Innym usprawnieniem są adnotacje zawierające krótki opis każdej strony katalogu. Dowiemy się zatem wcześniej, czego możemy się spodziewać, otwierając dany odnośnik.

Biblioteczne podziemia

Sieć ma jednak więcej do zaoferowania, niż mogłoby się wydawać. Istnieją ogromne zasoby nazywane niewidoczną Siecią, czyli Invisible Web lub Deep Net (patrz: $(LC18160:Odmęty Sieci)$). Mówi się, że jej zawartość jest nawet pięćset razy większa niż ta dostępna “na powierzchni”. Invisible Web jest niewidoczna, bo nie widzą jej wyszukiwarki. Zawiera ona ogromną liczbę baz danych, statystyk i dokumentów. “Niewidzialność” tych zasobów nie jest związana z tajnością. Często wyszukiwarki nie widzą tych danych, ponieważ nikt nie zgłosił strony do indeksu lub formaty plików są inne niż HTML (chodzi o pliki audio i wideo, do 2001 roku wyszukiwarki nie indeksowały też między innymi formatów PDF i DOC).

Czasami przeglądarki “nie widzą” również treści stron, których zawartość jest chroniona przez mechanizm uwierzytelniania. Konieczność autoryzacji często wskazuje na stronę zawierającą bazę danych, która może okazać się przydatna w badaniach naukowych.

Do zasobów Deep Netu można dotrzeć na dwa sposoby. Pierwszy to skorzystanie z listy “niewidocznych” witryn. Takie wykazy zostały zamieszczone np. na www.invisible-web.net, aip.completeplanet.com oraz www.freepint.com. Znajdziemy tam m.in. bibliograficzną bazę danych dotyczącą kobiet w polityce, bazę czasopism naukowo-medycznych oraz wiele odnośników do katalogów tematycznych. Możemy również zainstalować program, który specjalizuje się w przeszukiwaniu niewidzialnej zawartości Sieci. Jest nim np. Deep Query Manager (wcześniejszą wersją był LexiBot).

Udostępnia się…

Pozostaje kwestia dostępności znalezionych przez nas danych. Może się wydawać, że najbardziej wartościowe teksty lub wyspecjalizowane serwisy są płatne. Jednak wiele baz danych, archiwów tekstów i bibliografii jest darmowa. W wielu wypadkach nie trzeba się też rejestrować. Za dostęp do niektórych zasobów musimy oczywiście zapłacić (subskrypcja), choć najczęściej dotyczy to tylko czasopism online, archiwów dzienników lub pełnych tekstów książek opublikowanych po 1920 roku. Przykładowo: cena za jeden tekst z archiwum Ingenta Connect często waha się od 20 do 40 USD.

Czasami możliwość wykorzystania danych znajdujących się w bazach gwarantowana jest tylko członkom instytucji. Na przykład teksty czasopism wydawanych przez Oxford University Press dostępne są odpłatnie, ale wyłącznie dla organizacji. Te ostatnie mogą również zamawiać wydrukowanie i przesłanie wybranych artykułów.

W Polsce korzystanie z części usług (m.in. z Encyclopaedii Britannica czy Thomson Gale Database) gwarantuje swoim członkom biblioteka brytyjska z ramienia British Council Poland. Wiele usług oferowanych jest również przez biblioteki uniwersyteckie. Nieraz dostęp, za który jako indywidualni użytkownicy musielibyśmy zapłacić, oferują sieci biblioteczne lub Oddziały Informacji Naukowej.

Istnieją również profesjonalne serwisy zajmujące się ochroną dostępu do płatnych zasobów. Jednym z nich jest Eduserv Athens (www.eduserv.org.uk). Zawiera on zaawansowany system zarządzania dopuszczaniem użytkowników do danych i współpracuje z wieloma podobnymi organizacjami na całym świecie.

Więcej:bezcatnews