Rozdział 25. u Publikowanie witryny 743
W poprzednich sześciu rozdziałach uczyłeś się tworzyć i testować strony WWW, korzystając z własnego komputera i przeglądarki. Do tych celów nie jest nawet konieczne łączenie się z siecią. Najprawdopodobniej utworzyłeś już swoją witrynę WWW, nadając jej odpowiednią strukturę i umieszczając w niej rozsądną liczbę troskliwie dobranych obrazów (zaopatrzonych w tekst alternatywny ALT). Powstał przypuszczalnie także i tekst, wyważony i przemyślany oraz względne połączenia, a wszystko zostało dokładnie przetestowane.
Jesteś więc gotów do opublikowania swojej prezentacji, aby inni użytkownicy sieci mogli ją podziwiać i umieszczać na swoich stronach połączenia do niej prowadzące. W tym i następnym rozdziale nauczysz się wszystkiego, co jest potrzebne, aby móc opublikować wyniki swojej pracy. Ten rozdział podejmuje takie oto tematy:
n do czego służy serwer i dlaczego jest Ci potrzebny,
n gdzie możesz znaleźć serwer WWW, na którym można umieścić witrynę,
n jak zainstalować witrynę,
n w jaki sposób określić adres URL,
n jak testować strony WWW i jak radzić sobie z błędami.
Aby móc opublikować strony WWW, niezbędny jest serwer WWW. Serwer WWW to program działający na podłączonym do Internetu komputerze, czekający na połączenie z przeglądarką i prośbę o plik. Po nadejściu takiej prośby, serwer odnajduje plik i odsyła go do przeglądarki. Proces jest tak prosty, jak ten opis.
Serwery WWW i przeglądarki komunikują się ze sobą za pomocą protokołu HTTP (ang. HyperText Transfer Protocol), czyli specyficznego języka utworzonego specjalnie do obsługi próśb o pliki i transferu dokumentów hipertekstowych w sieci. Z tego powodu serwery WWW nazywane są często serwerami HTTPD.
Litera D w skrócie HTTPD oznacza daemon. Daemon, zgodnie z terminologią obowiązującą w systemie Unix, to program rezydujący w tle i oczekujący na prośby o pliki. W przypadku ich nadejścia budzi się, obsługuje prośbę i ponownie zasypia. Nie musisz pracować pod systemem Unix, by znaleźć program działający tak jak ten. Serwery WWW działające na dowolnych platformach są nazywane serwerami HTTPD. Ja zazwyczaj nazywam je po prostu serwerami WWW.
Chociaż podstawowym celem serwera WWW jest odpowiadanie na prośby nadchodzące od przeglądarek, lista obowiązków serwera obejmuje jeszcze parę innych zadań. Kilka z nich poznasz w tym rozdziale.
W rozdziale 13. zatytułowanym „Multimedia: Dodawanie dźwięków, obrazów wideo i innych elementów multimedialnych” omówione zostały typy plików i sposoby korzystania przez serwery i przeglądarki z rozszerzeń nazw plików w celu określenia ich typów. Serwer jest zobowiązany poinformować przeglądarkę o rodzaju zawartych na nim plików. Możesz tak skonfigurować serwer, by wysyłał informacje o różnorodnych typach lub obsługiwał nowe i inne pliki oraz rozszerzenia. W tym rozdziale kwestie te zostaną dokładniej omówione. W podrozdziale — „Pytania do Webmastera”, umieszczonym w dalszej części rozdziału, poznasz kilka ważnych pytań, jakie należy zadać dostawcy usług internetowych przed opublikowaniem witryny.
Serwer WWW jest również odpowiedzialny za zarządzanie plikami na podstawowym poziomie, zawiera się tu określanie umiejscowienia pliku oraz śledzenie jego przemieszczania. Jeśli przeglądarka występuje o przesłanie pliku, który nie istnieje, serwer WWW odsyła stronę z komunikatem 404: File Not Found. Serwery mogą być również tak skonfigurowane, by tworzyły zamienniki plików (zamiennik pliku to ten sam plik, ale dostępny pod inną nazwą), aby umożliwić przesyłanie plików pod różne adresy (automatycznie wskazując przeglądarce nowy adres URL przemieszczonego pliku) i zwrot pliku domyślnego lub wydruku katalogu, w przypadku, gdy przeglądarka występuje o adres URL zakończony nazwą katalogu.
Do obowiązków serwera należy również przechowywanie raportów, w których zawarta jest informacja o częstotliwości korzystania z pliku, w tym dane dotyczące witryny korzystającej z pliku, daty oraz, w przypadku niektórych serwerów, typu przeglądarki i adresu URL strony.
Jednym z najbardziej interesujących zadań (i zarazem najbardziej złożonych), jakie program serwera może wykonać jest uruchomienie zewnętrznego programu w oparciu o dane wejściowe dostarczone przez użytkowników z przeglądarek. Te specjalne programy są zazwyczaj nazywane skryptami CGI i stanowią podstawę tworzenia interaktywnych formularzy oraz działających po stronie serwera map odsyłaczy (są to obrazy, na których zdefiniowano czynne obszary, w zależności od tego, w którym miejscu użytkownik kliknie, przeprowadzona zostanie inna operacja). Skrypty CGI umożliwiają także tworzenie komunikacji pomiędzy serwerem a bazą danych lub innym systemem informacji ulokowanym po stronie serwera.
Korzystanie ze skryptów CGI jest starszym sposobem obsługi formularzy. Obecnie mamy już rozwiązania nie wymagające przetwarzania danych przez serwer. Istnieją również języki skryptowe, takie jak VBScript i JavaScript. Niestety związane z nimi zagadnienia wykraczają poza obszar tematyki naszej książki.
Niektóre serwery mogą poddawać pliki obróbce przed przesłaniem ich przeglądarkom. Na najprostszym poziomie znajdują się włączenia realizowane po stronie serwera, mogą one wstawiać na stronę datę, tekst lub uruchamiać program (wiele z programów rejestrujących częstotliwość odwiedzin stron jest uruchamianych w ten sposób). Obróbkę pliku po stronie serwera można wykorzystać w sposób bardziej wyrafinowany, na przykład, aby modyfikować pliki na bieżąco pod kątem różnych przeglądarek lub by wykonywać niewielkie fragmenty kodu skryptu.
Niektóre serwery, zanim dopuszczą użytkownika do swoich zasobów, wymagają od niego zarejestrowania się i podania nazwiska oraz hasła. Procedura ta nosi nazwę autoryzacji (lub zabezpieczania hasłem) i staje się coraz powszechniejsza. Za pomocą autoryzacji możliwe jest określanie użytkowników i haseł oraz ograniczanie dostępu do pewnych plików i katalogów. Dostęp do plików lub całej witryny może być ograniczany w oparciu o nazwy witryn bądź adresy IP, na przykład, by zapobiec przeglądaniu plików przeznaczonych do użytku wewnętrznego przez osoby niepowołane, spoza Twojej firmy.
Autoryzacja lub zabezpieczanie hasłem umożliwia zabezpieczenie plików i katalogów ulokowanych na Twoim serwerze WWW. Występujący o pliki użytkownicy muszą przedstawić się, podając swoje nazwisko i hasło.
Kierując się względami bezpieczeństwa, niektóre serwery udostępniają obecnie mechanizm zabezpieczania połączeń i transakcji, wykorzystujący protokół SSL firmy Netscape. SSL umożliwia autoryzację serwera (w celu udowodnienia, że serwer jest rzeczywiście tym, za jaki się podaje) oraz kodowane połączenie pomiędzy przeglądarką i serwe-rem, dzięki czemu przesyłane informacje pozostają tajne.
Zanim umieścisz swoją witrynę w sieci, musisz znaleźć serwer WWW, z którego będziesz mógł skorzystać. Czy będzie to zadanie łatwe, czy nie, zależy od tego, jaki masz dostęp do Internetu.
Jeśli korzystasz ze szkolnego lub służbowego podłączenia do Internetu, jest wysoce prawdopodobne, że będziesz miał możliwość publikowania swoich stron WWW na szkolnym czy firmowym serwerze. Szkoły i firmy korzystają zazwyczaj z szybkich łączy, a także zatrudniają administratorów, taka sytuacja jest więc dla Ciebie wręcz idealna.
Wystarczy teraz spytać administratora systemu, konsultanta komputerowego, webmastera czy dostawcę usług sieciowych o możliwość dostępu do serwera oraz o niezbędne procedury, które należy wykonać, by zainstalować swoje strony. O co pytać, dowiesz się z dalszej części rozdziału.
Za dostęp do Internetu płaci się firmie dostarczającej Internet (ISP — Internet service provider) lub też komercyjnemu serwisowi on-line. Wiele z nich pozwala na publikację stron WWW w Internecie na swoich serwerach, aczkolwiek może być to związane z dodatkowymi opłatami. Umieszczając stronę WWW na serwerze tego typu firm, należy liczyć się z różnymi ograniczeniami tematyki bądź typu stron, rodzaju skryptów CGI (czy też w ogóle możliwości posługiwania się nimi) oraz innych operacji związanych z przetwarzaniem danych po stronie serwera. Więcej informacji o różnych sposobach publikacji stron WWW można uzyskać w biurze obsługi klienta dostawcy Internetu czy też za pomocą internetowych grup dyskusyjnych.
W ostatnich latach pojawiło się kilka firm zajmujących się wyłącznie obsługą publikowania. Zazwyczaj serwisy te udostępniają metodę przesyłania plików do swoich witryn (w większości wypadków są to archiwa FTP), miejsce na dysku twardym oraz połączenie sieciowe, za pomocą którego uzyskujesz dostęp do swoich plików. Serwisy zapewniają także fachową obsługę witryny, dzięki której serwery działają poprawnie.
W większości wypadków opłata za korzystanie z takich usług serwisowych składa się z comiesięcznej raty oraz kosztów dodatkowych, jeśli korzystasz z dużego obszaru dysku twardego lub gdy popularność Twoich stron znacząco obciąża serwer. Niektóre z serwisów zezwalają na korzystanie ze skryptów CGI do obsługi formularzy oraz z map odsyłaczy, w których konfiguracji mogą Ci nawet pomóc. Są również takie serwisy, które nadadzą swojemu serwerowi nazwę Twojego komputera, wygląda to wówczas tak, jakbyś dysponował w sieci własnym serwerem WWW. Wszystko to sprawia, że korzystanie z usług komercyjnych witryn WWW jest bardzo kuszące.
Większość komercyjnych dostawców Internetu udostępnia w jednym z podkatalogów swoich serwerów miejsce na publikację strony WWW. Adres tak umieszczonej strony może wyglądać następująco: http://nazwaisp.net/~nazwaTwojegokonta. Istnieje również możliwość uzyskania od dostawcy Internetu lub firmy udostępniającej miejsce na swoim serwerze konta z wirtualną nazwą domenową za bardzo rozsądną cenę.
Po ustawieniu konta tego typu należy zarejestrować wybraną nazwę domenową w InterNIC[1]. Początkowy koszt rejestracji i uzyskania nazwy domenowej oraz adresu IP może wynieść tylko 70$ za dwa lata. Po tym czasie wnosi się drobne opłaty za utrzymanie aktywnej nazwy domenowej. We wszystkich zastosowaniach i przypadkach z zewnątrz wszystko będzie wyglądało tak, jakby Twoja witryna działała na własnym serwerze WWW. Tak działający serwis może mieć, na przykład, adres:
http://www.mojawspanialawitryna.com/.
Wiele firm oferujących dostęp do Internetu lub miejsce na swoich serwerach WWW pomaga przy rejestracji nazwy domenowej. Można to zrobić również na własną rękę w Network Solutions — http://www.networksolutions.com/ — firmie aktualnie zarządzającej rejestracjami InterNIC w Stanach Zjednoczonych, czy też w polskim NASK-u.
Pod adresem http://webhostlist.internetlist.com/ znajduje się spis firm oferujących usługi utrzymania stron internetowych, dzięki niemu w łatwy sposób można znaleźć najkorzystniejszą ofertę. Spis odnośników do innych firm tego typu można znaleźć w dodatku A — „Inne źródła informacji”.
Warto tu zwrócić uwagę, iż w przeciwieństwie do Twojego głównego dostawcy Internetu, który powinien znajdować się jak najbliżej firmy, ponieważ większa odległość od siedziby firmy zazwyczaj wiąże się z większymi kosztami dzierżawy łączy, firma udostępniająca miejsce na publikację stron WWW może znajdować się w dowolnym miejscu Internetu. Dlatego też można spokojnie skupić się na znalezieniu najtańszej i najlepszej oferty, nie kłopocząc się geograficznym umiejscowieniem danej firmy w świecie[2].
Jeśli jesteś naprawdę zdecydowany i nie chcesz iść na kompromisy przy tworzeniu i publikacji stron WWW, rozwiązaniem jest założenie własnego serwera. Dzięki temu będziesz mógł opublikować dowolną ilość danych o dowolnej treści. Będziesz również mógł korzystać z formularzy, skryptów CGI, pluginów, zaawansowanych technologii, takich jak kanały czy netcasting, map rysunków oraz wielu innych opcji specjalnych. Inne sposoby publikacji stron WWW mogą utrudnić korzystanie z niektórych wymienionych możliwości, tym niemniej założenie własnego serwera stron WWW nie jest rozwiązaniem dla każdego. Koszt, czas konieczny na utrzymanie serwera oraz dodatkowa wiedza techniczna wymagana do prowadzenia własnego serwera może nie tylko zniechęcać przeciętnych użytkowników, lecz także wymagać wiedzy i doświadczenia, którego nie posiadają.
Gdy uzyskałeś dostęp do serwera WWW, możesz opublikować witrynę, nad której utworzeniem pracowałeś tak ciężko. Ale zanim umieścisz ją na serwerze, powinieneś pomyśleć o właściwym zorganizowaniu plików. Konieczne jest także przemyślenie kwestii umiejscowień poszczególnych plików, aby nie pogubiły się oraz by połączenia działały poprawnie.
Webmaster to osoba obsługująca Twój serwer WWW, może nią być administrator systemu, działu obsługi klienta lub administrator sieciowy. Zanim opublikujesz swoje pliki, powinieneś dowiedzieć się od Webmastera paru rzeczy o konfiguracji serwera. Podane niżej pytania pomogą Ci także w dalszej części książki, gdy będziesz musiał określić swoje możliwości względem serwera:
n Gdzie mam umieścić moje pliki na serwerze? W wielu wypadkach Webmaster może utworzyć dla Ciebie specjalny katalog. Dowiedz się, gdzie jest ten katalog i jak się do niego dostać. W pewnych sytuacjach natomiast, a szczególnie dotyczy to komputerów pracujących pod systemem Unix, możesz mieć możliwość utworzenia specjalnego katalogu w katalogu domowym i przechowywania tam swoich plików. W takim przypadku Webmaster poda Ci nazwę katalogu;
n Jaki jest adres URL mojego katalogu najwyższego poziomu? Adres ten może się różnić od ścieżki dostępu do plików;
n Jaka jest nazwa domyślnego systemowego pliku indeksu? Plik ten jest ładowany domyślnie, jeśli URL kończy się nazwą katalogu. Zazwyczaj jest to index.html, ale czasami plik nazywa się default.html, Homepage.html lub jeszcze inaczej;
n Czy mogę uruchamiać skrypty CGI? W zależności od serwera odpowiedź na to pytanie może brzmieć „nie” lub „tak, ale tylko w przypadku pewnych programów i możliwości”. Na razie nie musisz znać szczegółów tworzenia skryptów CGI, temat ten jest szczegółowo omawiany w dalszej części książki;
n Czy serwer obsługuje specjalne pluginy lub typy plików? Jeśli chciałbyś umieścić na swojej stronie specjalne typy danych (Real Audio, Shockwave, Shockwave Flash i inne podobne do nich pluginy lub rozszerzenia), Twój webmaster być może będzie musiał zmienić konfigurację serwera w celu dostosowania go do obsługi tego typu plików. Zanim więc utworzysz specjalne typy danych, sprawdź, czy serwer potrafi je obsłużyć;
n Czy serwer obsługuje FrontPage Server Extensions? Microsoft FrontPage, bardzo popularny program do tworzenia stron WWW w środowisku Windows (i Macintosh), pozwala na tworzenia zaawansowanych stron WWW zawierających formularze i inne dodatkowe cechy. Tym niemniej, niektóre możliwości FrontPage można wykorzystać dopiero po zainstalowaniu na serwerze stron WWW dodatku FrontPage Server Extensions. Jeśli więc chciałbyś z nich skorzystać, upewnij się, że Twój ISP udostępnia tę możliwość;
n Czy na moją witrynę nałożone są ograniczenia, a jeżeli tak, to jakie? Niektóre witryny ograniczają podejmowaną tematykę (na przykład, do problemów związanych z pracą) lub pozwalają na umieszczanie tylko kilku stron. Możliwe są także ograniczenia dotyczące liczby osób jednorazowo odwiedzających Twoje strony lub też ograniczenia sposobu publikowania. Upewnij się, że rozumiesz ograniczenia systemu i potrafisz działać w ich obrębie.
n Czy istnieje ograniczenie przepustowości łącza, jaką mogą zająć osoby odwiedzające moją stronę? Pytanie to jest analogiczne do poprzedniego. Twój dostawca Internetu może nie określić limitu liczby stron na serwerze, ale może się okazać, że po przekroczeniu w ciągu miesiąca określonej zajętości przepustowości łącza, będziesz musiał wnieść dodatkowe opłaty. Dlatego też przed umieszczeniem na witrynie 10 MB plików i wzbogaceniu stron o obszerną grafikę, pliki dźwiękowe oraz klipy wideo, warto zapytać, czy istnieje takie ograniczenie. Zazwyczaj obciążenie przepustowości łącza jest powiązane z liczbą pobrań witryny (liczbą wyświetleń podstron lub pobrań umieszczonych na nich plików);
n Czy są już jakieś gotowe skrypty, które można wykorzystać przy tworzeniu stron WWW? Jeśli nie masz ochoty tworzyć własnych skryptów rozbudowujących możliwości tworzonych stron, zapytaj swojego dostawcę, czy nie udostępnia gotowych, z których mógłbyś skorzystać. Przykładowo, wielu ISP udostępnia skrypty pozwalające na umieszczenie na stronach WWW liczników. Mogą to być również skrypty przetwarzające formularze, czy też inne tego typu.
n Organizowanie plików za pomocą katalogów
n Chyba najłatwiejszym sposobem zorganizowania każdej z prezentacji jest umieszczenie wszystkich składających się na nią plików w jednym katalogu. Jeśli dodatkowych plików jest wiele, na przykład, z powodu dużej liczby obrazów, możesz zgromadzić je w podkatalogu katalogu głównego. Twoim celem powinno być zebranie wszystkich plików w jednym miejscu, a nie rozrzucenie ich po całym dysku twardym. Po uporządkowaniu plików, możesz skonfigurować połączenia, by były względne w zakresie tego jednego katalogu. Jeśli zastosujesz się do tych podpowiedzi, w prosty sposób uzyskasz możliwość przenoszenia katalogu na inne serwery bez niszczenia połączeń.
PROZO