Clusterix
29 grudnia 2003
Projekt Clusterix to jedno z najambitniejszych przedsięwzięć polskiej
nauki ukierunkowane na rozwiązywanie problemów biznesu.
Tomasz Grabowski
Przepustowości łączy WAN między ośrodkami obliczeniowymi mierzy
się dziś w gigabitach na sekundę. Przy zastosowaniu wielu zabiegów możliwe jest połączenie
lokalnych klastrów w jeden spójny "organizm obliczeniowy". Dzięki komputerom PC z Linuxem koszt
budowy takiej rozproszonej geograficznie instalacji jest niewielki w porównaniu z efektami, jakie można uzyskać,
zaprzęgając ją do rozwiązywania problemów biznesowych. Udowodniły to już zresztą
liczne eksperymenty z udziałem głównych ośrodków akademickich i największych dostawców
technologii informatycznych.
Na przeszkodzie do pełnej komercjalizacji środowisk grid stoi jednak kilka
problemów. Przede wszystkim brak jest sprawdzonych, uniwersalnych mechanizmów zarówno bezpiecznego, jak
i łatwego dołączania nowych węzłów czy całych klastrów do już istniejącej,
działającej rozproszonej instalacji. Drugie ważne wyzwanie dotyczy zarządzania uprawnieniami użytkowników
sieci grid i innymi jej usługami, a także zleconymi zadaniami obliczeniowymi. W obu przypadkach pewne wycinkowe
mechanizmy owszem, istnieją, nie można jednak w żadnym razie mówić o ich uniwersalności. Ta
zaś jest konieczna dla automatyzacji procesów w ramach rozproszonych sieci grid, przekładającej się
na powtarzalność operacji i w efekcie na niski jednostkowy koszt usługi obliczeniowej.
Powyższych
problemów nie adresuje obecnie w pełni praktycznie żaden pakiet oprogramowania typu grid - ani te powstające
w ramach środowiska open source, ani nawet komercyjne. Sytuację tę ma szansę zmienić, koordynowany
przez prof. dr. hab. inż. Romana Wyrzykowskiego z Instytutu Informatyki Teoretycznej i Stosowanej Politechniki Częstochowskiej,
projekt o nazwie Clusterix. Rozpoczęty w listopadzie br. i przewidziany na 30 miesięcy, zakłada stworzenie
w pełni funkcjonalnego produkcyjnego środowiska, łączącego 12 największych miast Polski.
Stworzona na potrzeby projektu sieć grid obejmie ok. 100 komputerów, z których każdy będzie
wyposażony w co najmniej dwa 64-bitowe procesory oraz 2 GB pamięci RAM. Będą one połączone dedykowanymi
kanałami wydzielonymi w ramach wchodzącej właśnie do użytku sieci PIONIER.
Sztuka sprawnego zarządzania
Od strony inżynierskiej najważniejszą
częścią projektu jest stworzenie w pełni funkcjonalnego oprogramowania umożliwiającego łatwe
dołączanie dodatkowych węzłów czy całych klastrów do działającego środowiska
grid. Drugim istotnym zagadnieniem jest elastyczne zarządzanie, monitorowanie oraz użytkowanie usług obliczeniowych
i wykorzystywanej przez nie infrastruktury. Chodzi np. o możliwość uruchamiania pewnych zadań tylko w
nocy lub na serwerach obciążonych w niewielkim stopniu. Mechanizmy tego rodzaju już istnieją, nie są
jednak łatwo przenaszalne między poszczególnymi domenami obliczeniowymi. Mechanizmy zawarte w oprogramowaniu
Clusterix mają wprowadzić w tym względzie rozwiązania uniwersalne.
Oprogramowanie Clusterix
będzie się opierać na rozwijanym od kilku lat przez Poznańskie Centrum Superkomputerowo-Sieciowe (PCSS)
systemie uwierzytelniania i kontroli uprawnień zwanym systemem użytkowników wirtualnych VUS (Virtual User
System). Oprogramowanie to działa już na kilku polskich klastrach, jednak na potrzeby Clusterixa zostanie dodatkowo
zoptymalizowane lub rozszerzone. VUS umożliwia łatwe zarządzanie użytkownikami bez potrzeby zakładania
kont dla poszczególnych osób na wszystkich klastrach, co powinno zasadniczo uprościć i obniżyć
koszty wykonywania nawet bardzo dużych zadań obliczeniowych. System zawiera także mechanizmy w znaczący
sposób ułatwiające podłączanie kolejnych klastrów oraz automatyzację uwierzytelniania
komponentów programowych i użytkowników.
Projekt Clusterix przewiduje także stworzenie
narzędzi pozwalających precyzyjnie monitorować działanie sieci grid. Dzięki nim użytkownicy
będą mogli uzyskać wszystkie niezbędne informacje na temat aktualnego stanu uruchomionych przez nich aplikacji
i zadań obliczeniowych. Administratorzy otrzymają z kolei statystyki dotyczące działania infrastruktury
sieci grid oraz zyskają narzędzia do rozliczania użytkowników z wykorzystanej przez nich mocy obliczeniowej.
Billing usług ma bardzo duże znaczenie, gdyż kładzie to podwaliny pod wykorzystanie systemów typu
grid do świadczenia usług komercyjnych.
Duży nacisk położono także na zapewnienie
odpowiedniego poziomu bezpieczeństwa sieci grid. Komunikacja pomiędzy klastrami będzie w całości
zaszyfrowana. Kilka poziomów uwierzytelniania - zarówno pomiędzy użytkownikiem i środowiskiem
grid, jak i między poszczególnymi aplikacjami i usługami - opartych na certyfikatach, zapewni poziom bezpieczeństwa
niespotykany do tej pory w tego typu oprogramowaniu. Dodatkowe systemy, takie jak sprawdzanie integralności plików,
systemy detekcji włamań (IDS) czy specjalistyczne zabezpieczenia na poziomie jądra systemu operacyjnego, plasują
Clusterix na najwyższym miejscu wśród wszystkich systemów gridowych pod względem bezpieczeństwa.
Oferta dla biznesu
Głównym adresatem projektu Clus-terix
są środowiska naukowe. Istniejące obecnie w Polsce zapotrzebowanie na moc obliczeniową znacznie przekracza
aktualne możliwości superkomputerów i klastrów działających w naszym kraju. Infrastruktura
powstająca na potrzeby projektu Clusterix znacząco zwiększy potencjał obliczeniowy Polski, a także
pozwoli na dużo bardziej optymalne wykorzystanie obecnych zasobów centrów obliczeniowych.
Jednak
oprócz środowiska naukowego, zainteresowanie projektem wykazują przedsiębiorstwa. Przykładem są
małe i średnie odlewnie zainteresowane wdrożeniem systemu komputerowego do modelowania zjawisk termomechanicznych
zachodzących podczas produkcji odlewów. Szerokie wykorzystanie takiego systemu zwiększy konkurencyjność
rynkową tych przedsiębiorstw poprzez poprawę jakości produktów, zmniejszenie udziału braków,
skrócenie czasu wdrożenia nowego typu odlewu do produkcji. Takich zastosowań jest prawdopodobnie znacznie,
znacznie więcej - duże zadania obliczeniowe leżą w kręgu zainteresowań firm farmaceutycznych,
biotechnologicznych i wielu innych branż.
Popyt ze strony organizacji komercyjnych na rozwiązania możliwe
do zrealizowania za pomocą oprogramowania Clusterix daje nadzieję na to, że sieci grid przestaną być
jedynie domeną eksperymentów akademickich. W porównaniu z innymi podobnymi projektami funkcjonalność
nowego oprogramowania będzie unikalna, dlatego już dziś warto śledzić jego rozwój. Tym bardziej
że gdy oprogramowanie Clusterix będzie już gotowe, zostanie udostępnione na zasadach open source.
Ma więc szansę stać się bardzo szeroko wykorzystywaną platformą dla sieci grid. Więcej
informacji można znaleźć na witrynie clusterix.pcz.pl .
Aby dodatkowo ułatwić absorpcję
rozwiązań typu grid w świecie komercyjnym, w ramach projektu Clusterix zostanie stworzonych wiele aplikacji
dla użytkowników końcowych. Będą to programy, pomagające rozwiązywać konkretne problemy,
nad którymi pracują obecnie naukowcy w głównych ośrodkach akademickich wspólnie z biznesem.