HomeAbout MeSecurityDCLinuxEee PCMusic3D GraphicsRobotsContact Me

Clusterix
29 grudnia 2003
 
Projekt Clusterix to jedno z najambitniejszych przedsięwzięć polskiej nauki ukierunkowane na rozwiązywanie problemów biznesu.
 
Tomasz Grabowski


Przepustowości łączy WAN między ośrodkami obliczeniowymi mierzy się dziś w gigabitach na sekundę. Przy zastosowaniu wielu zabiegów możliwe jest połączenie lokalnych klastrów w jeden spójny "organizm obliczeniowy". Dzięki komputerom PC z Linuxem koszt budowy takiej rozproszonej geograficznie instalacji jest niewielki w porównaniu z efektami, jakie można uzyskać, zaprzęgając ją do rozwiązywania problemów biznesowych. Udowodniły to już zresztą liczne eksperymenty z udziałem głównych ośrodków akademickich i największych dostawców technologii informatycznych.

Na przeszkodzie do pełnej komercjalizacji środowisk grid stoi jednak kilka problemów. Przede wszystkim brak jest sprawdzonych, uniwersalnych mechanizmów zarówno bezpiecznego, jak i łatwego dołączania nowych węzłów czy całych klastrów do już istniejącej, działającej rozproszonej instalacji. Drugie ważne wyzwanie dotyczy zarządzania uprawnieniami użytkowników sieci grid i innymi jej usługami, a także zleconymi zadaniami obliczeniowymi. W obu przypadkach pewne wycinkowe mechanizmy owszem, istnieją, nie można jednak w żadnym razie mówić o ich uniwersalności. Ta zaś jest konieczna dla automatyzacji procesów w ramach rozproszonych sieci grid, przekładającej się na powtarzalność operacji i w efekcie na niski jednostkowy koszt usługi obliczeniowej.

Powyższych problemów nie adresuje obecnie w pełni praktycznie żaden pakiet oprogramowania typu grid - ani te powstające w ramach środowiska open source, ani nawet komercyjne. Sytuację tę ma szansę zmienić, koordynowany przez prof. dr. hab. inż. Romana Wyrzykowskiego z Instytutu Informatyki Teoretycznej i Stosowanej Politechniki Częstochowskiej, projekt o nazwie Clusterix. Rozpoczęty w listopadzie br. i przewidziany na 30 miesięcy, zakłada stworzenie w pełni funkcjonalnego produkcyjnego środowiska, łączącego 12 największych miast Polski.

Stworzona na potrzeby projektu sieć grid obejmie ok. 100 komputerów, z których każdy będzie wyposażony w co najmniej dwa 64-bitowe procesory oraz 2 GB pamięci RAM. Będą one połączone dedykowanymi kanałami wydzielonymi w ramach wchodzącej właśnie do użytku sieci PIONIER.

Sztuka sprawnego zarządzania

Od strony inżynierskiej najważniejszą częścią projektu jest stworzenie w pełni funkcjonalnego oprogramowania umożliwiającego łatwe dołączanie dodatkowych węzłów czy całych klastrów do działającego środowiska grid. Drugim istotnym zagadnieniem jest elastyczne zarządzanie, monitorowanie oraz użytkowanie usług obliczeniowych i wykorzystywanej przez nie infrastruktury. Chodzi np. o możliwość uruchamiania pewnych zadań tylko w nocy lub na serwerach obciążonych w niewielkim stopniu. Mechanizmy tego rodzaju już istnieją, nie są jednak łatwo przenaszalne między poszczególnymi domenami obliczeniowymi. Mechanizmy zawarte w oprogramowaniu Clusterix mają wprowadzić w tym względzie rozwiązania uniwersalne.

Oprogramowanie Clusterix będzie się opierać na rozwijanym od kilku lat przez Poznańskie Centrum Superkomputerowo-Sieciowe (PCSS) systemie uwierzytelniania i kontroli uprawnień zwanym systemem użytkowników wirtualnych VUS (Virtual User System). Oprogramowanie to działa już na kilku polskich klastrach, jednak na potrzeby Clusterixa zostanie dodatkowo zoptymalizowane lub rozszerzone. VUS umożliwia łatwe zarządzanie użytkownikami bez potrzeby zakładania kont dla poszczególnych osób na wszystkich klastrach, co powinno zasadniczo uprościć i obniżyć koszty wykonywania nawet bardzo dużych zadań obliczeniowych. System zawiera także mechanizmy w znaczący sposób ułatwiające podłączanie kolejnych klastrów oraz automatyzację uwierzytelniania komponentów programowych i użytkowników.

Projekt Clusterix przewiduje także stworzenie narzędzi pozwalających precyzyjnie monitorować działanie sieci grid. Dzięki nim użytkownicy będą mogli uzyskać wszystkie niezbędne informacje na temat aktualnego stanu uruchomionych przez nich aplikacji i zadań obliczeniowych. Administratorzy otrzymają z kolei statystyki dotyczące działania infrastruktury sieci grid oraz zyskają narzędzia do rozliczania użytkowników z wykorzystanej przez nich mocy obliczeniowej. Billing usług ma bardzo duże znaczenie, gdyż kładzie to podwaliny pod wykorzystanie systemów typu grid do świadczenia usług komercyjnych.

Duży nacisk położono także na zapewnienie odpowiedniego poziomu bezpieczeństwa sieci grid. Komunikacja pomiędzy klastrami będzie w całości zaszyfrowana. Kilka poziomów uwierzytelniania - zarówno pomiędzy użytkownikiem i środowiskiem grid, jak i między poszczególnymi aplikacjami i usługami - opartych na certyfikatach, zapewni poziom bezpieczeństwa niespotykany do tej pory w tego typu oprogramowaniu. Dodatkowe systemy, takie jak sprawdzanie integralności plików, systemy detekcji włamań (IDS) czy specjalistyczne zabezpieczenia na poziomie jądra systemu operacyjnego, plasują Clusterix na najwyższym miejscu wśród wszystkich systemów gridowych pod względem bezpieczeństwa.

Oferta dla biznesu

Głównym adresatem projektu Clus-terix są środowiska naukowe. Istniejące obecnie w Polsce zapotrzebowanie na moc obliczeniową znacznie przekracza aktualne możliwości superkomputerów i klastrów działających w naszym kraju. Infrastruktura powstająca na potrzeby projektu Clusterix znacząco zwiększy potencjał obliczeniowy Polski, a także pozwoli na dużo bardziej optymalne wykorzystanie obecnych zasobów centrów obliczeniowych.

Jednak oprócz środowiska naukowego, zainteresowanie projektem wykazują przedsiębiorstwa. Przykładem są małe i średnie odlewnie zainteresowane wdrożeniem systemu komputerowego do modelowania zjawisk termomechanicznych zachodzących podczas produkcji odlewów. Szerokie wykorzystanie takiego systemu zwiększy konkurencyjność rynkową tych przedsiębiorstw poprzez poprawę jakości produktów, zmniejszenie udziału braków, skrócenie czasu wdrożenia nowego typu odlewu do produkcji. Takich zastosowań jest prawdopodobnie znacznie, znacznie więcej - duże zadania obliczeniowe leżą w kręgu zainteresowań firm farmaceutycznych, biotechnologicznych i wielu innych branż.

Popyt ze strony organizacji komercyjnych na rozwiązania możliwe do zrealizowania za pomocą oprogramowania Clusterix daje nadzieję na to, że sieci grid przestaną być jedynie domeną eksperymentów akademickich. W porównaniu z innymi podobnymi projektami funkcjonalność nowego oprogramowania będzie unikalna, dlatego już dziś warto śledzić jego rozwój. Tym bardziej że gdy oprogramowanie Clusterix będzie już gotowe, zostanie udostępnione na zasadach open source.

Ma więc szansę stać się bardzo szeroko wykorzystywaną platformą dla sieci grid. Więcej informacji można znaleźć na witrynie clusterix.pcz.pl .

Aby dodatkowo ułatwić absorpcję rozwiązań typu grid w świecie komercyjnym, w ramach projektu Clusterix zostanie stworzonych wiele aplikacji dla użytkowników końcowych. Będą to programy, pomagające rozwiązywać konkretne problemy, nad którymi pracują obecnie naukowcy w głównych ośrodkach akademickich wspólnie z biznesem.