OntoStor
Badania naukowe związane z tematyką gridową w istotny sposób przyczyniają się do powstania nowej jakości dostępu i użytkowania zasobów komputerowych. Wraz ze wzrostem możliwości przetwarzania danych wzrasta zapotrzebowanie na coraz to pojemniejsze i bardziej efektywne podsystemy przechowywania danych. Systemy HSM są często używane, gdy należy przechowywać dane w sposób optymalny pod względem kosztów nośników i dostępu do danych.
Prawidłowe i dokładne monitorowanie systemów przechowywania danych, a w szczególności systemów HSM, jest niezbędnym warunkiem powodzenia wielu procesów zachodzących we współczesnych środowiskach gridowych takich jak: wybór repliki danych, tworzenie nowej repliki biorąc pod uwagę jej optymalną lokalizację, określenia parametrów i warunków kontraktów SLA (Service Level Agreement), zapewnienia wymaganej jakości usług QoS (Quality of Service) lub wymaganego poziomu bezpieczeństwa i dostępności.
Współczesne rozproszone środowiska obliczeniowe typu grid są często wyposażone w mechanizmy wspierające wykorzystanie wiedzy zawartej w ontologicznych opisach wielu elementów składowych systemów. Umożliwia to efektywniejsze wykorzystywanie zasobów środowiska gridowego oraz ułatwia proces integracji i tworzenia nowych aplikacji z wykorzystaniem istniejących, semantycznie opisanych modułów reprezentujących serwisy.
Celem projektu jest opracowanie metodologii organizacji dostępu do danych w środowisku gridowym w odniesieniu do zróżnicowanych systemów pamięci masowych. Oryginalność proponowanego podejścia polega na zastosowaniu technologii semantycznych z wykorzystaniem ontologii dla potrzeb modelowania takich systemów oraz organizacji dostępu do danych. Wykorzystane zostaną elementy inżynierii wiedzy celem uzyskania większej elastyczności opracowanego rozwiązania, podniesienia stopnia interoperabilności istniejących rozwiązań oraz umożliwienia łatwiejszej integracji ze środowiskami semantycznego gridu (paradygmat SOKU). W projekcie przewiduje się adaptację istniejących semantycznych opisów urządzeń i typów danych (reprezentowanych w formie ontologii) poprzez wykorzystanie istniejących i rozwój własnych metod rozszerzania ontologii bądź ich interoperabilności.
W ramach projektu opracowany zostanie ogólny model systemu przechowywania danych (CMSSM - Common Mass Storage System Model), ze szczególnym uwzględnieniem systemów HSM, oraz system estymacji czasu dostępu do danych przechowywanych w systemach MSS wraz z niezbędnymi opisami semantycznymi. Proponowany model systemu przechowywania danych będzie się składał z dwóch części: modelu opisu stanu systemu pamięci masowej oraz algorytmu działania systemu określającego sposób i warunki czasowe przejść pomiędzy stanami systemu. Model opisu stanu rozumiany jest jako zbiór dobrze zdefiniowanych parametrów opisujących aktualny stan dowolnego systemu pamięci masowej. System estymacji czasu dostępu do danych składa się z dwóch głównych typów serwisów: serwisów monitorujących systemy MSS i serwisów estymujących czas dostępu do danych składowanych w takich systemach. Implementacja serwisów monitorujących jest zależna od konkretnego systemu monitorowanego, gdyż różne systemy MSS mają różne interfejsy dostępu do narzędzi i metod diagnostycznych dostarczanych przez producenta. Serwisy estymujące, korzystając z informacji dostarczanej przez serwisy monitorujące (zarówno MSS, jak i sieć), szacują koszt dostępu dla konkretnych danych. Opracowana zostanie ontologia opisująca systemy MSS w oparciu o istniejącą, komercyjnie uznaną, ontologię opisu systemów komputerowych – CIM. Praktyczna realizacja dotyczyć będzie szerokiego spektrum pamięci masowych, a wśród nich następujących systemów HSM: DiskXtender, Castor i FSE. W projekcie zostaną pokazane dwa przypadki użycia opracowanej metodologii dostępu do danych w warstwie pośredniej systemów gridowych: w module zarządzania danymi (replikacja danych) oraz dla potrzeb tworzenia i utrzymania Wirtualnych Organizacji (kontrakty, SLA). Stworzone zostana odpowiednie API, pozwalające na wykorzystanie odpowiednich serwisów oraz środowisko portalowe, umozliwiające zarządzanie danymi i monitorowanie stanu danych i urządzeń.