OntoStor
Projekt KBN nr N N516 405535
http://www.icsr.agh.edu.pl/ontostor/
Badania naukowe związane z tematyką gridową w istotny sposób przyczyniają się do powstania nowej jakości dostępu i użytkowania zasobów komputerowych. Wraz ze wzrostem możliwości przetwarzania danych wzrasta zapotrzebowanie na coraz to pojemniejsze i bardziej efektywne podsystemy przechowywania danych. Systemy HSM są często używane, gdy należy przechowywać dane w sposób optymalny pod względem kosztów nośników i dostępu do danych.
Prawidłowe i dokładne monitorowanie systemów przechowywania danych, a w szczególności systemów HSM, jest niezbędnym warunkiem powodzenia wielu procesów zachodzących we współczesnych środowiskach gridowych takich jak: wybór repliki danych, tworzenie nowej repliki biorąc pod uwagę jej optymalną lokalizację, określenia parametrów i warunków kontraktów SLA (Service Level Agreement), zapewnienia wymaganej jakości usług QoS (Quality of Service) lub wymaganego poziomu bezpieczeństwa i dostępności.
Współczesne rozproszone środowiska obliczeniowe typu grid są często wyposażone w mechanizmy wspierające wykorzystanie wiedzy zawartej w ontologicznych opisach wielu elementów składowych systemów. Umożliwia to efektywniejsze wykorzystywanie zasobów środowiska gridowego oraz ułatwia proces integracji i tworzenia nowych aplikacji z wykorzystaniem istniejących, semantycznie opisanych modułów reprezentujących serwisy.
Celem projektu było opracowanie metodologii organizacji dostępu do danych w środowisku gridowym w odniesieniu do zróżnicowanych systemów pamięci masowych. Oryginalność proponowanego podejścia polega na zastosowaniu technologii semantycznych z wykorzystaniem ontologii dla potrzeb modelowania takich systemów oraz organizacji dostępu do danych. Wykorzystane zostały elementy inżynierii wiedzy celem uzyskania większej elastyczności opracowanego rozwiązania, podniesienia stopnia interoperabilności istniejących rozwiązań oraz umożliwienia łatwiejszej integracji ze środowiskami semantycznego gridu (paradygmat SOKU).
W ramach projektu opracowany został ogólny model systemu przechowywania danych (CMSSM - Common Mass Storage System Model), ze szczególnym uwzględnieniem systemów HSM, oraz system estymacji czasu dostępu do danych przechowywanych w systemach MSS wraz z niezbędnymi opisami semantycznymi. System estymacji czasu dostępu do danych składa się z dwóch głównych typów serwisów: serwisów monitorujących systemy MSS i serwisów estymujących czas dostępu do danych składowanych w takich systemach. Implementacja serwisów monitorujących jest zależna od konkretnego systemu monitorowanego, gdyż różne systemy MSS mają różne interfejsy dostępu do narzędzi i metod diagnostycznych dostarczanych przez producenta. Serwisy estymujące, korzystając z informacji dostarczanej przez serwisy monitorujące (zarówno MSS, jak i sieć), szacują koszt dostępu dla konkretnych danych. Opracowana została ontologia opisująca systemy MSS w oparciu o istniejącą, komercyjnie uznaną, ontologię opisu systemów komputerowych – CIM. Praktyczna realizacja dotyczyła szerokiego spektrum pamięci masowych, a wśród nich następujących systemów HSM: DiskXtender, Castor i FSE. Stworzone zostały odpowiednie API, pozwalające na wykorzystanie odpowiednich serwisów oraz środowisko portalowe, umozliwiające zarządzanie danymi i monitorowanie stanu danych i urządzeń.