Repozytorium UB (Universal Backend)

Uniwersalne repozytorium (UB) służy do składowania danych zebranych ze wszystkich źródeł. Głównym zadaniem repozytorium jest przekazanie dokumentów do indeksowania.

Funkcjonalności UB

  • przechowywanie dużych ilości danych (rzędu wielu GB)
  • szybki dostęp do danych
  • mechanizm wstawiania danych
  • współpraca z silnikiem wyszukiwawczym USE
  • wywołanie procesu indeksowania danych
  • automatyczny wybór optymalnego poziomu indeksowania
  • kontrola wersji indeksu
  • zaawansowane planowanie indeksowania
  • promocja treści – możliwość promocji dokumentów w wynikach wyszukiwarki
  • transformacja danych
  • czytanie tekstu z różnych typów dokumentów (doc, xls, ppt, pdf, html itd.)
  • automatyczna modyfikacja danych oparta na: wyrażeniach regularnych, przetwarzaniu kodu HTML, usuwaniu lub modyfikacji zaznaczonych fragmentów danych, obliczaniu nowych elementów danych o automatyczna lub ręczna transformacja danych
  • dostęp z poziomu linii komend (wprowadzanie, modyfikacja i podgląd danych)
  • format danych wejściowych i wyjściowych konfigurowany w XML-u
  • rozpoznanie języka i stemmer
  • wsparcie usługi Misspelling
  • automatyczne wydobycie słów kluczowych z dokumentów (Keyword Extractor)