Rozwiązanie pozwala na gromadzenie, transformację i opracowanie analityczne zbiorów przekraczających możliwości technologiczne innych baz danych, np. baz relacyjnych (skalowanie a ograniczenia modelu ACID).
Dzięki skalowalności horyzontalnej i implementacji paradygmatu Map-Reduce (mapuj i redukuj), rozwiązanie pozwala na realizację dużych i złożonych zadań obliczeniowych na dużych, zróżnicowanych zbiorach danych w przewidywalnym czasie (zależnym tylko od skali wdrożenia).
W ramach ekosystemu produktów Hadoop dostępne są następujące rozszerzenia pozwalające na realizację różnych zadań przetwarzania danych i informacji:
- Ozzie — pozwala na realizację przepływów zadań analitycznych;
- HCatalog — realizuje zadania kategoryzacji i schematyzacji danych;
- Pig — pozwala na programowanie transformacji i analizy w postaci skryptów;
- Hive — implementuje interfejs dostępu do danych kompatybilny z SQL;
- HBase — pozwala na realizację kolumnowej organizacji danych;
- Mahout — jest programistycznym szkieletem do implementacji zadań zorientowanych na uczenie maszynowe;
- Drill — pozwala na interaktywną analizę danych;
- Sqoop i Flume — narzędzia integracji ze źródłami danych, pozwalające również na wstępną transformację;
- Zookeeper — wykorzystywany w projekcie Hadoop jako narzędzie orkiestracji;
- Ambari — dostarcza interaktywny, graficzny interfejs zarządzania infrastruktury klastra Hadoop.
Usługi wsparcia do Hortonworks Hadoop
Nie tylko dostarczamy rozwiązanie Hortonworks Hadoop, ale wzbogacamy je o nasze usługi wdrożeniowe, konsultingowe, integracyjne, utrzymaniowe oraz szkolenia. Naszą supermocą jest interdyscyplinarny zespół ekspertów.

Korzyści dla Twojej firmy
- Możliwość złożonej transformacji i analizy dużych zbiorów danych (np. baz klientów).
- Możliwość integracji danych o dużej zmienności i różnorodności w homogeniczny zestaw danych, tzw. data lake (przy pomocy transformacji i schematyzacji).
- Możliwość łatwego wykorzystania analiz dużych zbiorów danych w innych rozwiązaniach (np. aplikacjach biznesowych) stosowanych w przedsiębiorstwie dzięki dużym możliwościom integracyjnym.
Cechy rozwiązania
- Skalowalność — architektura rozwiązania pozwala na jego łatwe skalowanie w odpowiedzi na zmieniające się potrzeby dotyczące sposobów przetwarzania danych.
- Niezawodność — rozproszona, klastrowa architektura rozwiązania oraz zastosowane mechanizmy replikacji danych zapewniają wysoką dostępność danych i usług.
- Wszechstronność — rozwiązanie pozwala na gromadzenie i analizę danych pochodzących ze zróżnicowanych technologicznie i merytorycznie źródeł danych.
- Otwartość — rozwiązanie stanowi doskonałą i wszechstronną bazę dla własnych rozwiązań analitycznych; pozwala na programowanie złożonych przepływów, transformacji i analizy danych, a także daje duże możliwości integracji.
Szkolenia
Zdobądź cenione na rynku IT kompetencje i certyfikaty
W naszym nowoczesnym, w pełni wyposażonym centrum szkoleniowo-egzaminacyjnym prowadzimy szkolenia z zakresu wiodących technologii, realizowane przez doświadczony zespół certyfikowanych trenerów.

Baza wiedzy
Zapisz się
do newslettera
Otrzymuj wartościowe treści na swój email. Dowiedz się pierwszy o nowych wydarzeniach ze świata IT.