Definujeme big data architektúru, v rámci ktorej urobíme návrh a dizajn s ohľadom na špecifické potreby zákazníka.
Navrhneme dizajn dátového spracovania, overovanie tohto dizajnu a realizáciu analýz v oblasti machine learning. Zároveň zorganizujeme školenie na využívanie týchto nástrojov.
Služba analýzy veľkých dát je postavená na skúmaní dát od zákazníka, ktoré obohatíme o iné zdroje a nájdeme súvislosti a vzťahy medzi javmi a skutkovými hodnotami.
Spracovanie, uloženie a analýza dát vyžaduje primeranú infraštruktúru. Kľúčovou charakteristikou je distribuovaná architektúra a lineárna škálovateľnosť. Dávkovo orientované systémy typu Hadoop alebo NoSQL databázy majú svoje vlastné špecifiká. Tie sú odlišné od spracovania dát v reálnom čase, kde je najrošírenejší Apache Kafka či Apache Flink. S oboma máme bohaté skúsenosti.
Pre získanie hodnoty z dát nepostačuje len mať infraštruktúru, je potrebné dáta aj spracovať. Existujúce zdroje dát a systémy produkujú dáta vo svojich špecifických formátoch. Líšia sa druhom, charakterom či kvalitou. Spravidla nie sú vhodné na uloženie a použitie pre vyťažovanie hodnoty v surovom stave. Preto je našou najčastejšou prácou spracovanie dát. Robíme to radi, pretože vieme ako na to.
Strojové učenie predstavuje oblasť umelej inteligencie, ktorej zameraním je štúdium metód programovania počítačov za účelom získania schopnosti učiť sa. Prostredníctvom štatistiky sa snaží pochopiť okolnosti, ktoré generujú dáta – často za účelom testovania rôznych hypotéz. V týchto dátach sa snaží sa nájsť vzory zrozumiteľné pre človeka.
V praxi je využívané napríklad pri segmentácii zákazníkov pri marketingových kampaniach a tvorbe individualizovaných ponúk, ale aj pri predikcii udalostí s matematicky vyjadriteľnou presnosťou.
Získavanie hodnoty z dát má aktuálne najväčší potenciál na rast spoločností alebo optimalizáciu ich nákladov, či modelov podnikania. Mať správnu informáciu v správny čas je svätý grál podnikania. Inak ako analýzou dát to nejde.
Skúmame napríklad ako silne ovplyvňuje vonkajšia teplota spotrebu energií, či ako vplýva na predaj. Aké sú segmenty zákazníkov a ktoré produkty majú najväčšiu šancu uspieť v kampani. Priemyselných zákazníkov zase zaujímajú informácie o efektivite výroby, identifikácia faktorov vplývajúcich na kvalitu či predikcie porúch.
Prediktívne analýzu sú nástrojom vysoko sofistikovaných analytických metód určených pre vyhľadávanie súvislostí medzi rôznymi typmi dát, niekedy zdanlivo nesúvisiacich. Jedná sa o stále sa rozvíjajúcu oblasť analýzy dát a rozrastajú sa aj algoritmy. V zásade sú orientované na hľadanie charakteristík a vyhľadávanie modelov správania. Mnohé algoritmy odhalia korelácie medzi dátami, na základe ktorých je možné zisťovať príčiny.
Nasadenie majú napríklad v oblasti predaja, kedy je možné na základe prehliadania webových stránok predpovídať určitý typ správania, preferencie a rizikovosť.