Strumieniowanie danych w Sparku

Obecnie na popularności zyskują rozproszone systemy do przetwarzania danych. Na tym polu sprawdzonym rozwiązaniem jest MapReduce w Hadoop. Ze względu na badawczy charakter większości projektów wykorzystywane są najnowsze rozwiązania. Podczas prezentacji zademonstrowane zostanie rozwiązanie bazujące na zyskującym uznanie Apache Sparku. Wykorzystana architektura przetwarza dane w czasie rzeczywistym korzystając ze strumieniowania a następnie umieszcza jest w bazie danych. Dopasowanie wszystkiego w całość powoduje, że niewielkim kosztem można przetwarzać i analizować dane w czasie rzeczywistym.