Aufbau Cloudera-Cluster

Aufbau eines On-Premise Big Data-Clusters auf Basis von Cloudera mit 50 Nodes. Steuerung und Planung aus der Fachabteilung in Kooperation mit der IT bis OS-Level. Parallel dazu Aufbau eines Teams aus Data Scientists, Data Engineers und DevOps. Integration der Legacy CRM-Systeme (Customer Master Data) und Anreicherung um Bewegungsdaten aus dem Bereich Audience Measurement (TV) inklusive der Automatisierung der Verarbeitungsschritte mittels Airflow.