Einstieg in Big Data mit Hadoop
nicht mehr verfügbar
Classroom Schulung | Deutsch | Anspruch
Schulungsdauer: 3 Tage
Ziele
In diesem Kurs erhalten Sie einen Überblick über die Funktionsweise von Apache Hadoop.
Zielgruppe
- IT Architekten
- Applikations-Entwickler und -Verantwortliche
- Datenbank Entwickler und Administratoren
Voraussetzungen
- Linux Grundkenntnisse
- Java Grundkenntnisse
- Scripting Grundkenntnisse
- shell
- python
- perl
- SQL Grundkenntnisse
Agenda
Theorie
- Entstehung Hadoop
- Wie funktioniert MapReduce? Was sind die Vor- und Nachteile?
- Aufbau eines Hadoop Clusters (fertige Distributionen und Eigenbau, Hardware Anforderungen)
- Funktion des HDFS (Hadoop Distributed File System)
Praxis
- Hadoop Streaming (schreiben von Beispiel Jobs mit einfachen Shell Scripten)
- Hive - ein Tool, das SQL ähnliche Anweisungen in skalierbare Hadoop Jobs übersetzt
- Kurzvorstellung von weiteren Tools (z.B. HBase, Pig, ...)- Theorie: Java Entwicklung mit/für Hadoop
- Praxisbeispiele
Ziele
In diesem Kurs erhalten Sie einen Überblick über die Funktionsweise von Apache Hadoop.
Zielgruppe
- IT Architekten
- Applikations-Entwickler und -Verantwortliche
- Datenbank Entwickler und Administratoren
Voraussetzungen
- Linux Grundkenntnisse
- Java Grundkenntnisse
- Scripting Grundkenntnisse
- shell
- python
- perl
- SQL Grundkenntnisse
Agenda
Theorie
- Entstehung Hadoop
- Wie funktioniert MapReduce? Was sind die Vor- und Nachteile?
- Aufbau eines Hadoop Clusters (fertige Distributionen und Eigenbau, Hardware Anforderungen)
- Funktion des HDFS (Hadoop Distributed File System)
Praxis
- Hadoop Streaming (schreiben von Beispiel Jobs mit einfachen Shell Scripten)
- Hive - ein Tool, das SQL ähnliche Anweisungen in skalierbare Hadoop Jobs übersetzt
- Kurzvorstellung von weiteren Tools (z.B. HBase, Pig, ...)- Theorie: Java Entwicklung mit/für Hadoop
- Praxisbeispiele