By Nathan Marz

  • Einführung in Big-Data-Systeme und -Technologien
  • Große Datenmengen speichern und verarbeiten
  • Einsatz zahlreicher instruments wie Hadoop, Apache Cassandra, Apache hurricane uvm.

Daten müssen mittlerweile von den meisten Unternehmen in irgendeiner shape verarbeitet werden. Dabei können sehr schnell so große Datenmengen entstehen, dass herkömmliche Datenbanksysteme nicht mehr ausreichen. Big-Data-Systeme erfordern Architekturen, die in der Lage sind, Datenmengen nahezu beliebigen Umfangs zu speichern und zu verarbeiten. Dies bringt grundlegende Anforderungen mit sich, mit denen viele Entwickler noch nicht vertraut sind.

Die Autoren erläutern die Einrichtung solcher Datenhaltungssysteme anhand eines speziell für große Datenmengen ausgelegten Frameworks: der Lambda-Architektur. Hierbei handelt es sich um einen skalierbaren, leicht verständlichen Ansatz, der auch von kleinen groups implementiert und langfristig betrieben werden kann.

Die Grundlagen von Big-Data-Systemen werden anhand eines realistischen Beispiels praktisch umgesetzt. In diesem Kontext lernen Sie neben einem allgemeinen Framework zur Verarbeitung großer Datenmengen auch Technologien wie Hadoop, typhoon und NoSQL-Datenbanken kennen.

Dieses Buch setzt keinerlei Vorkenntnisse über instruments zur Datenanalyse oder NoSQL voraus, grundlegende Erfahrungen im Umgang mit herkömmlichen Datenbanken sind aber durchaus hilfreich.

Aus dem Inhalt:

  • Big-Data-Systeme und -Technologien
  • Echtzeitverarbeitung sehr großer Datenmengen
  • Lambda-Architektur
  • Batch-Layer: Datenmodell, Datenspeicherung, Skalierbarkeit
  • Stapelverarbeitungsprozesse
  • Modellierung von Stammdatensätzen
  • Implementierung eines Graphenschemas mit Apache Thrift
  • Einsatz von MapReduce
  • JCascalog zur Implementierung von Pipe-Diagrammen
  • Serving-Layer: Konzepte und Einsatz von ElephantDB
  • Speed-Layer: Berechnung und Speicherung von Echtzeit-Views
  • Einsatz von Hadoop, Apache Cassandra, Apache Kafka und Apache Storm
  • Streamverarbeitung mit Trident

Show description

Read Online or Download Big Data - Entwicklung und Programmierung von Systemen für große Datenmengen und Einsatz der Lambda-Architektur (mitp Professional) (German Edition) PDF

Best data mining books

Earth System Modelling - Volume 6: ESM Data Archives in the Times of the Grid (SpringerBriefs in Earth System Sciences)

Accrued articles during this sequence are devoted to the advance and use of software program for earth process modelling and goals at bridging the distance among IT options and weather technological know-how. the actual subject coated during this quantity addresses the Grid software program which has turn into a huge allowing know-how for a number of nationwide weather group Grids that resulted in a brand new size of disbursed info entry and pre- and post-processing services all over the world.

Apache Oozie: The Workflow Scheduler for Hadoop

Get an effective grounding in Apache Oozie, the workflow scheduler procedure for handling Hadoop jobs. With this hands-on advisor, skilled Hadoop practitioners stroll you thru the intricacies of this strong and versatile platform, with a variety of examples and real-world use instances. when you arrange your Oozie server, you’ll dive into concepts for writing and coordinating workflows, and how one can write complicated facts pipelines.

Prominent Feature Extraction for Sentiment Analysis (Socio-Affective Computing)

The target of this monograph is to enhance the functionality of the sentiment research version by way of incorporating the semantic, syntactic and commonsense wisdom. This e-book proposes a singular semantic inspiration extraction method that makes use of dependency family members among phrases to extract the gains from the textual content.

QUERYING AND MINING UNCERTAIN DATA STREAMS: 3 (EAST CHINA NORMAL UNIVERSITY SCIENTIFIC REPORTS)

Info uncertainty commonly exists in lots of purposes, and an doubtful information move is a sequence of doubtful tuples that arrive swiftly. despite the fact that, conventional options for deterministic info streams can't be utilized to accommodate information uncertainty at once end result of the exponential progress of attainable resolution area.

Extra info for Big Data - Entwicklung und Programmierung von Systemen für große Datenmengen und Einsatz der Lambda-Architektur (mitp Professional) (German Edition)

Example text

Download PDF sample

Rated 4.71 of 5 – based on 3 votes