Big Data – ein Überblick

Big Data – ein Überblick

Egal ob eine E-Mail abgerufen, ein Begriff in eine Internetsuchmaschine eingegeben, ein Online-Shop besucht, ein Telefonat geführt oder bei einem Einkauf die Kundenkarte eingesetzt wird: Ständig werden Daten produziert. Diese Daten können ausgewertet, zugeordnet und gespeichert werden.

So ist es möglich, die Gegenwart zu erfassen und gleichzeitig Prognosen für die Zukunft zu treffen. Das Schlüsselwort in diesem Zusammenhang heißt Big Data.

Aber was bedeutet Big Data genau? Hier dazu ein Überblick:

Inhalt

1 Big Data ist die Datenbank der Daten.

Big Data ist die Datenbank der Daten.

Die fortschreitende Digitalisierung hat natürlich ihre Vorteile. So würden heute sicher die wenigsten darauf verzichten wollen, im Internet zu surfen, unterwegs zu telefonieren oder sich vom Navigationsgerät zuverlässig an ihren Zielort führen zu lassen. Auch die Möglichkeit, verschiedenste Geräte im Haus mittels Smartphone, Fernbedienung oder zentralem Monitor zu steuern, ist bequem und praktisch.

Die Kehrseite der Digitalisierung ist aber, dass ständig Unmengen von Daten produziert werden. Das Zusammenführen und Auswerten von enormen Datenmengen aus unterschiedlichsten Quellen wird als Big Data bezeichnet. Dabei lässt sich die Idee hinter Big Data mit einem riesengroßen Datenmeer vergleichen: Jede Handlung führt dazu, dass Daten entstehen. Diese Datenspuren sind zunächst kleine, einzelne Tropfen, die zusammenfließen und so das riesige Datenmeer ergeben.

Internetkonzerne analysieren schon jetzt die Daten von Nutzern und erstellen daraus Nutzerprofile. Dafür werden die Daten mittels Algorithmen ausgewertet, gefiltert und nach bestimmten Faktoren sortiert. Durch die anschließende Vermarktung der Profile wird es möglich, gezielte Kaufempfehlungen anzuzeigen oder personalisierte Werbung zu schalten. Genauso können die Informationen verwertet werden, um neue Angebote und Dienstleistungen zu entwickeln.

Dabei sind die Datenmengen tatsächlich riesig. Experten schätzen, dass aktuell innerhalb von zehn Minuten ein fünf Milliarden Gigabyte großer Datenberg produziert wird. Weltweit verdoppelt sich das Datenvolumen alle zwei Jahre. In naher Zukunft werden aber vermutlich noch schneller noch mehr Daten produziert werden. Der Grund hierfür ist der nächste Schritt der Digitalisierung, das sogenannte Internet der Dinge.

Als Internet der Dinge wird die Vernetzung von verschiedensten Alltagsgegenständen bezeichnet, angefangen bei der Kaffeemaschine und dem Kühlschrank über die Steuerung der Jalousien und der Beleuchtung bis hin zur intelligenten Brille. Schätzungen gehen davon aus, dass bis zum Jahr 2020 50 Milliarden Geräte und Gegenstände am Internet der Dinge teilnehmen werden.

Viele von ihnen werden Daten erfassen, die Rückschlüsse auf die persönlichen Nutzungsgewohnheiten zulassen. Hinzu kommen Geräte mit GPS, die Standortdaten liefern und so Bewegungsprofile ermöglichen. Kombiniert mit den sogenannten Location-based-Services, liegen alle Informationen vor, die für Verhaltens- und Konsumprofile benötigt werden. Die Idee, dass in fast alle Lebensbereiche smarte Lösungen, also Geräte und Gegenstände, die mit Informationstechnik ausgestattet, multifunktional und kommunikationsfähig sind, einziehen, klingt nach Zukunftsmusik. In der Tat ist diese Entwicklung noch jung und noch wird viel experimentiert.

Besucher lesen auch gerade folgenden Beitrag: Infos zum eCall-System im Auto

Weit weg ist sie trotzdem nicht. Schon jetzt verfügt jeder durchschnittlich über zwei internetfähige Geräte, so zum Beispiel über einen Computer und ein Smartphone, einen Tablet-PC, eine Spielekonsole oder einen smarten Fernseher.

Das Erheben und Speichern der Daten ist nicht das eigentliche Problem.

Es war noch nie so einfach, Daten über Interessen, Vorlieben, Hobbys, Aufenthaltsorte oder Verhaltensmuster eines Nutzers zu sammeln wie heute. Das Sammeln, Auswerten und Zusammenführen dieser Daten hat auch durchaus gute Seiten. So können die Daten unter anderem dabei helfen, Prozesse nachzuvollziehen, Gefahren zu erkennen, Abläufe zu optimieren, neue Produkte zu entwickeln oder Frühwarnsysteme zu erstellen.

Aber:

Je mehr Daten erfasst werden, umso eher können diese Informationen missbräuchlich genutzt werden. Dies gilt vor allem dann, wenn der Nutzer nicht weiß, welche seiner Daten überhaupt erfasst, ausgewertet und gespeichert werden. Dadurch kann er die Informationen weder kontrollieren noch sonst irgendwie Einfluss auf die Profile nehmen, die über ihn erstellt werden.

Genau hier liegt einer der großen Knackpunkte von Big Data. So sind die technischen Möglichkeiten mittlerweile soweit fortgeschritten, dass die enormen Datenmengen verknüpft, ausgewertet und sichtbar gemacht werden können. Auch Zusammenhänge, die eher im Hintergrund ablaufen, können aufgezeigt werden. Dabei dauert es gerade einmal eine halbe Stunde, um ein Petabyte Daten zu sortieren.

Die Datenmenge von einem Petabyte entspricht Videofilmen in HD-Qualität mit einer Laufzeit von 13 Jahren. Um diese Datenmenge in der kurzen Zeit zu bewältigen, werden die Daten auf ein System aus 8.000 Servern aufgeteilt. Die Daten werden sortiert, zu Profilen wie Kommunikations-, Konsum-, Verhaltens- oder Bewegungsprofilen zusammengefasst und mit weiteren Daten ergänzt. Dadurch können nicht nur aktuelle Verhaltensmuster abgelesen, sondern auch Vorhersagen für die Zukunft abgeleitet werden.

So ist es beispielsweise möglich, zu prognostizieren, wann sich ein Nutzer wo aufhalten und was er dort tun wird. Das Problem an der Sache ist, dass dafür noch nicht einmal personenbezogene Daten notwendig sind. Selbst wenn nur anonymisierte Informationen vorliegen, können die Daten aus verschiedenen Quellen so zusammengeführt und abgeglichen werden, dass die Zuordnung zu einer konkreten Person problemlos möglich wird.

Hierfür genügen schon wenige Angaben wie etwa das Geschlecht, das Alter, die Postleitzahl, eine Suchanfrage zu einem Arzt oder die Auswertung eines Einkaufs.

Mehr Berichte, Anleitungen und Tipps:

Thema: Big Data – ein Überblick

Übersicht:
Fachartikel
Verzeichnis
Über uns

it datenbanken99

Besucher lesen auch gerade folgenden Beitrag: Data Warehouse - Was ist das?

Über
Letzte Artikel

FB/Twitter

Autoren Profil:

Inhaber bei Artdefects Media Verlag

Gerd Tauber - Programmierer, Samuel Wilders IT- Experte und Markus Berthold Inhaber einer Medienagentur, Ferya Gülcan Inhaberin Onlinemedien-Agentur, Christian Gülcan Inhaber Artdefects Media Verlag, schreiben hier Wissenswertes zum Thema IT, Internet, Hardware, Programmierung, Social-Media, Software und IT-Jobs.

FB/Twitter

Letzte Artikel von Autoren Profil: (Alle anzeigen)

Die 5 größten Gefahren für externe Festplatten - 6. April 2024
Eine E-Mail an mehrere Empfänger verschicken – so geht’s richtig - 15. März 2024
Grundlegendes Wissen zu verteilten Datenstrukturen, 2. Teil - 7. März 2024

Mehr Themen:

Data Warehouse – Was ist das? Data Warehouse – Was ist das? Dass verschiedene Daten und Informationen in Datenbanken erfasst und verwaltet werden, ist in vielen Bereichen üblich. So legen sich beispielsweise Privatnutzer Datenbanken an, um ihre Kontakte übersichtlich zu speichern oder um Dokumente aufzulisten. Auch Sammlungen werden gerne in Datenbanken katalogisiert. Anzeige Über Letzte Artikel...
Das neue EU-Datengesetz im Überblick Das neue EU-Datengesetz im Überblick Daten werden oft als das Gold des 21. Jahrhunderts bezeichnet. Tatsächlich ist die Abhängigkeit von der Nutzung und Verarbeitung personenbezogener Daten gewaltig. Angefangen bei der IT-Sicherheitssoftware über Lieferketten bis hin zu Kunden- und Personaldaten sind Unternehmen in ihrer Existenz von Daten abhängig. Aber auch Ämter,...
Ein Überblick zu Malware, Teil III Ein Überblick zu Malware, Teil III Schadsoftware oder englisch Malware steht als Oberbegriff für alle Programme, die bezwecken, Schaden anzurichten. Dieser Schaden kann zum Beispiel darin bestehen, auf ein fremdes System zuzugreifen, Viren einzuschleusen, Daten zu stehlen oder gleich ein ganzes IT-System lahm zu legen. In einer mehrteiligen Übersicht vermitteln...
Ein Überblick zu Malware, Teil I Ein Überblick zu Malware, Teil I Computer sind aus der heutigen Zeit nicht mehr wegzudenken und kaum jemand möchte das Internet noch missen. Doch in der virtuellen Welt lauern auch Gefahren. Dazu gehören Computerprogramme, die eigens dafür entwickelt wurden, fremde Systeme auszuspionieren, fremde Daten auszuspähen oder gleich die ganze IT...
Ein Überblick zu Malware, Teil II Ein Überblick zu Malware, Teil II Alle Arten von Computerprogrammen, die zu dem Zweck entwickelt wurden, Daten auszuspionieren, fremde IT-Systeme zu infizieren oder Unbefugten Zugriff auf die Systeme zu ermöglichen, werden unter dem Oberbegriff Schadprogramme oder Schadsoftware zusammengefasst. Die englische Bezeichnung dafür lautet Malware. In einer mehrteiligen Übersicht stellen wir...
Überwachung und Datenschutz am Arbeitsplatz – ein Überblick Überwachung und Datenschutz am Arbeitsplatz – ein Überblick In vielen Unternehmen ist es üblich, Telefonate der Mitarbeiter zu Schulungszwecken aufzuzeichnen. Doch was ist, wenn der Arbeitgeber private Gespräche abhört oder die Mitarbeiter bei der Arbeit überwacht? Ist das zulässig? Wir geben einen Überblick zu Überwachung und Datenschutz am Arbeitsplatz!: Über...

Big Data – ein Überblick

Big Data ist die Datenbank der Daten.

Das Erheben und Speichern der Daten ist nicht das eigentliche Problem.

Ähnliche Beiträge

Veröffentlicht von

Autoren Profil:

Kommentar verfassenAntwort abbrechen