Data Crunching

Data Crunching

Data Crunching (deutsch: Datenverarbeitung) ist eine Methode in der Informationswissenschaft, die die automatisierte Verarbeitung von großen Daten und Informationen (Big Data) vorbereitet und ermöglicht. Das Data Crunching besteht in der Vorbereitung und Modellierung des Systems oder der Anwendung, die benutzt wird: Die Daten werden aufbereitet, sortiert und strukturiert, um auf ihnen Algorithmen und Programmabläufe durchzuführen. Mit dem Begriff Crunched Data werden entsprechende Daten bezeichnet, die bereits in das System importiert und bearbeitet wurden. Ähnliche Begriffe sind Data Munging und Data Wrangling. Bei beiden letztgenannten Begriffen steht die manuelle und halbautomatische Verarbeitung der Daten im Zentrum, weshalb deutliche Unterschiede zum Data Crunching vorhanden sind.