{"id":10493,"date":"2022-03-04T15:32:39","date_gmt":"2022-03-04T15:32:39","guid":{"rendered":"https:\/\/lightgoldenrodyellow-horse-236112.hostingersite.com\/resources\/was-ist-data-science\/"},"modified":"2026-01-21T16:06:03","modified_gmt":"2026-01-21T16:06:03","slug":"was-ist-data-science","status":"publish","type":"post","link":"https:\/\/cloudity.com\/de\/was-ist-data-science\/","title":{"rendered":"Was ist Data Science?"},"content":{"rendered":"\n<p>Jedes Unternehmen sammelt Daten \u00fcber sein Gesch\u00e4ft, aber nicht jedes Unternehmen nutzt sie. Untersuchungen zeigen, dass Unternehmen, die ihre Daten analysieren und auf dieser Grundlage Entscheidungen treffen, um 6 % schneller wachsen, als es ohne diese Analyse zu erwarten w\u00e4re.<\/p>\n\n\n\n<p>Aus den von den meisten Unternehmen gesammelten Daten lassen sich leicht Informationen dar\u00fcber ablesen, wie jede einzelne Kennzahl eingestuft wird. Dies ist ein wertvolles Wissen, aber es bietet keine direkte Unterst\u00fctzung f\u00fcr die Entscheidungsfindung des Managements.<\/p>\n\n\n\n<p>Die Produktverk\u00e4ufe eines Unternehmens sind im laufenden Quartal um 20 % gestiegen, aber wissen wir, warum das so ist? Ohne Data Science k\u00f6nnen wir nur Annahmen treffen, die auf Expertenwissen beruhen, aber ein echter Wettbewerbsvorteil entsteht, wenn man Gewissheit auf der Grundlage konkreter Daten hat. Und das ist die eigentliche Aufgabe der Datenwissenschaft.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">Definition von Data Science in einfachen Worten<\/h2>\n\n\n\n<p>Data Science ist ein Begriff, der alle wissenschaftlichen Methoden im Rahmen der Datenanalyse umfasst, dank derer aus einer scheinbar nutzlosen Datenbank wertvolle Erkenntnisse gewonnen werden k\u00f6nnen. Ein Datenwissenschaftler oder Data Scientist verwendet f\u00fcr diese Zwecke spezielle Data-Mining-Algorithmen, maschinelle Lernmodelle (eng. machine learning) und k\u00fcnstliche Intelligenz (KI). Diese Algorithmen sind so konzipiert, dass sie den Datensatz bereinigen und angemessen strukturieren, dann die Muster und Beziehungen zwischen den Daten untersuchen und Schlussfolgerungen ziehen.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\">Warum nutzen Unternehmen Data Science?<\/h3>\n\n\n\n<p>Der Zweck, f\u00fcr den Data Science eingesetzt wird, kann die Suche nach neuen Gewinnquellen sein. Ein gutes Beispiel ist die Identifizierung der am h\u00e4ufigsten zusammen gekauften Produkte durch eine Warenkorbanalyse und die anschlie\u00dfende Platzierung dieser Waren in einem Regal nebeneinander. Dadurch wird die Wahrscheinlichkeit erh\u00f6ht, dass beide Produkte gekauft werden. Andere datenwissenschaftliche Analysen k\u00f6nnen zur Vermeidung potenzieller Verluste eingesetzt werden.<\/p>\n\n\n\n<p>Ein Beispiel w\u00e4re ein maschinelles Lernmodell, das nach Mustern von abwandernden Kunden sucht und automatisch die richtige Marketingkommunikation an diese Kunden sendet. Es k\u00f6nnte sich auch um Algorithmen handeln, die die Arbeit und die Zeit der Mitarbeiter im Unternehmen optimieren. So k\u00f6nnen sie beispielsweise die zu erledigenden Aufgaben nach einer Priorit\u00e4t einteilen, die sich nach dem Wert des Kunden und der Dringlichkeit der Aufgabe richtet. Ein guter Data Scientist, der in Ihrem Unternehmen besch\u00e4ftigt ist, die Entscheidungsfindung im Unternehmen definitiv unterst\u00fctzen wird.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">Warum ist ein Data Scientist eine wichtige Position im Unternehmen?<\/h2>\n\n\n\n<p>Leider erfordert die Datenanalyse ein hohes Ma\u00df an Vertrautheit mit dem Thema, und ohne das richtige Fachwissen ist es schwierig, ein gutes Modell oder einen guten Algorithmus zu erstellen. Deshalb stellen die meisten Unternehmen Spezialisten ein, die sich mit dem Thema Datenerfassung, -verarbeitung und -analyse besch\u00e4ftigen. Solche Spezialisten werden einfach als Data Scientists bezeichnet. Es ist jedoch zu bedenken, dass bei gro\u00dfen Analyseprojekten und der damit verbundenen Datenvisualisierung ein Spezialist nicht ausreicht, weshalb gr\u00f6\u00dfere Unternehmen oft eine dedizierte Abteilung haben.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\">Was macht ein Data Scientist?<\/h3>\n\n\n\n<p>Die grundlegenden T\u00e4tigkeiten in der Data-Science-Abteilung sind die Pflege und Entwicklung der Datenarchitektur sowie der gesamte Bereich der Analytik und des Reportings. In kleinen und mittleren Unternehmen, die sich einen Wettbewerbsvorteil im Bereich Data Science verschaffen wollen, werden Projekte zur Implementierung einer analytischen Infrastruktur h\u00e4ufig von externen, auf diesen Bereich spezialisierten Unternehmen durchgef\u00fchrt. Eine der Voraussetzungen f\u00fcr ein solches Projekt ist der Transfer von Expertenwissen, das f\u00fcr die Pflege der implementierten Umgebung erforderlich ist und das im Unternehmen von einem einzelnen Data Scientist oder einer kleinen Data-Science-Abteilung \u00fcbernommen werden kann.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">Data Engineering als Grundlage f\u00fcr Data Science<\/h2>\n\n\n\n<p>Um die Prozesse und Analysen im Bereich Data Science in Ihrem Unternehmen umzusetzen, ben\u00f6tigen Sie die richtige Datenarchitektur. Werkzeuge und Modelle ben\u00f6tigen Daten, die in geeigneter Weise erhoben und aufbereitet wurden, um darauf aufbauend Schlussfolgerungen ziehen zu k\u00f6nnen. Der gesamte Prozess, der der Data Science zugrunde liegt, hei\u00dft Data Engineering, und die Person, die in einem Unternehmen f\u00fcr diesen Bereich zust\u00e4ndig ist, wird als Data Engineer bezeichnet.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\">Was macht ein Data Engineer?<\/h3>\n\n\n\n<p>In den meisten Unternehmen sollte die Datenanalyse Daten aus mehr als einer Quelle umfassen, z. B. die Kombination von Transaktionsdaten mit Marketingdaten, um zu untersuchen, wie sich einzelne Kampagnen auf den Umsatz auswirken. Das Problem ist, dass diese Daten in verschiedenen Datenbanken und Quellen gespeichert sind, auf unterschiedliche Weise aggregiert werden und oft nicht leicht zu kombinieren sind. In der Praxis gibt es in einem Unternehmen in der Regel mehr als zwei Datenquellen, dazu zahlreiche W\u00f6rterbuch-Tabellen, komplexe Verkn\u00fcpfungsbedingungen, und die Daten selbst sind oft verunreinigt.<\/p>\n\n\n\n<p>Data Engineering sollte bereits in einem sehr fr\u00fchen Stadium in den Prozess einflie\u00dfen, oft schon bei der Entwicklung von Transaktionsdatenbanken und anderen Systemen zur Informationserfassung. Dadurch wird sichergestellt, dass die Daten von Anfang an so konsistent, sauber und analysierbar wie m\u00f6glich sind.<\/p>\n\n\n\n<figure class=\"wp-block-image size-full\"><img alt=\"\" fetchpriority=\"high\" decoding=\"async\" width=\"1024\" height=\"1024\" src=\"http:\/\/cloudity.com\/wp-content\/uploads\/2022\/03\/image.png\" alt=\"\" class=\"wp-image-12954\" srcset=\"https:\/\/cloudity.com\/wp-content\/uploads\/2022\/03\/image.png 1024w, https:\/\/cloudity.com\/wp-content\/uploads\/2022\/03\/image-300x300.png 300w, https:\/\/cloudity.com\/wp-content\/uploads\/2022\/03\/image-150x150.png 150w, https:\/\/cloudity.com\/wp-content\/uploads\/2022\/03\/image-768x768.png 768w\" sizes=\"(max-width: 1024px) 100vw, 1024px\" \/><\/figure>\n\n\n\n<h3 class=\"wp-block-heading\">Ein paar Worte \u00fcber Data Warehouse<\/h3>\n\n\n\n<p>Tools und Methoden f\u00fcr das Data Engineering sind darauf ausgelegt, Daten aus Quellen zu extrahieren, sie ordnungsgem\u00e4\u00df umzuwandeln und zu bereinigen und sie schlie\u00dflich an einem Ort zu laden, an dem sie Datenanalyseprozessen unterzogen werden k\u00f6nnen. Solche Orte sind meist Data Warehouses, da die dort gespeicherten Datenbanken sehr lange aufbewahrt werden und das Warehouse neben analytischen Zwecken auch als Archiv dienen kann.<\/p>\n\n\n\n<p>Ein gutes Data Warehouse sollte sich daher vor allem durch Skalierbarkeit, Langlebigkeit, Sicherheit und Schnelligkeit der Abfrageverarbeitung auszeichnen (letzteres ist im Bereich Data Science besonders wichtig).<\/p>\n\n\n\n<figure class=\"wp-block-image size-full\"><img alt=\"\" decoding=\"async\" width=\"1024\" height=\"1024\" src=\"http:\/\/cloudity.com\/wp-content\/uploads\/2022\/03\/image-1.png\" alt=\"\" class=\"wp-image-12955\" srcset=\"https:\/\/cloudity.com\/wp-content\/uploads\/2022\/03\/image-1.png 1024w, https:\/\/cloudity.com\/wp-content\/uploads\/2022\/03\/image-1-300x300.png 300w, https:\/\/cloudity.com\/wp-content\/uploads\/2022\/03\/image-1-150x150.png 150w, https:\/\/cloudity.com\/wp-content\/uploads\/2022\/03\/image-1-768x768.png 768w\" sizes=\"(max-width: 1024px) 100vw, 1024px\" \/><\/figure>\n\n\n\n<h3 class=\"wp-block-heading\">ETL als integraler Bestandteil der Data Science<\/h3>\n\n\n\n<p>Die Prozesse und Werkzeuge, die zum Extrahieren, Transformieren und Laden von Daten in das Warehouse verwendet werden, werden als ETL (Extract, Transform, Load) bezeichnet. Unter Datentransformation versteht man vor allem Prozesse wie den Umgang mit Datenl\u00fccken, Verteilungen einzelner Variablen und die Aggregation der Menge auf die gew\u00fcnschte Ebene (z. B. ben\u00f6tigen wir nicht unbedingt Daten zu jedem Ereignis, und eine Aggregation von Ereignissen in jeder Stunde ist ausreichend). Die Aggregation erleichtert die Speicherung sehr gro\u00dfer Datenmengen und ist oft sogar erforderlich, um mit der Datenanalyse und anderen Data-Science-Prozessen zu beginnen.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">Explorative Analyse &#8211; Entdeckung von Mustern in Daten<\/h2>\n\n\n\n<p>Einer der Hauptbereiche der Data Science ist die explorative Analyse, die in erster Linie darauf abzielt, Muster und Beziehungen in Daten zu entdecken. Sie ist von gro\u00dfem praktischen Nutzen, da die entdeckten Beziehungen zum Vorteil des Unternehmens genutzt werden k\u00f6nnen. Ein Bereich der explorativen Analyse, mit dem sich ein Datenanalyst befasst, ist die Regressionsanalyse und die Untersuchung von Korrelationen zu Schl\u00fcsselvariablen.<\/p>\n\n\n\n<p>Beispiele hierf\u00fcr sind die Entdeckung von Investitionen, die einen starken positiven Einfluss auf Variablen &#8211; wie das Verkaufsvolumen oder die Anzahl der gekauften Produkte &#8211; oder einen negativen Einfluss auf die Produktionskosten haben. Mit diesen Informationen muss das Management nicht mehr raten, welche Investitionen am rentabelsten sind und welche nur scheinbar erfolgreich waren.<\/p>\n\n\n\n<figure class=\"wp-block-image size-full\"><img alt=\"\" decoding=\"async\" width=\"1024\" height=\"1024\" src=\"http:\/\/cloudity.com\/wp-content\/uploads\/2022\/03\/image-2.png\" alt=\"\" class=\"wp-image-12957\" srcset=\"https:\/\/cloudity.com\/wp-content\/uploads\/2022\/03\/image-2.png 1024w, https:\/\/cloudity.com\/wp-content\/uploads\/2022\/03\/image-2-300x300.png 300w, https:\/\/cloudity.com\/wp-content\/uploads\/2022\/03\/image-2-150x150.png 150w, https:\/\/cloudity.com\/wp-content\/uploads\/2022\/03\/image-2-768x768.png 768w\" sizes=\"(max-width: 1024px) 100vw, 1024px\" \/><\/figure>\n\n\n\n<h3 class=\"wp-block-heading\">Der Datenanalyst muss sich auch mit der Datensegmentierung befassen<\/h3>\n\n\n\n<p>Eine weitere Aufgabe eines Datenanalysten bei der Durchf\u00fchrung einer explorativen Analyse ist das Clustering und die Segmentierung. Es geht darum, mithilfe geeigneter Algorithmen \u00e4hnliche Beobachtungen zu finden und sie in m\u00f6glichst homogene Segmente zu unterteilen. Sie sollten differenziert werden. Eine ad\u00e4quate Interpretation der Unterscheidungsmerkmale der Segmente kann erhebliche Verbesserungen im Datenmanagement bringen.<\/p>\n\n\n\n<p>So kann die Kundensegmentierung beispielsweise zur Anpassung der Marketingkommunikation genutzt werden. Dies ist ein sehr w\u00fcnschenswertes Verfahren, da unterschiedliche Werbematerialien an Stammkunden und andere an Kunden, die kurz vor dem Wechsel zur Konkurrenz stehen, gehen sollten. Nat\u00fcrlich kann es sehr viele Segmente geben, und innerhalb jedes Segments k\u00f6nnen weitere Mikrosegmentierungen vorgenommen und separate Modelle erstellt werden.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\">Warenkorbanalyse und sequentielle Analyse sind weitere Konzepte im Bereich Data Science<\/h3>\n\n\n\n<p>Der Bereich der explorativen Analyse umfasst auch die Warenkorbanalyse und die sequentielle Analyse, d. h. die Untersuchung von Produkten, die h\u00e4ufig in einem Warenkorb oder nacheinander gekauft werden, sowie die Klassifizierung von Beobachtungen auf der Grundlage ihrer Merkmale (z. B. ein Entscheidungsbaummodell zur Klassifizierung von Lieferanten in Bezug auf die Rentabilit\u00e4t) und die Sentimentanalyse, d. h. die Erfassung des Zufriedenheitsgrads mit dem gesammelten Feedback mithilfe von Algorithmen der k\u00fcnstlichen Intelligenz.<\/p>\n\n\n\n<p>Die oben genannten Analysen sowie viele andere im Bereich der explorativen Analyse werden in der Regel mit Algorithmen oder Modellen des maschinellen Lernens durchgef\u00fchrt. Sie werden von Firmen eingesetzt, um Wettbewerbsvorteile zu erzielen und wertvolle Erkenntnisse aus den gesammelten Daten zu gewinnen.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">Was ist pr\u00e4diktive Analytik?<\/h2>\n\n\n\n<p>Der zweite gro\u00dfe Bereich der Data Science ist die pr\u00e4diktive Analytik (eng. predictive analytics). Dabei geht es um die Entwicklung von Modellen des maschinellen Lernens, die auf der Grundlage eines Datensatzes in der Lage sind, den Wert einer Zielvariablen f\u00fcr jede Beobachtung unter bestimmten Annahmen vorherzusagen.<\/p>\n\n\n\n<p>Mit anderen Worten: Diese Datenanalysetechnik erm\u00f6glicht es, zuk\u00fcnftige Werte vorherzusagen, die aus bekannten Gr\u00fcnden noch nicht in der Datenbankstruktur enthalten sind. Nat\u00fcrlich hat ein solches Modell nie eine 100%ige Genauigkeit, aber wenn die Ergebnisse nach der Messung zufriedenstellend sind, bedeutet dies, dass das Modell gut und n\u00fctzlich ist.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\">Wann setzen wir pr\u00e4diktive Analysen ein?<\/h3>\n\n\n\n<p>Predictive Analytics kann in erster Linie dazu verwendet werden, den Entscheidungsprozess zu automatisieren. Ein gutes Beispiel ist die Kreditw\u00fcrdigkeitspr\u00fcfung, d. h. die Vorhersage, ob ein Kunde mit bestimmten Merkmalen einen Kredit zur\u00fcckzahlen wird (d. h. de facto eine Entscheidung, ob ihm ein Kredit gew\u00e4hrt wird), oder ob der Kunde bald einen Kauf t\u00e4tigen oder unsere Dienstleistungen nicht mehr in Anspruch nehmen wird.<\/p>\n\n\n\n<p>Die Vorhersage kann auch kontinuierliche Variablen betreffen, wie den Kundenwert (CLTV) und die Preisgestaltung f\u00fcr Produkte oder Dienstleistungen. Ziel der Analyse ist es immer, auf der Grundlage der Vorhersage eine Entscheidung zu treffen, um sich an die Situation anzupassen (z. B. die richtige Marketingkommunikation zu versenden oder abwanderungsgef\u00e4hrdeten Kunden einen Rabatt zu gew\u00e4hren).<\/p>\n\n\n\n<figure class=\"wp-block-image size-full\"><img alt=\"\" loading=\"lazy\" decoding=\"async\" width=\"1024\" height=\"1024\" src=\"http:\/\/cloudity.com\/wp-content\/uploads\/2022\/03\/image-3.png\" alt=\"\" class=\"wp-image-12958\" srcset=\"https:\/\/cloudity.com\/wp-content\/uploads\/2022\/03\/image-3.png 1024w, https:\/\/cloudity.com\/wp-content\/uploads\/2022\/03\/image-3-300x300.png 300w, https:\/\/cloudity.com\/wp-content\/uploads\/2022\/03\/image-3-150x150.png 150w, https:\/\/cloudity.com\/wp-content\/uploads\/2022\/03\/image-3-768x768.png 768w\" sizes=\"(max-width: 1024px) 100vw, 1024px\" \/><\/figure>\n\n\n\n<h3 class=\"wp-block-heading\">Pr\u00e4diktive Analytik und maschinelles Lernen<\/h3>\n\n\n\n<p>Die pr\u00e4diktive Analytik basiert in der Regel auf maschinellem Lernen. Das bedeutet, dass ein Algorithmus eine Entscheidung \u00fcber einen vorhergesagten Wert auf der Grundlage fr\u00fcherer Lernprozesse trifft. Das Modell erh\u00e4lt einen Trainingsdatensatz, der relevante Informationen zusammen mit dem Ergebnis der Zielvariablen enth\u00e4lt.<\/p>\n\n\n\n<p>Nachdem sich der Algorithmus damit vertraut gemacht hat, f\u00fcr welche Konfigurationen der anderen Variablen ein bestimmter Wert einer bestimmten Variablen genommen wird, kann er feststellen, welche Variablen einen signifikanten Einfluss auf diese Variable haben und in welchem Ausma\u00df. Wenn also ein Datensatz ohne einen bestimmten Wert der Zielvariablen vorliegt, kann es diesen auf der Grundlage der anderen Beobachtungen, die ihm w\u00e4hrend des Lernprozesses zur Verf\u00fcgung gestellt wurden, sozusagen &#8222;vorhersagen&#8220;.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\">Verst\u00e4ndnis der pr\u00e4diktiven Analytik und Data Science in der Praxis<\/h3>\n\n\n\n<p>Dies ist vergleichbar mit einem Angestellten, der nach Pr\u00fcfung tausender fr\u00fcherer Kreditantr\u00e4ge beurteilen kann, ob dieser Kredit bei einem neuen Antrag gew\u00e4hrt werden kann. Der Unterschied besteht darin, dass das Modell in relativ kurzer Zeit aus Hunderten von Millionen von Beobachtungen lernen kann, wenn die Datenarchitektur entsprechend angepasst ist.<\/p>\n\n\n\n<p>Die Algorithmen des maschinellen Lernens selbst sind vielf\u00e4ltig, und jeder lernt auf eine andere Art und Weise. Es ist schwer, ein einheitliches Modell zu finden, das sich in jedem Fall als das beste herausstellen w\u00fcrde. Deshalb besteht die Aufgabe von Data Scientists darin, die richtigen Algorithmen zu implementieren und ihre Parameter entsprechend zu w\u00e4hlen, dann die Ergebnisse zu vergleichen und den besten Algorithmus f\u00fcr einen bestimmten Fall auszuw\u00e4hlen.<\/p>\n\n\n\n<p>Es gibt auf dem Markt Auto-ML-Tools (ML -Machine Learning) zur Automatisierung dieser Prozesse, die in der Lage sind, mit Hilfe k\u00fcnstlicher Intelligenz Parameter von Modellen auszuw\u00e4hlen, aber eine individuelle Herangehensweise an das Thema und die Anpassung des Modells an die Besonderheiten der Firma f\u00fchrt immer zu besseren Ergebnissen, weshalb ein mit dem Thema vertrauter Data Scientist so wichtig f\u00fcr den gesamten Prozess ist.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">Automatisierung der Arbeit im Bereich Data Science &#8211; Implementierung von Modellen<\/h2>\n\n\n\n<p>Die Erstellung eines guten Modells erfordert eine Menge Arbeit, die darin besteht, den Datensatz richtig vorzubereiten, zu pr\u00fcfen, ob alle Annahmen erf\u00fcllt sind, mehrere Modelle zu erstellen, sie dann zu vergleichen und das beste auszuw\u00e4hlen.<\/p>\n\n\n\n<p>Diese Arbeit muss jedoch nicht jedes Mal gemacht werden, wenn wir ein Modell auf neue Daten anwenden wollen, solange diese sich nicht wesentlich von den Daten unterscheiden, auf denen der Algorithmus trainiert wurde. Daher werden die meisten korrekt erstellten und gut funktionierenden Modelle &#8220; in der Produktion &#8220; implementiert, d.h. sie werden so programmiert, dass sie von Zeit zu Zeit automatisch auf neu im Lager erscheinende Daten angewendet werden.<\/p>\n\n\n\n<p>Ein richtig kodierter Algorithmus ist sogar in der Lage, das Modell von Zeit zu Zeit automatisch neu zu berechnen, d. h. mehrere Versionen zu erstellen und die beste auszuw\u00e4hlen. Dies kann n\u00fctzlich sein, da sich in den meisten Firmen das Umfeld und damit auch die Daten \u00e4ndern. Ein Modell, das auf Daten trainiert wurde, die unter bestimmten Umst\u00e4nden generiert wurden, wird bei neuen Daten, die m\u00f6glicherweise v\u00f6llig anders sind, nicht gut funktionieren.<\/p>\n\n\n\n<p>Ein korrekt implementiertes Modell sollte daher von Zeit zu Zeit automatisch neu berechnet und angepasst werden und st\u00e4ndig auf neu generierte Daten angewendet werden. Wie oft dies geschieht, h\u00e4ngt nat\u00fcrlich von der uns zur Verf\u00fcgung stehenden Rechenleistung ab.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\">Wie sieht Data Science in einem analytisch entwickelten Unternehmen aus?<\/h3>\n\n\n\n<p>In einem analytisch ausgereiften Unternehmen, in dem Data Science auf einem hohen Niveau entwickelt ist, werden viele verschiedene Modelle implementiert. Man kann sagen, dass sie miteinander &#8222;kooperieren&#8220;, d.h. sie profitieren gegenseitig von den zus\u00e4tzlichen Informationen, die sie erzeugen.<\/p>\n\n\n\n<p>Beispielsweise kann ein Kundensegment aus einem Segmentierungsmodell eine wertvolle Eingangsinformation f\u00fcr ein pr\u00e4diktives Modell sein, das f\u00fcr die Vorhersage des Kundenwerts zust\u00e4ndig ist. Es ist also keine leichte Kunst, ihre Auffrischung so zu programmieren, dass das gesamte \u00d6kosystem reibungslos und korrekt funktionieren kann.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\">Data-Orchestrierung kommt zur Rettung<\/h3>\n\n\n\n<p>Dies ist besonders wichtig, wenn die uns zur Verf\u00fcgung stehenden Ressourcen an Rechenleistung begrenzt sind. Aus diesem Grund werden h\u00e4ufig spezielle Tools, so genannte Orchestratoren, eingesetzt, mit denen sich planen l\u00e4sst, wann der Server den jeweiligen Prozess startet, angefangen beim ETL, \u00fcber das Laden der Daten in das Warehouse, das Herunterladen in das Modell, die Neuberechnung und die R\u00fcckgabe der Ergebnisse an das Warehouse.<\/p>\n\n\n\n<p>Nat\u00fcrlich kann es sein, dass das Data Warehouse bei steigendem Datenvolumen wachsen oder mehr Server f\u00fcr die Modellierung bereitstellen muss. Das kann durch die Verlagerung der gesamten Datenarchitektur in die Cloud gel\u00f6st werden, wo wir jederzeit zus\u00e4tzlichen Platz oder Rechenleistung mieten k\u00f6nnen, wenn unser Bedarf w\u00e4chst.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\">Wie geht Data Science mit riesigen Datenmengen um?<\/h3>\n\n\n\n<p>An dieser Stelle sollten wir auch erw\u00e4hnen, was getan werden kann, wenn viele Daten anfallen und einzelne Recheneinheiten nicht in der Lage sind, diese in einer zufriedenstellenden Zeit zu verarbeiten. Ein Beispiel hierf\u00fcr ist die Analyse von Bildern, T\u00f6nen oder gro\u00dfen Datens\u00e4tzen, die beispielsweise aus Website-Protokollen stammen.<\/p>\n\n\n\n<p>In einer solchen Situation ist der Einsatz von Big-Data-Tools erforderlich, die z. B. mit Hilfe von Map-Reduce-Algorithmen die Datenverarbeitungsaufgaben auf viele miteinander verbundene Server verteilen und die Ergebnisse zu einem Ganzen zusammenfassen. Auf diese Weise k\u00f6nnen die Daten um ein Vielfaches schneller verarbeitet werden, wobei die Geschwindigkeit von der Anzahl der eingestellten Server abh\u00e4ngt. Mit Big-Data-L\u00f6sungen k\u00f6nnen Sie Data-Science-Algorithmen auf sehr gro\u00dfe Datens\u00e4tze anwenden.<\/p>\n\n\n\n<h2 class=\"wp-block-heading\">Umsetzung von Data Science in die Praxis<\/h2>\n\n\n\n<p>Der letzte Schritt besteht darin, die zus\u00e4tzlichen Informationen zu nutzen, die wir mit Hilfe von Data Science erhalten. Nat\u00fcrlich k\u00f6nnen Sie die Analyseergebnisse selbst \u00fcberpr\u00fcfen und entsprechende Schlussfolgerungen daraus ziehen, aber der Schl\u00fcssel zu einem agilen und reaktionsschnellen Unternehmen liegt darin, auch diesen Prozess zu automatisieren.<\/p>\n\n\n\n<p>Hier gibt es unterschiedliche L\u00f6sungen &#8211; im Falle einer explorativen Analyse ist es zum Beispiel eine gute Praxis, die Schlussfolgerungen auf einem Dashboard zu visualisieren. Hierf\u00fcr k\u00f6nnen spezielle Business Intelligence-Tools (z.B. Tableau) eingesetzt werden.<\/p>\n\n\n\n<p>Damit haben die Entscheidungstr\u00e4ger eine schnelle und leicht zu interpretierende Schlussfolgerung zur Hand. Ein Beispiel w\u00e4re ein Diagramm oder eine Tabelle, in der die Ergebnisse einer Warenkorbanalyse oder eine sequentielle Analyse so klar wie m\u00f6glich dargestellt werden.<\/p>\n\n\n\n<figure class=\"wp-block-image size-full\"><img alt=\"\" loading=\"lazy\" decoding=\"async\" width=\"1024\" height=\"646\" src=\"http:\/\/cloudity.com\/wp-content\/uploads\/2022\/03\/image-4.png\" alt=\"\" class=\"wp-image-12959\" srcset=\"https:\/\/cloudity.com\/wp-content\/uploads\/2022\/03\/image-4.png 1024w, https:\/\/cloudity.com\/wp-content\/uploads\/2022\/03\/image-4-300x189.png 300w, https:\/\/cloudity.com\/wp-content\/uploads\/2022\/03\/image-4-768x485.png 768w\" sizes=\"(max-width: 1024px) 100vw, 1024px\" \/><\/figure>\n\n\n\n<h3 class=\"wp-block-heading\">Einsatz von Data Science im Gesch\u00e4ft<\/h3>\n\n\n\n<p>Die zweite M\u00f6glichkeit besteht darin, die Ergebnisse von Modellen mit Entscheidungscharakter zu verwenden. Nat\u00fcrlich k\u00f6nnen diese Informationen auch in BI visualisiert werden, aber der eigentliche Wert liegt in der automatischen Nutzung im Unternehmen.<\/p>\n\n\n\n<p>Meistens geht es darum, die vom Modell erhaltenen Informationen an das entsprechende System weiterzuleiten, das diese Informationen in der richtigen Weise verwenden wird. Ein Beispiel hierf\u00fcr ist die \u00dcbermittlung von Informationen \u00fcber ein Kundensegment oder dessen wahrscheinliche Abwanderung an das CRM-System, wo Aufgaben f\u00fcr die Mitarbeiter erstellt und der automatische Postversand angepasst werden.<\/p>\n\n\n\n<p>Auf diese Weise wird der Wert des Wissens aus Data Science automatisch ausgesch\u00f6pft und das Unternehmen erzielt einen Wettbewerbsvorteil, ohne unn\u00f6tige Ressourcen zu engagieren.<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Jedes Unternehmen sammelt Daten \u00fcber sein Gesch\u00e4ft, aber nicht jedes Unternehmen nutzt sie. Untersuchungen zeigen, dass Unternehmen, die ihre Daten analysieren und auf dieser Grundlage Entscheidungen treffen, um 6 % schneller wachsen, als es ohne diese Analyse zu erwarten w\u00e4re. Aus den von den meisten Unternehmen gesammelten Daten lassen sich leicht Informationen dar\u00fcber ablesen, wie [&hellip;]<\/p>\n","protected":false},"author":1,"featured_media":10494,"comment_status":"closed","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"_acf_changed":false,"_seopress_robots_primary_cat":"none","_seopress_titles_title":"Was ist Data Science? - Cloudity","_seopress_titles_desc":"Jedes Unternehmen sammelt Daten \u00fcber sein Gesch\u00e4ft, aber nicht jedes Unternehmen nutzt sie.","_seopress_robots_index":"","footnotes":""},"categories":[288],"tags":[234],"class_list":["post-10493","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-blog","tag-data-science"],"acf":[],"_links":{"self":[{"href":"https:\/\/cloudity.com\/de\/wp-json\/wp\/v2\/posts\/10493","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/cloudity.com\/de\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/cloudity.com\/de\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/cloudity.com\/de\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/cloudity.com\/de\/wp-json\/wp\/v2\/comments?post=10493"}],"version-history":[{"count":0,"href":"https:\/\/cloudity.com\/de\/wp-json\/wp\/v2\/posts\/10493\/revisions"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/cloudity.com\/de\/wp-json\/wp\/v2\/media\/10494"}],"wp:attachment":[{"href":"https:\/\/cloudity.com\/de\/wp-json\/wp\/v2\/media?parent=10493"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/cloudity.com\/de\/wp-json\/wp\/v2\/categories?post=10493"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/cloudity.com\/de\/wp-json\/wp\/v2\/tags?post=10493"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}