Kategorien
Buch

Neu: Künstliche Intelligenz und Data Science in Theorie und Praxis

Lieber Gast,

Künstliche Intelligenz (KI) ist das Megathema seit Anfang 2023 – doch für Unternehmen ohne Data Science vielleicht ein Rechner ohne Strom! Gerne weise ich daher heute in meinem Newsblog auf ein neues Buch zu Data Science und KI hin, das am 20. Juni 2023 (bzw. einen Tag vorher als eBook) im Verlag Springer Spektrum erschien und folgenden Titel trägt:

»Künstliche Intelligenz und Data Science in Theorie und Praxis: Von Algorithmen und Methoden zur praktischen Umsetzung in Unternehmen«

Bevor ich jedoch auf das Buch der Herausgeber Andreas Gillhuber, Göran Kauermann und Wolfgang Hauner eingehe, möchte ich die Frage beantworten, was Data Science ist. Und am Ende, nach meinem Fazit zu dieser Buchvorstellung, finden sie noch mehr als 10 Quellen und weitere Literaturangaben zu Data Science, Künstlicher Intelligenz und Python als wichtige Programmiersprache.

Was ist Data Science?

Data Science, Datenwissenschaft, ist das anwendungsorientiert Fachgebiet, welches aus großen Datenmengen aus einem bestimmten Bereich Wissen filtern (Extraktion) und dieses Wissen in nützliche Handlungen für das Business zu transferiert.

Häufige Ziele sind, relevante Muster in Daten zu erkennen, die Schlussfolgerungen daraus zu ziehen und / oder Entwicklungen von Faktoren (Variablen) zu modellieren und zu prognostizieren. Dabei ist die Visualisierung von Daten und Ergebnissen sowohl für deren Verständnis als auch für die Kommunikation mit Dritten essentiell.

Eine Definition liefert Herter (2022, S. 26):

»Data Science ist ein interdisziplinäres Wissenschaftsfeld, das sich mit der exakten digitalen Erfassung, Analyse und Visualisierung vergangener, aktueller sowie zukünftiger Phänomene unserer realen Welt beschäftigt, um
datengetrieben den Prozess der Wissensgenerierung als bestmögliche Entscheidungsbasis für menschliches Handeln zu optimieren.«

Zur Datenanalyse nutzt das Gebiet vor allem multivariate Methoden der Statistik sowie des Maschinellen Lernens – wobei sich diese Bereiche nicht klar abgrenzen lassen, denn die Regressionsanalyse, die Faktorenanalyse oder die Clusteranalyse sind bekannte und klassische Verfahren der Statistik, während Algorithmen (mathematische Formeln, Rechenregeln), wie k-Nearest Neighbor, Support Vector Machines (SVM), Random Forest oder auch die künstlichen Neuronale Netze (KNN) ihren Ursprung eher in der Forschung zur Künstlichen Intelligenz haben.

Zudem gibt es mit den Verfahren der künstliche neuronalen Netze (KNN) bzw. des Deep Learning einen Bereich, der nicht zur klassischen Statistik gehört, sondern aus der KI-Forschung stammt – und dessen Ergebnisse wie Text- und Bildgeneratoren (z.B. ChatGPT und Midjourney) das Bild von Künstlicher Intelligenz in der Öffentlichkeit dominieren (sog. Generative Modelle).

An der Entwicklung von Künstlicher Intelligenz und von Deep Learnings waren neben Informatikern übrigens auch weitere Disziplinen wie Neuro- und Kognitive Psychologie oder Linguistik beteiligt und einige ihrer Pioniere wie Geoffrey Hinton haben Abschlüsse in mehreren Fächern.

Wer sich also mit Künstlicher Intelligenz tiefer beschäftigen und dessen Grundlagen verstehen möchte, sollte hierzu ein gutes Buch zu Data Science lesen. Und wer als (HR) Data Scientist bzw. People Analyst arbeitet, sollte stets auf dem aktuellen Stand sein und schauen, was es Neues in diesem Bereich gibt, wie andere an die Sache herangehen und was wir aus deren Erfahrungen und Praxisbeispielen lernen können.