Auf dieser Plattform finden Sie bereits eine Vielzahl von Inhalten bezüglich Künstlicher Intelligenz mit einem Schwerpunkt auf maschinellem Lernen. In unserer Use-Case-Datenbank können Sie unterschiedliche Implementierungen nachvollziehen und selbst umsetzen.
In einem größeren Kontext stellt sich besonders für Unternehmen die Frage, welche Kompetenzen, Fähigkeiten oder Qualifikationen (also nachgewiesene Kompetenzen und Fähigkeiten) Mitarbeiter*innen haben müssen, um rasch die gewünschten Modelle und Algorithmen zu implementieren bzw. zu verstehen. Wie Sie bereits beim Stöbern der Use-Cases gesehen haben, ist diese Frage nicht so einfach. Es hat sich in den letzten Jahren eine Trennung der Stellenbezeichnungen und damit die Inhalte der Tätigkeiten verändert. Zusammenfassend unterscheidet man (ja, leider sind die Namen nicht standardisiert):
Data Scientists/AI Researcher: Die Aufgabenbereiche fokussieren sich auf die mathematische Analyse des Problems. Der Kern der Aufgabe ist das fundamentale Verstehen des Problems und Ableiten von geeigneten Modellen sowie Verfahren. Methoden werden entwickelt und statistische Analysen durchgeführt.
Data Engineer/AI Engineer: Der Fokus der Arbeit ist die nutzenstiftende Implementierung von Modellen und Methoden für eine konkrete Anwendung. Der Kern der Aufgabe ist die optimierte Umsetzung und Einbettung in den Betrieb.
Beide Tätigkeitsfelder überlappen – eine klare Trennung ist hier nicht möglich. Die Tätigkeitsbereiche gehören zu sehr zukunftsträchtigen Berufsgruppen mit Schwerpunkten auf ähnliche Tätigkeiten:
Programmierung: Data Engineers und Data Scientists programmieren. Erstere nutzen die Programmierung zur Aufdeckung statistischer Zusammenhänge und Ableitung von (neuen) mathematischen Modellen zur Lösung eines Problems.
Data Engineers nutzen bestehende Modelle, adaptieren diese gegebenenfalls auf vorhandene Daten und implementieren die Anwendung so, dass der*die Benutzer*in das gewünschte Ergebnis adäquat nutzen kann.
Mathematik: Während Data Scientists einen Schwerpunkt auf mathematische Zusammenhänge wie korrekte Modellierung oder Optimierung legen, müssen Data Engineers diese grundlegenden mathematischen Zusammenhänge nicht verstehen, um die Modelle korrekt in der Software implementieren zu können. Für diese Implementierungen ist ein oberflächliches mathematisches Wissen ausreichend.
Obwohl sich beide Tätigkeitsfelder stark überlappen, sind die gleichen Personen typischerweise nicht für beide Felder einsetzbar. Data Scientists wissen über die Modelle und Integration in der Software Bescheid – sie können diese typischerweise aber nicht so implementieren, da Kundenwünsche inkl. Interfaces und Oberflächen meist nicht adäquat abgebildet werden. Auf der anderen Seite ist eine detaillierte und korrekte mathematische Darstellung des Problems für Data Engineers typischerweise nicht ohne großen Zeitaufwand machbar.
Die Unterschiede liegen also auf einer methodischen Ebene – sind die Tätigkeiten zur Lösung eines Problems klar, so sind Data Engineers gut einsetzbar. Ist das eigentliche Problem noch nicht klar und sind tiefergehende mathematische Analysen nötig, sind Data Scientists nötig.
Eine Einteilung nach Ausbildung und Programmiersprachen (obwohl häufig gemacht) ist schwierig. In beiden Fällen kommt Python, R bzw. C++ zum Einsatz. Während Data Scientists dazu tendierten mehr statistische Analysen durchzuführen (also zum Beispiel mehr Aufwand in R), tendieren Data Engineers mehr zu Programmiersprachen, welche eine saubere Implementierung ermöglichen. Auch seitens Qualifikation ist es nur schwierig eine Unterscheidung zu erkennen. Aufgrund des hohen Theorieanteils sind Data Scientists häufig promoviert. Auf der anderen Seite glänzen Data Engineers mit hoher Erfahrung in unterschiedlichen Projekten.
Lassen Sie uns nun anhand konkreter Beispiele auf dieser Plattform die hier diskutierten Unterschiede greifbar machen.
Im Use-Case Traue keinem neuronalen Netz: wissenschaftliche Bildanalysen wurden Fische mit einem CNN ihrer Herkunft zugeordnet. Das CNN wurde trainiert und generiert im Anschluss basierend auf einem Fischbild eine Aussage bezüglich der Herkunft des Fisches. Was denken Sie? Ist dies die Aufgabe für Data Scientists oder Data Engineers?
Wie Sie im Use-Case sehen, gibt es eine Unbekannte: Ist die optische Zuordnung überhaupt möglich? Das ist nicht klar. Es geht in diesem Beispiel also nicht um die Implementierung in einem Betrieb, sondern um die Aufdeckung potenzieller Unterschiede zwischen Fischpopulationen. Dies beinhaltet das Hinterfragen der Modelle (also das CNN). Dieser Use-Case würde in Unternehmen also eher von Data Scientists durchgeführt werden.
Sehen wir uns ein weiteres Beispiel an: Pfadplanung für autonome Systeme. In diesem Use-Case sind mehrere Dinge vorgegeben: Die Robotersteuerung ist funktionsfähig, die Umgebung ist durch eine Karte bekannt und es gibt gute praktische Methoden zur Lösung des Pfadplanungsproblems. Der Use-Case kann also ohne Probleme von Data Engineers implementiert werden. Es sind keine statistischen Analysen nötig und keine komplexen mathematischen Modelle müssen abgeleitet werden.
Comments