In dieser Artikelserie habe ich die verschiedenen Arten von KI (generative KI und "alte" KI, einschließlich maschinelles Lernen/ML, natürliche Sprachverarbeitung/NLP usw.) zusammengefasst, da die KI-Komponenten einer Lösung in der Regel alle einem ähnlichen Muster folgen, nämlich dem eines definierten Inputs aus dem Business (z. B. strukturierte Daten oder Prompt-Text), der zu einem bestimmten Output führt (z. B. vorhergesagte numerische Daten oder generierter Text), der durch den Rest der Lösung und schließlich in das Business fließt.
An dieser Stelle lohnt sich jedoch ein kurzes Intermezzo, um den Hauptunterschied zwischen Gen-KI und anderen Varianten hervorzuheben, insbesondere die Art und Weise, wie das Modell entwickelt wird, da dies erhebliche Auswirkungen auf die praktischen Phasen der Entwicklung und Implementierung einer KI-Lösung hat.
Herkömmliche KI-Modelle, wie sie in ML-Projekten entwickelt werden, nehmen einen Satz von Trainingsdaten (die oft zu diesem Zweck beschafft werden) und kombinieren sie mit einem Algorithmus, der für denselben Zweck ausgewählt wurde, was zu einem trainierten Modell führt, das für die Daten, auf denen es trainiert wurde, und die Anwendung, für die es entwickelt wurde, spezifisch ist. Um auf das Beispiel der Identifizierung der Kundenabwanderung im vorigen Artikel zurückzukommen: Hier wären die Daten spezifisch für diese Organisation, und das resultierende Modell wäre auf diesen speziellen Anwendungsfall zugeschnitten.
Diese Beschreibung lässt die Details des Prozesses zur Entwicklung eines ML-Modells außer Acht, mit denen viele Datenwissenschaftler und ML-Ingenieure nur allzu vertraut sind. So besteht eine der ersten Hürden darin, die für das Training eines Modells erforderlichen Daten zu beschaffen, was in vielen Unternehmen eine Herausforderung darstellen kann. Die folgenden Schritte erfordern die Untersuchung der Daten, die Identifizierung geeigneter Algorithmen und Ansätze sowie das Training und Testen der verschiedenen Iterationen des Modells. All dies kann zeitaufwändig und mühsam sein und wird oft als Kunst und Wissenschaft betrachtet. Und das Schlimmste ist, dass der Datenwissenschaftler feststellen kann, dass es kein Signal in den Daten gibt und dass es unmöglich ist, ein Modell zu erstellen, das das Phänomen vorhersagen kann, von dem er erwartet hat, es vorhersagen zu können!
Einer der Vorteile traditioneller KI-Ansätze wie ML besteht jedoch darin, dass es (relativ) ausgereifte und genau definierte Verfahren für die Entwicklung und Prüfung dieser Modelle und ihren anschließenden Einsatz in der Produktion gibt ( dieses Papier aus dem Jahr 2014 war beispielsweise so etwas wie ein "Aufruf zu den Waffen" für viele Praktiker in diesem Bereich). Das soll nicht heißen, dass es keine Herausforderungen gibt, und es gibt viele Unwägbarkeiten (sicherlich im Vergleich zu normalen Softwareprojekten), aber sobald das Modell ordnungsgemäß getestet und genehmigt wurde (d. h. es "funktioniert"), kann es dann gemäß den verschiedenen Best Practice-Empfehlungen von MLOps eingesetzt werden.
Generative KI-Ansätze hingegen beginnen mit einem allgemeinen, vorab trainierten Modell (großes Sprachmodell oder allgemeiner als "Basismodell" bezeichnet), das dann an die jeweilige Anwendung angepasst wird, indem verschiedene Informationen in die Eingabeaufforderung eingegeben werden (z. B. der Wortlaut der Eingabeaufforderung, spezifische organisatorische Informationen), um die Ausgabe des Basismodells in der gewünschten Weise zu beeinflussen.
Auch bei dieser Beschreibung auf hoher Ebene bleiben viele Details unberücksichtigt. So wird die Phase, in der mit einem Basismodell begonnen wird, wahrscheinlich die Iteration über verschiedene vortrainierte Modelle sowie Prompts (und Kontextdaten) beinhalten, um ein Gefühl dafür zu bekommen, ob die Idee möglich ist. Dann könnte eine Phase der Problemdefinition folgen, um die Lösung auf das Business-Problem zurückzuführen, gefolgt von der Datenerfassung und -verarbeitung. Grundsätzlich ist es einfacher, schnell einen Prototyp für eine Lösung zu erstellen, da keine Trainingsdaten mehr benötigt werden, aber die Problemstellung, um die Lösung auf das Business abzubilden, ist möglicherweise weniger leicht zu verstehen, muss möglicherweise auf diese spezielle Lösung zugeschnitten werden und dauert daher länger. In ähnlicher Weise kann auch das Testen der Modell-/Lösungsleistung weniger gut verstanden werden (im Gegensatz zu den Standardmetriken, die bei ML verwendet werden, wie z. B. Precision oder Recall) und dauert daher ebenfalls länger; das Gleiche gilt für die Bereitstellung und Überwachung, wiederum aufgrund des maßgeschneiderten Charakters der Lösung.