Tout au long de cette série d'articles, j'ai coflété les différentes saveurs de l'IA (IA générative et " ancienne " IA, y compris l'apprentissage automatique/AA, le traitement du langage naturel/NLP, etc.), car les composants IA d'une solution répondent généralement tous à un schéma similaire, à savoir une entrée définie provenant de l'entreprise (par exemple, des données structurées ou un texte d'invite) aboutissant à une sortie particulière (par exemple, des données numériques prédites ou un texte généré), qui circule dans le reste de la solution et, en fin de compte, dans l'entreprise.
Toutefois, à ce stade, il convient de faire un bref intermède pour souligner la principale différence entre l'IA générique et les autres variétés, en particulier la manière dont le modèle est développé, car elle a des implications majeures pour les étapes pratiques du développement et de la mise en œuvre d'une solution d'IA.
Les modèles d'IA traditionnels, tels que ceux développés dans les projets AA, prennent un ensemble de données d'entraînement (souvent sourcées dans ce but particulier) et le combinent avec un algorithme sélectionné dans ce même but, ce qui permet d'obtenir un modèle entraîné spécifique aux données sur lesquelles il a été entraîné et à l'application pour laquelle il a été développé. Si l'on reprend l'exemple de l'identification de l'attrition des clients dans l'article précédent, les données seraient ici spécifiques à cette organisation, et le modèle qui en résulterait serait adapté à ce cas d'utilisation particulier.
Cette description passe sous silence les détails du processus de développement d'un modèle de AA que de nombreux data scientists et ingénieurs des données ne connaissent que trop bien. Par exemple, l'un des premiers obstacles auxquels ils seront confrontés sera de mettre la main sur les données nécessaires à l'entraînement d'un modèle, ce qui peut souvent constituer un défi dans de nombreuses organisations. Les étapes suivantes nécessitent l'exploration des données, l'identification d'algorithmes et d'approches appropriés, puis l'entraînement et le test des différentes itérations du modèle. Tout cela peut être long et fastidieux, souvent considéré comme un art autant que comme une science, et - pire que tout - le scientifique des données peut découvrir qu'il n'y a pas de signal dans les données et qu'il est impossible de construire un modèle pour prédire le phénomène qu'il s'attendait à pouvoir prédire !
Cependant, l'un des avantages des approches traditionnelles de l'IA, telles que l'AA, est qu'il existe des processus (relativement) matures et bien définis pour développer et tester ces modèles, puis les déployer en production (par exemple, ce document de 2014 a été en quelque sorte un " appel aux armes " pour de nombreux praticiens dans ce domaine). Cela ne veut pas dire que c'est sans défis, et il y a beaucoup d'incertitudes (certainement par rapport aux projets logiciels ordinaires), mais une fois que le modèle a été correctement testé et approuvé (c'est-à-dire qu'il " fonctionne "), il peut alors être déployé, en suivant les diverses recommandations de meilleures pratiques de MLOps.
D'autre part, les approches d'IA générative commencent par un modèle général pré-entraîné (grand modèle de langage, ou plus génériquement appelé "modèle de base"), qui est ensuite adapté à l'application particulière en fournissant différentes informations dans l'invite (par exemple, le libellé de l'invite, des informations organisationnelles spécifiques), afin de manipuler la sortie du modèle de base de la manière souhaitée.
Une fois encore, cette description de haut niveau ne tient pas compte de la plupart des détails. Par exemple, la phase de démarrage avec un modèle de base impliquera probablement l'itération sur différents modèles pré-entraînés ainsi que sur des messages-guides (et des données contextuelles) afin de déterminer si l'idée est possible. Ensuite, il peut y avoir une phase de cadrage du problème pour relier la solution au problème de l'entreprise, suivie de la collecte et du traitement des données. Essentiellement, il est plus facile de créer rapidement un prototype de solution, puisque le besoin de données de formation a été supprimé, mais le cadrage du problème pour faire correspondre la solution à l'entreprise peut être moins facile à comprendre, peut devoir être adapté à cette solution particulière et donc prendre plus de temps. De la même manière, le test des performances du modèle/de la solution peut également être moins bien compris (contrairement aux mesures standard utilisées en AA, telles que la précision ou le rappel), et prendra donc également plus de temps ; il en va de même pour le déploiement et le suivi, toujours en raison de la nature plus personnalisée de la solution.