27 sept. 2023

Créer une valeur réelle avec les LLM

Il n'est pas simple de comprendre ce que ces modèles peuvent et ne peuvent pas faire et comment les appliquer avec succès pour en tirer un avantage pour les affaires
Simon Thompson_Website Contact.png
Simon Thompson
Head of Data Science
blogAbstractMinutes
blogAbstractTimeReading
gft-image-mood-13.jpg
Inter-secteurs
Megadonnées
Cybersécurité
IA
share
Dans notre nouveau document de Leadership éclairé du GFT, nous étudions les recherches émergentes sur les propriétés des LLM de la génération actuelle et décrivons les stratégies qui, selon nous, devront être adoptées si l'on veut qu'ils soient appliqués avec succès.

Au milieu de l'année 2023, le monde de l'informatique est en ébullition face à l'émergence de grands modèles linguistiques (LLM) tels que GPT4/ChatGPT premium et StarChat. Il n'est pas simple de comprendre ce que ces modèles peuvent et ne peuvent pas faire et comment les appliquer avec succès pour en tirer un avantage pour les affaires.

Les LLM sont spéciaux parce qu'ils émettent du langage en réponse au langage ; si le modèle est stimulé par un texte, il produit le texte correspondant en guise de réponse. Cela signifie qu'il est facile pour n'importe qui d'interagir avec n'importe quel LLM pour lequel il dispose d'une interface, et de nombreux LLM ont été mis à la disposition du public par le biais d'interfaces de chat. C'est pourquoi le développement des LLM en tant que technologie de l'IA a eu un impact soudain et significatif sur la perception qu'a le public des capacités de l'IA.

Comprendre les LLM

La seule chose que font les LLM est de consommer du texte et d'en produire, mais comme la génération de texte est très bonne, les modèles semblent raisonner sur le texte qu'ils manipulent et le comprendre. De nombreuses personnes travaillant dans la recherche sur le langage naturel et l'IA se sont efforcées de comprendre et de sonder les capacités des LLM.

Une littérature de plus en plus abondante identifie les limites de la génération actuelle de modèles et démontre que l'enthousiasme initial qui les a accueillis devrait peut-être être tempéré. L'objectif de ce document est de dresser la liste actuelle des limitations des LLM de pointe et d'évaluer leur importance et la probabilité qu'elles se révèlent être des défauts fondamentaux des LLM en tant qu'approche de l'IA. Dans d'autres travaux, certaines des limitations techniques des LLM sont étudiées.

Cependant, dans notre nouveau document de Leadership éclairé, nous validons les limitations à l'aide de quelques exemples simples du comportement actuel des LLM et couvrons les contraintes non techniques telles que les questions de sécurité et de propriété intellectuelle. Après avoir passé en revue les limites de la technologie, ce document examine ensuite comment la technologie peut être appliquée avec succès et sur quoi les entreprises doivent se concentrer pour générer une valeur maximale à partir de l'opportunité créée par la révolution LLM.

Une voie vers la réussite

Nous sommes convaincus qu'il est possible de définir une voie vers le succès pour les organisations qui souhaitent accéder à la valeur incontestable de la nouvelle génération de LLM, tout en gérant le risque lié à leurs faiblesses identifiées. Cette voie de la réussite passe par la limitation de l'utilisation des LLM à des composants offrant des fonctionnalités bien spécifiées et contrôlées, afin de les intégrer dans des infrastructures appropriées de contrôle et de responsabilité.

Il est possible que les futurs LLM résolvent les problèmes qui empêchent actuellement l'utilisation sans contrainte de cette nouvelle génération de modèles. Par exemple, les LLM pourraient bien être remaniés (au-delà des transformateurs actuels) pour planifier efficacement dans un avenir relativement proche. Techniquement, il ne semble pas y avoir de raison fondamentale pour que cela ne soit pas possible, même si cela nécessitera certainement un autre investissement étonnant en puissance de calcul.

D'autres limitations, telles que le traitement du raisonnement compositionnel, de l'imitation et de la sécurité, semblent plus difficiles à surmonter. Indépendamment des progrès continus, il convient de considérer que des technologies beaucoup plus simples, matures et prévisibles telles que le courrier électronique, les bases de données et les navigateurs web nécessitent encore des modèles d'application et des contrôles de gestion sophistiqués. Il semble peu probable que les LLM soient différents.

L'interface en langage naturel démontrée par un grand nombre de LLM de la dernière génération a éveillé une population beaucoup plus large au pouvoir des LLM en particulier, et de l'IA en général. En tant que tel, nous avons identifié certaines des principales limitations de ces approches, et en même temps fait des recommandations pour des implémentations qui peuvent atténuer certains de ces problèmes, permettant en fin de compte l'adoption réussie des LLM. Toutefois, il convient de noter que rien de tout cela ne supprime la nécessité d'une vision, d'un investissement et d'une équipe qualifiée pour mettre en œuvre de telles solutions.