Ao longo desta série de artigos, co-fundei os diferentes tipos de IA (IA Generativa e IA "antiga", incluindo aprendizagem automática/ML, processamento de linguagem natural/PNL, etc.), uma vez que os componentes de IA de uma solução se enquadram geralmente num padrão semelhante, especificamente, o de uma entrada definida do negócio (por exemplo, dados estruturados ou texto pronto) que resulta numa saída específica (por exemplo, dados numéricos previstos ou texto gerado), que flui através do resto da solução e, em última análise, para o negócio.
No entanto, neste ponto, vale a pena fazer um breve interlúdio para destacar a principal diferença entre a IA genuína e outras variedades, em particular a forma como o modelo é desenvolvido, uma vez que tem implicações importantes para as fases práticas de desenvolvimento e implementação de uma solução de IA.
Os modelos tradicionais de AI, como os desenvolvidos em projectos de ML, pegam num conjunto de dados de treino (muitas vezes obtidos para este fim específico) e combinam-no com um algoritmo selecionado para este mesmo fim, o que resulta num modelo treinado específico para os dados em que foi treinado e para a aplicação para a qual foi desenvolvido. Voltando ao exemplo da identificação da rotatividade dos consumidores no artigo anterior, aqui os dados seriam específicos dessa organização, com o modelo resultante adaptado a esse caso de utilização específico.
Esta descrição não tem em conta os pormenores do processo de desenvolvimento de um modelo de ML, com os quais muitos cientistas de dados e engenheiros de dados estão demasiado familiarizados. Por exemplo, um dos primeiros obstáculos que enfrentam é a obtenção dos dados necessários para treinar um modelo, o que pode ser um desafio em muitas organizações. Os passos seguintes requerem a exploração dos dados, a identificação de algoritmos e abordagens adequados e, em seguida, a formação e o teste das várias iterações do modelo. Tudo isto pode ser moroso e entediante, muitas vezes visto como uma arte e como uma ciência e - o pior de tudo - o cientista de dados pode descobrir que não há qualquer sinal nos dados e que é impossível construir um modelo para prever o fenómeno que esperava ser capaz de prever!
No entanto, uma das vantagens das abordagens tradicionais de AI, como o ML, é o facto de existirem processos (relativamente) maduros e bem definidos para desenvolver e testar estes modelos e, em seguida, implementá-los na produção (por exemplo, este artigo de 2014 foi uma espécie de "apelo às armas" para muitos profissionais desta área). Isto não quer dizer que não haja desafios, e há muitas incertezas (certamente em relação a projectos de software normais), mas uma vez que o modelo tenha sido devidamente testado e aprovado (ou seja, "funciona"), pode então ser implantado, seguindo as várias práticas recomendadas do MLOps.
Por outro lado, as abordagens de IA Generativa começam com um modelo geral pré-treinado (modelo de linguagem de grande dimensão, ou mais genericamente designado por "modelo de base"), que é depois personalizado para a aplicação específica através do fornecimento de diferentes informações no pedido (por exemplo, a redação do pedido, informações organizacionais específicas), a fim de manipular o resultado do modelo de base da forma desejada.
Mais uma vez, esta descrição de alto nível omite muitos dos pormenores. Por exemplo, a fase de arranque com um modelo de base envolverá provavelmente a iteração de diferentes modelos pré-treinados, bem como de mensagens (e dados contextuais) para se ter uma ideia se a ideia é possível. Depois, pode haver uma fase de enquadramento do problema para mapear a solução de volta ao problema de negócios, seguida da recolha e processamento de dados. Essencialmente, é mais fácil criar rapidamente um protótipo de uma solução, uma vez que a necessidade de dados de formação foi eliminada, mas o enquadramento do problema para mapear a solução para o negócio pode ser menos fácil de compreender, pode ter de ser adaptado a essa solução específica e, por conseguinte, demorar mais tempo. De forma semelhante, o teste do desempenho do modelo/solução pode também ser menos bem compreendido (ao contrário das métricas padrão utilizadas no ML, como a precisão ou a recuperação) e, por isso, também demorará mais tempo; o mesmo acontece com a implantação e a monitorização, mais uma vez devido à natureza mais personalizada da solução.