W całej tej serii artykułów łączyłem różne smaki sztucznej inteligencji (Gen AI i "stara" sztuczna inteligencja, w tym uczenie maszynowe / ML, przetwarzanie języka naturalnego / NLP itp.), Ponieważ komponenty sztucznej inteligencji rozwiązania zasadniczo pasują do podobnego wzorca, a konkretnie do określonego wejścia z firmy (np. Ustrukturyzowane dane lub tekst podpowiedzi), co skutkuje określonym wynikiem (np. Przewidywane dane liczbowe lub wygenerowany tekst), który przepływa przez resztę rozwiązania i ostatecznie do firmy.
W tym miejscu warto jednak zrobić krótką przerwę, aby podkreślić główną różnicę między Gen AI a innymi odmianami, w szczególności sposób opracowywania modelu, ponieważ ma to poważne konsekwencje dla praktycznych etapów opracowywania i wdrażania rozwiązania AI.
Tradycyjne modele AI, takie jak te opracowane w projektach ML, pobierają zestaw danych szkoleniowych (często pozyskiwanych w tym konkretnym celu) i łączą je z algorytmem wybranym w tym samym celu, co skutkuje wyszkolonym modelem specyficznym dla danych, na których został przeszkolony i aplikacji, dla której został opracowany. Wracając do przykładu identyfikacji rezygnacji klientów w poprzednim artykule, tutaj dane byłyby specyficzne dla tej organizacji, a wynikowy model dostosowany do tego konkretnego przypadku użycia.
Opis ten pomija szczegóły procesu opracowywania modelu ML, z którym wielu analityków danych i inżynierów ML jest zbyt dobrze zaznajomionych. Na przykład, jedną z pierwszych przeszkód, jakie napotkają, będzie zdobycie danych wymaganych do szkolenia modelu, co często może być wyzwaniem w wielu organizacjach. Kolejne kroki wymagają eksploracji danych, identyfikacji odpowiednich algorytmów i podejść, a następnie szkolenia i testowania różnych iteracji modelu. Wszystko to może być czasochłonne i żmudne, często postrzegane zarówno jako sztuka, jak i nauka, a co najgorsze - naukowiec zajmujący się danymi może odkryć, że w danych nie ma sygnału i że niemożliwe jest zbudowanie modelu przewidującego zjawisko, które spodziewał się przewidzieć!
Jednak jedną z zalet tradycyjnych podejść do sztucznej inteligencji, takich jak ML, jest to, że istnieją (stosunkowo) dojrzałe i dobrze zdefiniowane procesy opracowywania i testowania tych modeli, a następnie wdrażania ich do produkcji (na przykład ten artykuł z 2014 roku był czymś w rodzaju "wezwania do broni" dla wielu praktyków w tej dziedzinie). Nie oznacza to, że nie wiąże się to z wyzwaniami i istnieje wiele niewiadomych (z pewnością w porównaniu do zwykłych projektów oprogramowania), ale gdy model zostanie odpowiednio przetestowany i zatwierdzony (tj. "działa"), można go wdrożyć, zgodnie z różnymi zaleceniami dotyczącymi najlepszych praktyk MLOps.
Z drugiej strony, generatywne podejścia do sztucznej inteligencji zaczynają się od ogólnego, wstępnie wytrenowanego modelu (duży model językowy lub bardziej ogólnie określany jako "model podstawowy"), który jest następnie dostosowywany do konkretnej aplikacji poprzez dostarczanie różnych informacji w podpowiedzi (np. sformułowanie podpowiedzi, konkretne informacje organizacyjne), w celu manipulowania danymi wyjściowymi modelu podstawowego w pożądany sposób.
Ponownie, ten wysokopoziomowy opis pomija wiele szczegółów. Na przykład, faza rozpoczynania od modelu bazowego będzie prawdopodobnie obejmować iterację różnych wstępnie wytrenowanych modeli, a także podpowiedzi (i danych kontekstowych), aby uzyskać poczucie, czy pomysł może być możliwy. Następnie może nastąpić faza tworzenia ram problemu w celu zmapowania rozwiązania z powrotem do problemu biznesowego, po czym następuje gromadzenie i przetwarzanie danych. Zasadniczo, łatwiej jest szybko prototypować rozwiązanie, ponieważ potrzeba danych treningowych została usunięta, ale tworzenie ram problemu w celu zmapowania rozwiązania na problem biznesowy może być mniej zrozumiałe, może wymagać dostosowania do tego konkretnego rozwiązania, a zatem trwać dłużej. W podobny sposób, testowanie wydajności modelu/rozwiązania może być mniej zrozumiałe (w przeciwieństwie do standardowych wskaźników stosowanych w ML, takich jak precyzja lub wycofanie), a zatem również potrwa dłużej; to samo dotyczy wdrażania i monitorowania, ponownie ze względu na bardziej indywidualny charakter rozwiązania.