Rozwój dużych modeli językowych

Kluczowe ustalenia
Technologia rozwoju i hostingu dużych modeli językowych (LLM) rozwinęła się i rozpowszechniła, dzięki czemu jest teraz szeroko dostępna.
Nasze badania i eksperymenty pokazują, że obecnie praktycznie każda firma może hostować i dostosowywać niemal najnowocześniejsze modele. Jednak koszty są takie, że nie jest realistyczne oferowanie pełnowymiarowych modeli open-source w cenach konkurencyjnych w stosunku do dostawców hiperskalowych.
Niniejszy artykuł stanowi demonstrację tego, co można zrobić przy użyciu sprzętu towarowego, a implikacje zmian w technologii sztucznej inteligencji, które umożliwiły tę demonstrację, zostały omówione.
Opisanotrzy przyszłości dla technologii AI :
- przyszłość, w której dominuje skala,
- przyszłość, w której skala jest ważna,
- oraz przyszłość, w której skala jest nieistotna.
Obecne dowody wskazują na przyszłość, w której "skala ma znaczenie", a nie na przyszłość, w której "skala dominuje", ale istnieją również oznaki, że skala może być jeszcze mniej ważna. Pobierz naszą białą księgę, aby dowiedzieć się więcej o tym, jak praktycznie każda firma może hostować i dostosowywać niemal najnowocześniejsze modele.



