-
Notifications
You must be signed in to change notification settings - Fork 0
/
Copy pathintro.qmd
39 lines (34 loc) · 2.16 KB
/
intro.qmd
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
# Wprowadzenie
Witam w świecie zaawansowanych metod uczenia maszynowego 🤖, prezentowanej w
niniejszej publikacji. Książka ta skupia się na czterech głównych obszarach,
zaczynając od wielowymiarowych problemów predykcyjnych, przechodząc przez
złożone modele głębokich sieci neuronowych oraz modele językowe, a kończąc na
sieciach generatywnych. Koncepcyjnie rozpoczniemy od omówienia *multiple target
regression and classification*, gdzie przedstawimy skomplikowane zadania
predykcyjne wymagające jednoczesnej prognozy wielu zmiennych. Przeanalizujemy
praktyczne zastosowania tych modeli w obszarach, takich jak nauki społeczne,
biologia i finanse.
Następnie poświęcimy uwagę głębokim sieciom neuronowym, głównemu filarowi
nowoczesnej sztucznej inteligencji. Omówimy ewolucję od konwolucyjnych sieci
neuronowych (CNN) do rekurencyjnych sieci neuronowych (RNN), zwracając uwagę na
ich zdolność do efektywnego przetwarzania obrazów, sekwencji danych i
rozwiązania bardziej złożonych problemów. W ramach tego obszaru, przyjrzymy się
również technikom transferu wiedzy, uczenia ze wzmocnieniem oraz generatywnym
modelom, takim jak generatywne sieci (GAN), które poszerzają granice możliwości
maszynowego uczenia się.
::: column-margin
![](images/vader.jpeg)
:::
Trzeci kluczowy obszar, który będzie przedmiotem analizy, to modele językowe.
Rozważania rozpoczniemy od głębokich sieci neuronowych, a następnie
skoncentrujemy się na transformatorach, które rewolucjonizują przetwarzanie
języka naturalnego 👅. Przedstawimy praktyczne zastosowania tych modeli,
zwłaszcza w tłumaczeniu maszynowym, generowaniu tekstu i analizie sentymentu.
Ponadto, omówimy pre-trenowane modele językowe, takie jak BERT czy GPT, jako
kluczowe narzędzia adaptacyjne, zdolne do fine-tuningu w zależności od
konkretnego zadania.
Każdy podejmowany temat będzie wzbogacony o implementację analizowanych metod w
realnych scenariuszach. Omówimy kroki od obróbki danych, przez dostosowywanie
architektury modelu, aż po ocenę wyników. W tym kontekście poruszymy także
aspekty etyczne i wyzwania związane z zastosowaniem zaawansowanych modeli
uczenia maszynowego.