Machine Learning for price predictions

Machine Learning to jeden z najgorętszych tematów branży IT ostatnich lat. Dzięki rozwojowi narzędzi OpenSource i platformy Google Cloud, zaawansowana analityka danych stała się dostępna dla każdego.
Celem warsztatów jest zaprezentowanie na konkretnym przykładzie, jak przebiega proces Machine Learning, zbudowanie działającego modelu i sprawdzenie, jak stworzone rozwiązanie radzi sobie w porównaniu
z osiągnięciami użytkowników serwisku Kaggle. Wykorzystamy narzędzia: Python 3, Pandas, Scikit, XGBoost, DataLab (Jupyter). Będziemy analizować dostępny publicznie zbiór danych „ames housing data set”. Na koniec uczestnicy wyślą swoje wyniki do serwisu Kaggle, żeby porównać swoje osiągnięcia z innymi osobami zmagającymi się z tym zbiorem danych.

O warsztatach

Warsztat skierowany jest do osób początkujących. Od uczestników wymagana jest znajomość technologii Python.

Bardzo przydatna będzie umiejętność posługiwania się konsolą Windows/Unix.

Najbardziej intensywnie będziemy wykorzystywać bibliotekę Pandas.

Warunkiem uczestnictwa w warsztatach jest posiadanie aktywnego i zasilonego konta na Google Cloud Platform. Informacje dla osób zakładających nowe konto: https://cloud.google.com/free/

Warsztaty poprowadzą #GFTexperts: Marcin Kowalski, Maciej Nowicki i Sylwester Lewandowicz.

 

27 października 2018 r.

09:00 - GCP Setup

09:15 - Introduction to Machine Learning process. Exploring the dataset, feature engineering and visualization (DataLab, Python, Pandas, SciKit, Seaborn)

12:00 - Pizza

12:30 - Building a Machine Learning model (Regressions, Decision Trees)

14:45 - Submitting results to Kaggle

15:30 - Networking