-
Notifications
You must be signed in to change notification settings - Fork 0
/
Copy pathdone.txt
30 lines (25 loc) · 1.3 KB
/
done.txt
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
Jeudi 11 mai :
- importation des données et placement dans dossier data.
- Implémentation de la fonction rmlse.
- Fonction d'exportation de csv sous format kaggle.
- Importation des données.
- Concaténation des données.
- Encodage binaire des colonnes "water_1line", "big_market_raion",
"big_road1_1line", "culture_objects_top_25" etc...
Samedi 13 Mai :
- Implémentation Fonction train_test split.
- Correction de bugs fonctions rmsle et kaggle_export.
- Complétion des nulls values de "full_sq", "life_sq" et "floor" avec la valeur moyenne de la série.
- Première soumission : score = 0.42997 / classement = top 87%
- update sur github.
- création de la variable "ext_sq" qui correspond au nombre de m2 extérieurs.
- exclusion de deux exceptions contenant des life_sq et ext_sq supérieurs à 4000 m2.
- Création d'un nouveau modèle avec Kremlin_km and floor.
- Troisième soumission : score = 0.34740 / classement = top 75%
Dimanche 14 mai :
- entrainement sur tout le modèle d'entrainement (refactoring).
- refactoring des colonnes à binariser dans cleaning.
- Quatrième soumission : score = 0.33999 / classement = top 71%
- exploration : life_sq et full_sq cleaning.
- gestion des exceptions life_sq et full_sq lorsque life_sq > full_sq.
- refactoring complet du code en vue de partager avec tout le monde.