From 1eb2a93e4a0dbd6a5fe316ae261a235b48834875 Mon Sep 17 00:00:00 2001
From: miguelgfierro <miguelgfierro@users.noreply.github.com>
Date: Thu, 15 Jul 2021 16:25:05 +0000
Subject: [PATCH 01/17] rename common to utils

---
 docs/source/common.rst                        |  20 +-
 docs/source/index.rst                         |   2 +-
 examples/00_quick_start/als_movielens.ipynb   |   6 +-
 .../00_quick_start/fastai_movielens.ipynb     |   2 +-
 examples/00_quick_start/ncf_movielens.ipynb   |   4 +-
 examples/00_quick_start/sar_movielens.ipynb   |   6 +-
 .../sar_movielens_with_azureml.ipynb          |   2 +-
 .../sequential_recsys_amazondataset.ipynb     |   4 +-
 .../00_quick_start/wide_deep_movielens.ipynb  |   4 +-
 examples/00_quick_start/xdeepfm_criteo.ipynb  |   2 +-
 examples/01_prepare_data/data_split.ipynb     |   2 +-
 .../baseline_deep_dive.ipynb                  |   2 +-
 .../cornac_bivae_deep_dive.ipynb              |   4 +-
 .../cornac_bpr_deep_dive.ipynb                |   8 +-
 .../lightgcn_deep_dive.ipynb                  |   6 +-
 .../multi_vae_deep_dive.ipynb                 |   4 +-
 .../standard_vae_deep_dive.ipynb              |   6 +-
 .../surprise_svd_deep_dive.ipynb              |   2 +-
 .../mmlspark_lightgbm_criteo.ipynb            |   4 +-
 .../vowpal_wabbit_deep_dive.ipynb             |   2 +-
 examples/02_model_hybrid/fm_deep_dive.ipynb   |   4 +-
 examples/02_model_hybrid/ncf_deep_dive.ipynb  |   6 +-
 .../als_movielens_diversity_metrics.ipynb     |   6 +-
 examples/03_evaluate/evaluation.ipynb         |   2 +-
 .../azureml_hyperdrive_wide_and_deep.ipynb    |   6 +-
 .../nni_ncf.ipynb                             |   2 +-
 .../nni_surprise_svd.ipynb                    |   2 +-
 .../train_scripts/wide_deep_training.py       |   2 +-
 .../tuning_spark_als.ipynb                    |   4 +-
 .../05_operationalize/als_movie_o16n.ipynb    |  10 +-
 .../lightgbm_criteo_o16n.ipynb                |   2 +-
 examples/06_benchmarks/benchmark_utils.py     |  35 +---
 examples/06_benchmarks/movielens.ipynb        |   4 +-
 .../KDD2020-tutorial/step5_run_lightgcn.ipynb |   4 +-
 reco_utils/README.md                          |   2 +-
 reco_utils/dataset/amazon_reviews.py          |   2 +-
 reco_utils/dataset/criteo.py                  |  22 +--
 reco_utils/dataset/movielens.py               |  18 +-
 reco_utils/dataset/pandas_df_utils.py         |   2 +-
 reco_utils/dataset/python_splitters.py        |   6 +-
 reco_utils/dataset/spark_splitters.py         |  73 ++++----
 reco_utils/dataset/sparse.py                  |   6 +-
 reco_utils/dataset/split_utils.py             |  30 +--
 reco_utils/evaluation/python_evaluation.py    |  34 ++--
 .../evaluation/spark_diversity_evaluation.py  |  14 +-
 reco_utils/evaluation/spark_evaluation.py     |  16 +-
 reco_utils/recommender/cornac/cornac_utils.py |   2 +-
 .../deeprec/DataModel/ImplicitCF.py           |   4 +-
 .../deeprec/models/graphrec/lightgcn.py       |   4 +-
 reco_utils/recommender/fastai/fastai_utils.py |   6 +-
 reco_utils/recommender/geoimc/geoimc_data.py  | 172 +++++++++---------
 .../recommender/geoimc/geoimc_predict.py      |  38 ++--
 reco_utils/recommender/ncf/dataset.py         |  32 ++--
 reco_utils/recommender/rlrmc/RLRMCdataset.py  |   2 +-
 reco_utils/recommender/sar/sar_singlenode.py  |   8 +-
 .../recommender/surprise/surprise_utils.py    |  14 +-
 reco_utils/recommender/vowpal_wabbit/vw.py    |  18 +-
 .../recommender/wide_deep/wide_deep_utils.py  |  14 +-
 reco_utils/tuning/nni/ncf_training.py         |   2 +-
 tests/conftest.py                             |   4 +-
 .../examples/test_notebooks_gpu.py            |   2 +-
 tests/smoke/examples/test_notebooks_gpu.py    |   3 +-
 tests/unit/examples/test_notebooks_gpu.py     |   3 +-
 .../reco_utils/common/test_general_utils.py   |   2 +-
 .../unit/reco_utils/common/test_gpu_utils.py  |   2 +-
 .../unit/reco_utils/common/test_k8s_utils.py  |   2 +-
 .../common/test_notebook_utils.ipynb          |   4 +-
 .../reco_utils/common/test_notebook_utils.py  |   3 +-
 tests/unit/reco_utils/common/test_plot.py     |   2 +-
 .../reco_utils/common/test_python_utils.py    |   2 +-
 tests/unit/reco_utils/common/test_tf_utils.py |   4 +-
 tests/unit/reco_utils/common/test_timer.py    |   2 +-
 .../dataset/test_python_splitter.py           |   2 +-
 .../reco_utils/dataset/test_spark_splitter.py |   2 +-
 tests/unit/reco_utils/dataset/test_sparse.py  |   2 +-
 .../evaluation/test_python_evaluation.py      |   3 +-
 .../recommender/test_cornac_utils.py          |   2 +-
 .../reco_utils/recommender/test_geoimc.py     |   2 +-
 .../recommender/test_ncf_dataset.py           |   2 +-
 .../recommender/test_ncf_singlenode.py        |   2 +-
 .../recommender/test_sar_singlenode.py        |   2 +-
 .../recommender/test_surprise_utils.py        |   2 +-
 .../recommender/test_wide_deep_utils.py       |   4 +-
 83 files changed, 374 insertions(+), 408 deletions(-)

diff --git a/docs/source/common.rst b/docs/source/common.rst
index b167c21d1e..14beecc374 100644
--- a/docs/source/common.rst
+++ b/docs/source/common.rst
@@ -7,64 +7,64 @@ Common utilities module
 General utilities
 ===============================
 
-.. automodule:: reco_utils.common.general_utils
+.. automodule:: reco_utils.utils.general_utils
     :members:
 
 
 GPU utilities
 ===============================
 
-.. automodule:: reco_utils.common.gpu_utils
+.. automodule:: reco_utils.utils.gpu_utils
     :members:
 
 
 Kubernetes utilities
 ===============================
 
-.. automodule:: reco_utils.common.k8s_utils
+.. automodule:: reco_utils.utils.k8s_utils
     :members:
 
 
 Notebook utilities
 ===============================
 
-.. automodule:: reco_utils.common.notebook_utils
+.. automodule:: reco_utils.utils.notebook_utils
     :members:
 
-.. automodule:: reco_utils.common.notebook_memory_management
+.. automodule:: reco_utils.utils.notebook_memory_management
     :members:
 
 
 Python utilities
 ===============================
 
-.. automodule:: reco_utils.common.python_utils
+.. automodule:: reco_utils.utils.python_utils
     :members:
 
 
 Spark utilities
 ===============================
 
-.. automodule:: reco_utils.common.spark_utils
+.. automodule:: reco_utils.utils.spark_utils
     :members:
 
 
 Tensorflow utilities
 ===============================
 
-.. automodule:: reco_utils.common.tf_utils
+.. automodule:: reco_utils.utils.tf_utils
     :members:
 
 
 Timer
 ===============================
 
-.. automodule:: reco_utils.common.timer
+.. automodule:: reco_utils.utils.timer
     :members:
 
 
 Plot utilities
 ===============================
 
-.. automodule:: reco_utils.common.plot
+.. automodule:: reco_utils.utils.plot
     :members:
\ No newline at end of file
diff --git a/docs/source/index.rst b/docs/source/index.rst
index 0f3f002a01..62850666f9 100644
--- a/docs/source/index.rst
+++ b/docs/source/index.rst
@@ -11,7 +11,7 @@ evaluating recommender systems.
    :maxdepth: 1
    :caption: Contents:
 
-    Common <common>
+    Utils <utils>
     Dataset <dataset>
     Evaluation <evaluation>
     Recommender algorithms <recommender>
diff --git a/examples/00_quick_start/als_movielens.ipynb b/examples/00_quick_start/als_movielens.ipynb
index 6a886ebd7b..84a26276ea 100644
--- a/examples/00_quick_start/als_movielens.ipynb
+++ b/examples/00_quick_start/als_movielens.ipynb
@@ -52,12 +52,12 @@
     "from pyspark.sql.types import StructType, StructField\n",
     "from pyspark.sql.types import StringType, FloatType, IntegerType, LongType\n",
     "\n",
-    "from reco_utils.common.timer import Timer\n",
+    "from reco_utils.utils.timer import Timer\n",
     "from reco_utils.dataset import movielens\n",
-    "from reco_utils.common.notebook_utils import is_jupyter\n",
+    "from reco_utils.utils.notebook_utils import is_jupyter\n",
     "from reco_utils.dataset.spark_splitters import spark_random_split\n",
     "from reco_utils.evaluation.spark_evaluation import SparkRatingEvaluation, SparkRankingEvaluation\n",
-    "from reco_utils.common.spark_utils import start_or_get_spark\n",
+    "from reco_utils.utils.spark_utils import start_or_get_spark\n",
     "\n",
     "print(\"System version: {}\".format(sys.version))\n",
     "print(\"Spark version: {}\".format(pyspark.__version__))\n"
diff --git a/examples/00_quick_start/fastai_movielens.ipynb b/examples/00_quick_start/fastai_movielens.ipynb
index ae17eaa109..d79bfb5f13 100644
--- a/examples/00_quick_start/fastai_movielens.ipynb
+++ b/examples/00_quick_start/fastai_movielens.ipynb
@@ -49,7 +49,7 @@
     "import torch, fastai\n",
     "from fastai.collab import EmbeddingDotBias, collab_learner, CollabDataBunch, load_learner\n",
     "\n",
-    "from reco_utils.common.timer import Timer\n",
+    "from reco_utils.utils.timer import Timer\n",
     "from reco_utils.dataset import movielens\n",
     "from reco_utils.dataset.python_splitters import python_stratified_split\n",
     "from reco_utils.recommender.fastai.fastai_utils import cartesian_product, score\n",
diff --git a/examples/00_quick_start/ncf_movielens.ipynb b/examples/00_quick_start/ncf_movielens.ipynb
index c94e314a7d..716486a594 100644
--- a/examples/00_quick_start/ncf_movielens.ipynb
+++ b/examples/00_quick_start/ncf_movielens.ipynb
@@ -52,11 +52,11 @@
     "import tensorflow as tf\n",
     "tf.get_logger().setLevel('ERROR') # only show error messages\n",
     "\n",
-    "from reco_utils.common.timer import Timer\n",
+    "from reco_utils.utils.timer import Timer\n",
     "from reco_utils.recommender.ncf.ncf_singlenode import NCF\n",
     "from reco_utils.recommender.ncf.dataset import Dataset as NCFDataset\n",
     "from reco_utils.dataset import movielens\n",
-    "from reco_utils.common.notebook_utils import is_jupyter\n",
+    "from reco_utils.utils.notebook_utils import is_jupyter\n",
     "from reco_utils.dataset.python_splitters import python_chrono_split\n",
     "from reco_utils.evaluation.python_evaluation import (rmse, mae, rsquared, exp_var, map_at_k, ndcg_at_k, precision_at_k, \n",
     "                                                     recall_at_k, get_top_k_items)\n",
diff --git a/examples/00_quick_start/sar_movielens.ipynb b/examples/00_quick_start/sar_movielens.ipynb
index 19d89ad28c..93f30e9b4d 100644
--- a/examples/00_quick_start/sar_movielens.ipynb
+++ b/examples/00_quick_start/sar_movielens.ipynb
@@ -64,8 +64,8 @@
     "import scrapbook as sb\n",
     "from sklearn.preprocessing import minmax_scale\n",
     "\n",
-    "from reco_utils.common.python_utils import binarize\n",
-    "from reco_utils.common.timer import Timer\n",
+    "from reco_utils.utils.python_utils import binarize\n",
+    "from reco_utils.utils.timer import Timer\n",
     "from reco_utils.dataset import movielens\n",
     "from reco_utils.dataset.python_splitters import python_stratified_split\n",
     "from reco_utils.evaluation.python_evaluation import (\n",
@@ -497,7 +497,7 @@
    "source": [
     "### 2.3. Evaluate how well SAR performs\n",
     "\n",
-    "We evaluate how well SAR performs for a few common ranking metrics provided in the `python_evaluation` module in reco_utils. We will consider the Mean Average Precision (MAP), Normalized Discounted Cumalative Gain (NDCG), Precision, and Recall for the top-k items per user we computed with SAR. User, item and rating column names are specified in each evaluation method."
+    "We evaluate how well SAR performs for a few utils ranking metrics provided in the `python_evaluation` module in reco_utils. We will consider the Mean Average Precision (MAP), Normalized Discounted Cumalative Gain (NDCG), Precision, and Recall for the top-k items per user we computed with SAR. User, item and rating column names are specified in each evaluation method."
    ]
   },
   {
diff --git a/examples/00_quick_start/sar_movielens_with_azureml.ipynb b/examples/00_quick_start/sar_movielens_with_azureml.ipynb
index 5a2bfaf334..46ba3a05ed 100644
--- a/examples/00_quick_start/sar_movielens_with_azureml.ipynb
+++ b/examples/00_quick_start/sar_movielens_with_azureml.ipynb
@@ -337,7 +337,7 @@
     "from azureml.core import Run\n",
     "from sklearn.externals import joblib\n",
     "\n",
-    "from reco_utils.common.timer import Timer\n",
+    "from reco_utils.utils.timer import Timer\n",
     "from reco_utils.dataset import movielens\n",
     "from reco_utils.dataset.python_splitters import python_stratified_split\n",
     "from reco_utils.evaluation.python_evaluation import map_at_k, ndcg_at_k, precision_at_k, recall_at_k\n",
diff --git a/examples/00_quick_start/sequential_recsys_amazondataset.ipynb b/examples/00_quick_start/sequential_recsys_amazondataset.ipynb
index 06fa645bd0..5ff2c15039 100644
--- a/examples/00_quick_start/sequential_recsys_amazondataset.ipynb
+++ b/examples/00_quick_start/sequential_recsys_amazondataset.ipynb
@@ -63,8 +63,8 @@
     "import tensorflow as tf\n",
     "tf.get_logger().setLevel('ERROR') # only show error messages\n",
     "\n",
-    "from reco_utils.common.timer import Timer\n",
-    "from reco_utils.common.constants import SEED\n",
+    "from reco_utils.utils.timer import Timer\n",
+    "from reco_utils.utils.constants import SEED\n",
     "from reco_utils.recommender.deeprec.deeprec_utils import (\n",
     "    prepare_hparams\n",
     ")\n",
diff --git a/examples/00_quick_start/wide_deep_movielens.ipynb b/examples/00_quick_start/wide_deep_movielens.ipynb
index ee965f13f3..1fa6ae280a 100644
--- a/examples/00_quick_start/wide_deep_movielens.ipynb
+++ b/examples/00_quick_start/wide_deep_movielens.ipynb
@@ -65,14 +65,14 @@
     "import tensorflow as tf\n",
     "tf.get_logger().setLevel('ERROR') # only show error messages\n",
     "\n",
-    "from reco_utils.common.constants import (\n",
+    "from reco_utils.utils.constants import (\n",
     "    DEFAULT_USER_COL as USER_COL,\n",
     "    DEFAULT_ITEM_COL as ITEM_COL,\n",
     "    DEFAULT_RATING_COL as RATING_COL,\n",
     "    DEFAULT_PREDICTION_COL as PREDICT_COL,\n",
     "    SEED\n",
     ")\n",
-    "from reco_utils.common import tf_utils, gpu_utils, plot\n",
+    "from reco_utils.utils import tf_utils, gpu_utils, plot\n",
     "from reco_utils.dataset import movielens\n",
     "from reco_utils.dataset.pandas_df_utils import user_item_pairs\n",
     "from reco_utils.dataset.python_splitters import python_random_split\n",
diff --git a/examples/00_quick_start/xdeepfm_criteo.ipynb b/examples/00_quick_start/xdeepfm_criteo.ipynb
index 8091941368..ae7d7f421a 100644
--- a/examples/00_quick_start/xdeepfm_criteo.ipynb
+++ b/examples/00_quick_start/xdeepfm_criteo.ipynb
@@ -53,7 +53,7 @@
     "import tensorflow as tf\n",
     "tf.get_logger().setLevel('ERROR') # only show error messages\n",
     "\n",
-    "from reco_utils.common.constants import SEED\n",
+    "from reco_utils.utils.constants import SEED\n",
     "from reco_utils.recommender.deeprec.deeprec_utils import (\n",
     "    download_deeprec_resources, prepare_hparams\n",
     ")\n",
diff --git a/examples/01_prepare_data/data_split.ipynb b/examples/01_prepare_data/data_split.ipynb
index 55922026bc..6119834d42 100644
--- a/examples/01_prepare_data/data_split.ipynb
+++ b/examples/01_prepare_data/data_split.ipynb
@@ -56,7 +56,7 @@
     "import numpy as np\n",
     "from datetime import datetime, timedelta\n",
     "\n",
-    "from reco_utils.common.spark_utils import start_or_get_spark\n",
+    "from reco_utils.utils.spark_utils import start_or_get_spark\n",
     "from reco_utils.dataset.download_utils import maybe_download\n",
     "from reco_utils.dataset.python_splitters import (\n",
     "    python_random_split, \n",
diff --git a/examples/02_model_collaborative_filtering/baseline_deep_dive.ipynb b/examples/02_model_collaborative_filtering/baseline_deep_dive.ipynb
index 72f3d9816a..d00ca8182c 100644
--- a/examples/02_model_collaborative_filtering/baseline_deep_dive.ipynb
+++ b/examples/02_model_collaborative_filtering/baseline_deep_dive.ipynb
@@ -70,7 +70,7 @@
     "import itertools\n",
     "import pandas as pd\n",
     "\n",
-    "from reco_utils.common.notebook_utils import is_jupyter\n",
+    "from reco_utils.utils.notebook_utils import is_jupyter\n",
     "from reco_utils.dataset import movielens\n",
     "from reco_utils.dataset.python_splitters import python_random_split\n",
     "from reco_utils.dataset.pandas_df_utils import filter_by\n",
diff --git a/examples/02_model_collaborative_filtering/cornac_bivae_deep_dive.ipynb b/examples/02_model_collaborative_filtering/cornac_bivae_deep_dive.ipynb
index 0e35bf35c8..df1b840a1b 100644
--- a/examples/02_model_collaborative_filtering/cornac_bivae_deep_dive.ipynb
+++ b/examples/02_model_collaborative_filtering/cornac_bivae_deep_dive.ipynb
@@ -55,8 +55,8 @@
     "from reco_utils.dataset.python_splitters import python_random_split\n",
     "from reco_utils.evaluation.python_evaluation import map_at_k, ndcg_at_k, precision_at_k, recall_at_k\n",
     "from reco_utils.recommender.cornac.cornac_utils import predict_ranking\n",
-    "from reco_utils.common.timer import Timer\n",
-    "from reco_utils.common.constants import SEED\n",
+    "from reco_utils.utils.timer import Timer\n",
+    "from reco_utils.utils.constants import SEED\n",
     "\n",
     "print(\"System version: {}\".format(sys.version))\n",
     "print(\"PyTorch version: {}\".format(torch.__version__))\n",
diff --git a/examples/02_model_collaborative_filtering/cornac_bpr_deep_dive.ipynb b/examples/02_model_collaborative_filtering/cornac_bpr_deep_dive.ipynb
index 2b79e67a52..29ab3f9fd1 100644
--- a/examples/02_model_collaborative_filtering/cornac_bpr_deep_dive.ipynb
+++ b/examples/02_model_collaborative_filtering/cornac_bpr_deep_dive.ipynb
@@ -53,8 +53,8 @@
     "from reco_utils.dataset.python_splitters import python_random_split\n",
     "from reco_utils.evaluation.python_evaluation import map_at_k, ndcg_at_k, precision_at_k, recall_at_k\n",
     "from reco_utils.recommender.cornac.cornac_utils import predict_ranking\n",
-    "from reco_utils.common.timer import Timer\n",
-    "from reco_utils.common.constants import SEED\n",
+    "from reco_utils.utils.timer import Timer\n",
+    "from reco_utils.utils.constants import SEED\n",
     "\n",
     "print(\"System version: {}\".format(sys.version))\n",
     "print(\"Cornac version: {}\".format(cornac.__version__))"
@@ -89,7 +89,7 @@
     "\n",
     "### 1.1 Personalized Ranking from Implicit Feedback\n",
     "\n",
-    "The task of personalized ranking aims at providing each user a ranked list of items (recommendations).  This is very common in scenarios where recommender systems are based on implicit user behavior (e.g. purchases, clicks).  The available observations are only positive feedback where the non-observed ones are a mixture of real negative feedback and missing values.\n",
+    "The task of personalized ranking aims at providing each user a ranked list of items (recommendations).  This is very utils in scenarios where recommender systems are based on implicit user behavior (e.g. purchases, clicks).  The available observations are only positive feedback where the non-observed ones are a mixture of real negative feedback and missing values.\n",
     "\n",
     "One usual approach for item recommendation is directly predicting a preference score $\\hat{x}_{u,i}$ given to item $i$ by user $u$.  BPR uses a different approach by using item pairs $(i, j)$ and optimizing for the correct ranking given preference of user $u$, thus, there are notions of *positive* and *negative* items.  The training data $D_S : U \\times I \\times I$ is defined as:\n",
     "\n",
@@ -118,7 +118,7 @@
     "\n",
     "The preference scoring function $\\hat{x}_{uij}(\\Theta)$ could be an arbitrary real-valued function of the model parameter $\\Theta$.  Thus, it makes BPR a general framework for modeling the relationship between triplets $(u, i, j)$ where different model classes like matrix factorization could be used for estimating $\\hat{x}_{uij}(\\Theta)$.\n",
     "\n",
-    "For the prior, one of the common pratices is to choose $p(\\Theta)$ following a normal distribution, which results in a nice form of L2 regularization in the final log-form of the objective function.\n",
+    "For the prior, one of the utils pratices is to choose $p(\\Theta)$ following a normal distribution, which results in a nice form of L2 regularization in the final log-form of the objective function.\n",
     "\n",
     "$$ p(\\Theta) \\sim N(0, \\Sigma_{\\Theta}) $$\n",
     "\n",
diff --git a/examples/02_model_collaborative_filtering/lightgcn_deep_dive.ipynb b/examples/02_model_collaborative_filtering/lightgcn_deep_dive.ipynb
index ba3fe2754b..9671ca4fdf 100644
--- a/examples/02_model_collaborative_filtering/lightgcn_deep_dive.ipynb
+++ b/examples/02_model_collaborative_filtering/lightgcn_deep_dive.ipynb
@@ -52,13 +52,13 @@
     "import tensorflow as tf\n",
     "tf.get_logger().setLevel('ERROR') # only show error messages\n",
     "\n",
-    "from reco_utils.common.timer import Timer\n",
+    "from reco_utils.utils.timer import Timer\n",
     "from reco_utils.recommender.deeprec.models.graphrec.lightgcn import LightGCN\n",
     "from reco_utils.recommender.deeprec.DataModel.ImplicitCF import ImplicitCF\n",
     "from reco_utils.dataset import movielens\n",
     "from reco_utils.dataset.python_splitters import python_stratified_split\n",
     "from reco_utils.evaluation.python_evaluation import map_at_k, ndcg_at_k, precision_at_k, recall_at_k\n",
-    "from reco_utils.common.constants import SEED as DEFAULT_SEED\n",
+    "from reco_utils.utils.constants import SEED as DEFAULT_SEED\n",
     "from reco_utils.recommender.deeprec.deeprec_utils import prepare_hparams\n",
     "\n",
     "print(\"System version: {}\".format(sys.version))\n",
@@ -728,7 +728,7 @@
     "\n",
     "Here there are the performances of LightGCN compared to [SAR](../00_quick_start/sar_movielens.ipynb) and [NCF](../00_quick_start/ncf_movielens.ipynb) on MovieLens dataset of 100k and 1m. The method of data loading and splitting is the same as that described above and the GPU used was a GeForce GTX 1080Ti.\n",
     "\n",
-    "Settings common to the three models: `epochs=15, seed=42`.\n",
+    "Settings utils to the three models: `epochs=15, seed=42`.\n",
     "\n",
     "Settings for LightGCN: `embed_size=64, n_layers=3, batch_size=1024, decay=0.0001, learning_rate=0.015 `.\n",
     "\n",
diff --git a/examples/02_model_collaborative_filtering/multi_vae_deep_dive.ipynb b/examples/02_model_collaborative_filtering/multi_vae_deep_dive.ipynb
index 84b2c886fa..b2b94f6b5a 100644
--- a/examples/02_model_collaborative_filtering/multi_vae_deep_dive.ipynb
+++ b/examples/02_model_collaborative_filtering/multi_vae_deep_dive.ipynb
@@ -96,14 +96,14 @@
     "import tensorflow as tf\n",
     "import keras\n",
     "\n",
-    "from reco_utils.common.timer import Timer\n",
+    "from reco_utils.utils.timer import Timer\n",
     "from reco_utils.dataset import movielens\n",
     "from reco_utils.dataset.split_utils import min_rating_filter_pandas\n",
     "from reco_utils.dataset.python_splitters import numpy_stratified_split\n",
     "from reco_utils.evaluation.python_evaluation import map_at_k, ndcg_at_k, precision_at_k, recall_at_k\n",
     "\n",
     "from reco_utils.dataset.sparse import AffinityMatrix\n",
-    "from reco_utils.common.python_utils import binarize\n",
+    "from reco_utils.utils.python_utils import binarize\n",
     "from reco_utils.recommender.vae.multinomial_vae import Mult_VAE\n",
     "\n",
     "from tempfile import TemporaryDirectory\n",
diff --git a/examples/02_model_collaborative_filtering/standard_vae_deep_dive.ipynb b/examples/02_model_collaborative_filtering/standard_vae_deep_dive.ipynb
index 328b77a4e3..e3423c070e 100644
--- a/examples/02_model_collaborative_filtering/standard_vae_deep_dive.ipynb
+++ b/examples/02_model_collaborative_filtering/standard_vae_deep_dive.ipynb
@@ -96,15 +96,15 @@
     "import tensorflow as tf\n",
     "import keras\n",
     "\n",
-    "from reco_utils.common.timer import Timer\n",
+    "from reco_utils.utils.timer import Timer\n",
     "from reco_utils.dataset import movielens\n",
     "from reco_utils.dataset.split_utils import min_rating_filter_pandas\n",
     "from reco_utils.dataset.python_splitters import numpy_stratified_split\n",
     "from reco_utils.evaluation.python_evaluation import map_at_k, ndcg_at_k, precision_at_k, recall_at_k\n",
-    "from reco_utils.common.constants import SEED as DEFAULT_SEED\n",
+    "from reco_utils.utils.constants import SEED as DEFAULT_SEED\n",
     "\n",
     "from reco_utils.dataset.sparse import AffinityMatrix\n",
-    "from reco_utils.common.python_utils import binarize\n",
+    "from reco_utils.utils.python_utils import binarize\n",
     "from reco_utils.recommender.vae.standard_vae import StandardVAE\n",
     "\n",
     "print(\"System version: {}\".format(sys.version))\n",
diff --git a/examples/02_model_collaborative_filtering/surprise_svd_deep_dive.ipynb b/examples/02_model_collaborative_filtering/surprise_svd_deep_dive.ipynb
index f048bd5f9a..5e804a9ecc 100644
--- a/examples/02_model_collaborative_filtering/surprise_svd_deep_dive.ipynb
+++ b/examples/02_model_collaborative_filtering/surprise_svd_deep_dive.ipynb
@@ -105,7 +105,7 @@
     "import scrapbook as sb\n",
     "import pandas as pd\n",
     "\n",
-    "from reco_utils.common.timer import Timer\n",
+    "from reco_utils.utils.timer import Timer\n",
     "from reco_utils.dataset import movielens\n",
     "from reco_utils.dataset.python_splitters import python_random_split\n",
     "from reco_utils.evaluation.python_evaluation import (rmse, mae, rsquared, exp_var, map_at_k, ndcg_at_k, precision_at_k, \n",
diff --git a/examples/02_model_content_based_filtering/mmlspark_lightgbm_criteo.ipynb b/examples/02_model_content_based_filtering/mmlspark_lightgbm_criteo.ipynb
index 05d56122a2..b10283149c 100644
--- a/examples/02_model_content_based_filtering/mmlspark_lightgbm_criteo.ipynb
+++ b/examples/02_model_content_based_filtering/mmlspark_lightgbm_criteo.ipynb
@@ -71,8 +71,8 @@
     "import papermill as pm\n",
     "import scrapbook as sb\n",
     "\n",
-    "from reco_utils.common.spark_utils import start_or_get_spark\n",
-    "from reco_utils.common.notebook_utils import is_databricks\n",
+    "from reco_utils.utils.spark_utils import start_or_get_spark\n",
+    "from reco_utils.utils.notebook_utils import is_databricks\n",
     "from reco_utils.dataset.criteo import load_spark_df\n",
     "from reco_utils.dataset.spark_splitters import spark_random_split\n",
     "\n",
diff --git a/examples/02_model_content_based_filtering/vowpal_wabbit_deep_dive.ipynb b/examples/02_model_content_based_filtering/vowpal_wabbit_deep_dive.ipynb
index 5e48dc1a86..52ea265657 100644
--- a/examples/02_model_content_based_filtering/vowpal_wabbit_deep_dive.ipynb
+++ b/examples/02_model_content_based_filtering/vowpal_wabbit_deep_dive.ipynb
@@ -86,7 +86,7 @@
     "import papermill as pm\n",
     "import scrapbook as sb\n",
     "\n",
-    "from reco_utils.common.notebook_utils import is_jupyter\n",
+    "from reco_utils.utils.notebook_utils import is_jupyter\n",
     "from reco_utils.dataset.movielens import load_pandas_df\n",
     "from reco_utils.dataset.python_splitters import python_random_split\n",
     "from reco_utils.evaluation.python_evaluation import (rmse, mae, exp_var, rsquared, get_top_k_items,\n",
diff --git a/examples/02_model_hybrid/fm_deep_dive.ipynb b/examples/02_model_hybrid/fm_deep_dive.ipynb
index eb1754bed2..a22046f85f 100644
--- a/examples/02_model_hybrid/fm_deep_dive.ipynb
+++ b/examples/02_model_hybrid/fm_deep_dive.ipynb
@@ -251,8 +251,8 @@
     "%matplotlib notebook\n",
     "from matplotlib import pyplot as plt\n",
     "\n",
-    "from reco_utils.common.constants import SEED\n",
-    "from reco_utils.common.timer import Timer\n",
+    "from reco_utils.utils.constants import SEED\n",
+    "from reco_utils.utils.timer import Timer\n",
     "from reco_utils.dataset.download_utils import maybe_download, unzip_file\n",
     "from reco_utils.tuning.parameter_sweep import generate_param_grid\n",
     "from reco_utils.dataset.pandas_df_utils import LibffmConverter\n",
diff --git a/examples/02_model_hybrid/ncf_deep_dive.ipynb b/examples/02_model_hybrid/ncf_deep_dive.ipynb
index f423cf2abf..4f0e3f3894 100644
--- a/examples/02_model_hybrid/ncf_deep_dive.ipynb
+++ b/examples/02_model_hybrid/ncf_deep_dive.ipynb
@@ -53,14 +53,14 @@
     "import tensorflow as tf\n",
     "tf.get_logger().setLevel('ERROR') # only show error messages\n",
     "\n",
-    "from reco_utils.common.timer import Timer\n",
+    "from reco_utils.utils.timer import Timer\n",
     "from reco_utils.recommender.ncf.ncf_singlenode import NCF\n",
     "from reco_utils.recommender.ncf.dataset import Dataset as NCFDataset\n",
     "from reco_utils.dataset import movielens\n",
     "from reco_utils.dataset.python_splitters import python_chrono_split\n",
     "from reco_utils.evaluation.python_evaluation import (rmse, mae, rsquared, exp_var, map_at_k, ndcg_at_k, precision_at_k, \n",
     "                                                     recall_at_k, get_top_k_items)\n",
-    "from reco_utils.common.constants import SEED as DEFAULT_SEED\n",
+    "from reco_utils.utils.constants import SEED as DEFAULT_SEED\n",
     "\n",
     "\n",
     "print(\"System version: {}\".format(sys.version))\n",
@@ -196,7 +196,7 @@
     "\n",
     "To evaluate the performance of item recommendation, we adopted the leave-one-out evaluation.\n",
     "\n",
-    "For each user, we held out his/her latest interaction as the test set and utilized the remaining data for training. We use `python_chrono_split` to achieve this. And since it is too time-consuming to rank all items for every user during evaluation, we followed the common strategy that randomly samples 100 items that are not interacted by the user, ranking the test item among the 100 items. Our test samples will be constructed by `NCFDataset`."
+    "For each user, we held out his/her latest interaction as the test set and utilized the remaining data for training. We use `python_chrono_split` to achieve this. And since it is too time-consuming to rank all items for every user during evaluation, we followed the utils strategy that randomly samples 100 items that are not interacted by the user, ranking the test item among the 100 items. Our test samples will be constructed by `NCFDataset`."
    ]
   },
   {
diff --git a/examples/03_evaluate/als_movielens_diversity_metrics.ipynb b/examples/03_evaluate/als_movielens_diversity_metrics.ipynb
index ab6269b660..1733c06b1f 100644
--- a/examples/03_evaluate/als_movielens_diversity_metrics.ipynb
+++ b/examples/03_evaluate/als_movielens_diversity_metrics.ipynb
@@ -68,12 +68,12 @@
     "from pyspark.sql.types import StructType, StructField\n",
     "from pyspark.sql.types import StringType, FloatType, IntegerType, LongType\n",
     "\n",
-    "from reco_utils.common.timer import Timer\n",
+    "from reco_utils.utils.timer import Timer\n",
     "from reco_utils.dataset import movielens\n",
-    "from reco_utils.common.notebook_utils import is_jupyter\n",
+    "from reco_utils.utils.notebook_utils import is_jupyter\n",
     "from reco_utils.dataset.spark_splitters import spark_random_split\n",
     "from reco_utils.evaluation.spark_evaluation import SparkRatingEvaluation, SparkRankingEvaluation\n",
-    "from reco_utils.common.spark_utils import start_or_get_spark\n",
+    "from reco_utils.utils.spark_utils import start_or_get_spark\n",
     "\n",
     "from reco_utils.evaluation.spark_diversity_evaluation import DiversityEvaluation\n",
     "from pyspark.sql.window import Window\n",
diff --git a/examples/03_evaluate/evaluation.ipynb b/examples/03_evaluate/evaluation.ipynb
index 4e9a6ea0f4..3187053fee 100644
--- a/examples/03_evaluate/evaluation.ipynb
+++ b/examples/03_evaluate/evaluation.ipynb
@@ -63,7 +63,7 @@
     "import pyspark\n",
     "from sklearn.preprocessing import minmax_scale\n",
     "\n",
-    "from reco_utils.common.spark_utils import start_or_get_spark\n",
+    "from reco_utils.utils.spark_utils import start_or_get_spark\n",
     "from reco_utils.evaluation.spark_evaluation import SparkRankingEvaluation, SparkRatingEvaluation\n",
     "from reco_utils.evaluation.python_evaluation import auc, logloss\n",
     "\n",
diff --git a/examples/04_model_select_and_optimize/azureml_hyperdrive_wide_and_deep.ipynb b/examples/04_model_select_and_optimize/azureml_hyperdrive_wide_and_deep.ipynb
index e884104cf1..5f3d4b2538 100644
--- a/examples/04_model_select_and_optimize/azureml_hyperdrive_wide_and_deep.ipynb
+++ b/examples/04_model_select_and_optimize/azureml_hyperdrive_wide_and_deep.ipynb
@@ -85,9 +85,9 @@
     "import azureml.widgets as widgets\n",
     "import azureml.train.hyperdrive as hd\n",
     "\n",
-    "from reco_utils.common.timer import Timer\n",
-    "from reco_utils.common.constants import SEED\n",
-    "from reco_utils.common.tf_utils import pandas_input_fn_for_saved_model\n",
+    "from reco_utils.utils.timer import Timer\n",
+    "from reco_utils.utils.constants import SEED\n",
+    "from reco_utils.utils.tf_utils import pandas_input_fn_for_saved_model\n",
     "from reco_utils.dataset import movielens\n",
     "from reco_utils.dataset.pandas_df_utils import user_item_pairs\n",
     "from reco_utils.dataset.python_splitters import python_random_split\n",
diff --git a/examples/04_model_select_and_optimize/nni_ncf.ipynb b/examples/04_model_select_and_optimize/nni_ncf.ipynb
index cbbd081888..396691f33b 100644
--- a/examples/04_model_select_and_optimize/nni_ncf.ipynb
+++ b/examples/04_model_select_and_optimize/nni_ncf.ipynb
@@ -67,7 +67,7 @@
     "tf.get_logger().setLevel('ERROR') # only show error messages\n",
     "\n",
     "import reco_utils\n",
-    "from reco_utils.common.timer import Timer\n",
+    "from reco_utils.utils.timer import Timer\n",
     "from reco_utils.dataset import movielens\n",
     "from reco_utils.dataset.python_splitters import python_chrono_split\n",
     "from reco_utils.evaluation.python_evaluation import rmse, precision_at_k, ndcg_at_k\n",
diff --git a/examples/04_model_select_and_optimize/nni_surprise_svd.ipynb b/examples/04_model_select_and_optimize/nni_surprise_svd.ipynb
index 87fc0ac02e..80fa152563 100644
--- a/examples/04_model_select_and_optimize/nni_surprise_svd.ipynb
+++ b/examples/04_model_select_and_optimize/nni_surprise_svd.ipynb
@@ -61,7 +61,7 @@
     "from tempfile import TemporaryDirectory\n",
     "\n",
     "import reco_utils\n",
-    "from reco_utils.common.timer import Timer\n",
+    "from reco_utils.utils.timer import Timer\n",
     "from reco_utils.dataset import movielens\n",
     "from reco_utils.dataset.python_splitters import python_random_split\n",
     "from reco_utils.evaluation.python_evaluation import rmse, precision_at_k, ndcg_at_k\n",
diff --git a/examples/04_model_select_and_optimize/train_scripts/wide_deep_training.py b/examples/04_model_select_and_optimize/train_scripts/wide_deep_training.py
index c5e0462c7a..6e7af2074c 100644
--- a/examples/04_model_select_and_optimize/train_scripts/wide_deep_training.py
+++ b/examples/04_model_select_and_optimize/train_scripts/wide_deep_training.py
@@ -19,7 +19,7 @@
 except ImportError:
     run = None
 
-from reco_utils.common.constants import (
+from reco_utils.utils.constants import (
     DEFAULT_USER_COL,
     DEFAULT_ITEM_COL,
     DEFAULT_RATING_COL,
diff --git a/examples/04_model_select_and_optimize/tuning_spark_als.ipynb b/examples/04_model_select_and_optimize/tuning_spark_als.ipynb
index 6ac74eb4d0..bec2b4c872 100644
--- a/examples/04_model_select_and_optimize/tuning_spark_als.ipynb
+++ b/examples/04_model_select_and_optimize/tuning_spark_als.ipynb
@@ -81,8 +81,8 @@
     "from hyperopt.pyll.base import scope\n",
     "from hyperopt.pyll.stochastic import sample\n",
     "\n",
-    "from reco_utils.common.timer import Timer\n",
-    "from reco_utils.common.spark_utils import start_or_get_spark\n",
+    "from reco_utils.utils.timer import Timer\n",
+    "from reco_utils.utils.spark_utils import start_or_get_spark\n",
     "from reco_utils.evaluation.spark_evaluation import SparkRankingEvaluation, SparkRatingEvaluation\n",
     "from reco_utils.dataset.movielens import load_spark_df\n",
     "from reco_utils.dataset.spark_splitters import spark_random_split\n",
diff --git a/examples/05_operationalize/als_movie_o16n.ipynb b/examples/05_operationalize/als_movie_o16n.ipynb
index 6e519d5b7f..a8c5097e87 100644
--- a/examples/05_operationalize/als_movie_o16n.ipynb
+++ b/examples/05_operationalize/als_movie_o16n.ipynb
@@ -78,7 +78,7 @@
     
     "import urllib\n",
     "\n",
-    "from azure.common.client_factory import get_client_from_cli_profile\n",
+    "from azure.utils.client_factory import get_client_from_cli_profile\n",
     "import azure.mgmt.cosmosdb\n",
     "import azureml.core\n",
     "from azureml.core import Workspace\n",
@@ -96,14 +96,14 @@
     "from pyspark.sql.types import StructType, StructField\n",
     "from pyspark.sql.types import FloatType, IntegerType, LongType\n",
     "\n",
-    "from reco_utils.common.timer import Timer\n",
-    "from reco_utils.common.spark_utils import start_or_get_spark\n",
+    "from reco_utils.utils.timer import Timer\n",
+    "from reco_utils.utils.spark_utils import start_or_get_spark\n",
     "from reco_utils.dataset import movielens\n",
     "from reco_utils.dataset.cosmos_cli import find_collection, read_collection, read_database, find_database\n",
     "from reco_utils.dataset.download_utils import maybe_download\n",
     "from reco_utils.dataset.spark_splitters import spark_random_split\n",
     "from reco_utils.evaluation.spark_evaluation import SparkRatingEvaluation, SparkRankingEvaluation\n",
-    "from reco_utils.common.notebook_utils import is_databricks\n",
+    "from reco_utils.utils.notebook_utils import is_databricks\n",
     "\n",
     "print(\"Azure SDK version:\", azureml.core.VERSION)"
    ]
@@ -165,7 +165,7 @@
     "1. [Azure ML Service](https://azure.microsoft.com/en-us/services/machine-learning-service/)\n",
     "    1. [Azure ML Workspace](https://docs.microsoft.com/en-us/azure/machine-learning/concept-workspace)\n",
     "    1. [Azure Application Insights](https://azure.microsoft.com/en-us/services/monitor/)\n",
-    "    1. [Azure Storage](https://docs.microsoft.com/en-us/azure/storage/common/storage-account-overview)\n",
+    "    1. [Azure Storage](https://docs.microsoft.com/en-us/azure/storage/utils/storage-account-overview)\n",
     "    1. [Azure Key Vault](https://azure.microsoft.com/en-us/services/key-vault/)    \n",
     "\n",
     "1. [Azure Cosmos DB](https://azure.microsoft.com/en-us/services/cosmos-db/)\n",
diff --git a/examples/05_operationalize/lightgbm_criteo_o16n.ipynb b/examples/05_operationalize/lightgbm_criteo_o16n.ipynb
index d988506c8b..3f6948e5fc 100644
--- a/examples/05_operationalize/lightgbm_criteo_o16n.ipynb
+++ b/examples/05_operationalize/lightgbm_criteo_o16n.ipynb
@@ -95,7 +95,7 @@
     "import shutil\n",
     "\n",
     "from reco_utils.dataset.criteo import get_spark_schema, load_spark_df\n",
-    "from reco_utils.common.k8s_utils import qps_to_replicas, replicas_to_qps, nodes_to_replicas\n",
+    "from reco_utils.utils.k8s_utils import qps_to_replicas, replicas_to_qps, nodes_to_replicas\n",
     "\n",
     "from azureml.core import Workspace\n",
     "from azureml.core import VERSION as azureml_version\n",
diff --git a/examples/06_benchmarks/benchmark_utils.py b/examples/06_benchmarks/benchmark_utils.py
index 20f09bef63..26309b044c 100644
--- a/examples/06_benchmarks/benchmark_utils.py
+++ b/examples/06_benchmarks/benchmark_utils.py
@@ -7,7 +7,7 @@
 import surprise
 import cornac
 
-from reco_utils.common.constants import (
+from reco_utils.utils.constants import (
     COL_DICT,
     DEFAULT_K,
     DEFAULT_USER_COL,
@@ -17,8 +17,8 @@
     DEFAULT_TIMESTAMP_COL,
     SEED,
 )
-from reco_utils.common.timer import Timer
-from reco_utils.common.spark_utils import start_or_get_spark
+from reco_utils.utils.timer import Timer
+from reco_utils.utils.spark_utils import start_or_get_spark
 from reco_utils.recommender.sar.sar_singlenode import SARSingleNode
 from reco_utils.recommender.ncf.ncf_singlenode import NCF
 from reco_utils.recommender.ncf.dataset import Dataset as NCFDataset
@@ -44,12 +44,7 @@
     precision_at_k,
     recall_at_k,
 )
-from reco_utils.evaluation.python_evaluation import (
-    rmse,
-    mae,
-    rsquared,
-    exp_var
-)
+from reco_utils.evaluation.python_evaluation import rmse, mae, rsquared, exp_var
 
 
 def prepare_training_als(train, test):
@@ -82,8 +77,7 @@ def prepare_metrics_als(train, test):
         )
     )
     spark = start_or_get_spark()
-    return spark.createDataFrame(train, schema), spark.createDataFrame(test,
-                                                                       schema)
+    return spark.createDataFrame(train, schema), spark.createDataFrame(test, schema)
 
 
 def predict_als(model, test):
@@ -172,10 +166,7 @@ def prepare_training_fastai(train, test):
 
 def train_fastai(params, data):
     model = collab_learner(
-        data,
-        n_factors=params["n_factors"],
-        y_range=params["y_range"],
-        wd=params["wd"]
+        data, n_factors=params["n_factors"], y_range=params["y_range"], wd=params["wd"]
     )
     with Timer() as t:
         model.fit_one_cycle(cyc_len=params["epochs"], max_lr=params["max_lr"])
@@ -267,10 +258,7 @@ def recommend_k_ncf(model, test, train, top_k=DEFAULT_K, remove_seen=True):
             }
         )
         merged = pd.merge(
-            train,
-            topk_scores,
-            on=[DEFAULT_USER_COL, DEFAULT_ITEM_COL],
-            how="outer"
+            train, topk_scores, on=[DEFAULT_USER_COL, DEFAULT_ITEM_COL], how="outer"
         )
         topk_scores = merged[merged[DEFAULT_RATING_COL].isnull()].drop(
             DEFAULT_RATING_COL, axis=1
@@ -280,8 +268,7 @@ def recommend_k_ncf(model, test, train, top_k=DEFAULT_K, remove_seen=True):
 
 def prepare_training_cornac(train, test):
     return cornac.data.Dataset.from_uir(
-        train.drop(DEFAULT_TIMESTAMP_COL, axis=1).itertuples(index=False),
-        seed=SEED
+        train.drop(DEFAULT_TIMESTAMP_COL, axis=1).itertuples(index=False), seed=SEED
     )
 
 
@@ -344,11 +331,7 @@ def train_lightgcn(params, data):
     return model, t
 
 
-def recommend_k_lightgcn(model,
-                         test,
-                         train,
-                         top_k=DEFAULT_K,
-                         remove_seen=True):
+def recommend_k_lightgcn(model, test, train, top_k=DEFAULT_K, remove_seen=True):
     with Timer() as t:
         topk_scores = model.recommend_k_items(
             test, top_k=top_k, remove_seen=remove_seen
diff --git a/examples/06_benchmarks/movielens.ipynb b/examples/06_benchmarks/movielens.ipynb
index 780cea7ea8..f82ada1599 100644
--- a/examples/06_benchmarks/movielens.ipynb
+++ b/examples/06_benchmarks/movielens.ipynb
@@ -106,8 +106,8 @@
     "tf.get_logger().setLevel('ERROR') # only show error messages\n",
     "import surprise\n",
     "\n",
-    "from reco_utils.common.general_utils import get_number_processors\n",
-    "from reco_utils.common.gpu_utils import get_cuda_version, get_cudnn_version\n",
+    "from reco_utils.utils.general_utils import get_number_processors\n",
+    "from reco_utils.utils.gpu_utils import get_cuda_version, get_cudnn_version\n",
     "from reco_utils.dataset import movielens\n",
     "from reco_utils.dataset.python_splitters import python_stratified_split\n",
     "\n",
diff --git a/examples/07_tutorials/KDD2020-tutorial/step5_run_lightgcn.ipynb b/examples/07_tutorials/KDD2020-tutorial/step5_run_lightgcn.ipynb
index fb7ab59160..68b5f0e4c2 100644
--- a/examples/07_tutorials/KDD2020-tutorial/step5_run_lightgcn.ipynb
+++ b/examples/07_tutorials/KDD2020-tutorial/step5_run_lightgcn.ipynb
@@ -36,13 +36,13 @@
     "import pandas as pd\n",
     "import numpy as np\n",
     "import tensorflow as tf\n",
-    "from reco_utils.common.timer import Timer\n",
+    "from reco_utils.utils.timer import Timer\n",
     "from reco_utils.recommender.deeprec.models.graphrec.lightgcn import LightGCN\n",
     "from reco_utils.recommender.deeprec.DataModel.ImplicitCF import ImplicitCF\n",
     "from reco_utils.dataset import movielens\n",
     "from reco_utils.dataset.python_splitters import python_stratified_split\n",
     "from reco_utils.evaluation.python_evaluation import map_at_k, ndcg_at_k, precision_at_k, recall_at_k\n",
-    "from reco_utils.common.constants import SEED as DEFAULT_SEED\n",
+    "from reco_utils.utils.constants import SEED as DEFAULT_SEED\n",
     "from reco_utils.recommender.deeprec.deeprec_utils import prepare_hparams\n",
     "from reco_utils.recommender.deeprec.deeprec_utils import cal_metric\n",
     "from utils.general import *\n",
diff --git a/reco_utils/README.md b/reco_utils/README.md
index 2d2a5d54fe..30535788f3 100644
--- a/reco_utils/README.md
+++ b/reco_utils/README.md
@@ -84,7 +84,7 @@ It is also possible to install directly from GitHub. Or from a specific branch a
 
 # Contents
 
-## [Common](common)
+## [Utils](utils)
 
 This submodule contains high-level utilities for defining constants used in most algorithms as well as helper functions for managing aspects of different frameworks: GPU, Spark, Jupyter notebook.
 
diff --git a/reco_utils/dataset/amazon_reviews.py b/reco_utils/dataset/amazon_reviews.py
index 5b360d1ffc..75f70215e2 100644
--- a/reco_utils/dataset/amazon_reviews.py
+++ b/reco_utils/dataset/amazon_reviews.py
@@ -11,7 +11,7 @@
 import logging
 import _pickle as cPickle
 
-from reco_utils.common.constants import SEED
+from reco_utils.utils.constants import SEED
 from reco_utils.dataset.download_utils import maybe_download, download_path
 
 
diff --git a/reco_utils/dataset/criteo.py b/reco_utils/dataset/criteo.py
index 675c8a42dc..36e435a64a 100644
--- a/reco_utils/dataset/criteo.py
+++ b/reco_utils/dataset/criteo.py
@@ -12,7 +12,7 @@
     pass  # so the environment without spark doesn't break
 
 from reco_utils.dataset.download_utils import maybe_download, download_path
-from reco_utils.common.notebook_utils import is_databricks
+from reco_utils.utils.notebook_utils import is_databricks
 
 
 CRITEO_URL = {
@@ -40,11 +40,11 @@ def load_pandas_df(size="sample", local_cache_path=None, header=DEFAULT_HEADER):
     The schema is:
 
     .. code-block:: python
-        
+
         <label> <integer feature 1> ... <integer feature 13> <categorical feature 1> ... <categorical feature 26>
 
-    More details (need to accept user terms to see the information): 
-    http://labs.criteo.com/2013/12/download-terabyte-click-logs/ 
+    More details (need to accept user terms to see the information):
+    http://labs.criteo.com/2013/12/download-terabyte-click-logs/
 
     Args:
         size (str): Dataset size. It can be "sample" or "full".
@@ -80,13 +80,13 @@ def load_spark_df(
     onto 32 bits for anonymization purposes.
 
     The schema is:
-    
+
     .. code-block:: python
-        
+
         <label> <integer feature 1> ... <integer feature 13> <categorical feature 1> ... <categorical feature 26>
 
-    More details (need to accept user terms to see the information): 
-    http://labs.criteo.com/2013/12/download-terabyte-click-logs/ 
+    More details (need to accept user terms to see the information):
+    http://labs.criteo.com/2013/12/download-terabyte-click-logs/
 
     Args:
         spark (pySpark.SparkSession): Spark session.
@@ -95,7 +95,7 @@ def load_spark_df(
         header (list): Dataset header names.
         dbfs_datapath (str): Where to store the extracted files on Databricks.
         dbutils (Databricks.dbutils): Databricks utility object.
-  
+
     Returns:
         pyspark.sql.DataFrame: Criteo DAC training dataset.
     """
@@ -145,10 +145,10 @@ def extract_criteo(size, compressed_file, path=None):
         size (str): Size of Criteo dataset. It can be "full" or "sample".
         compressed_file (str): Path to compressed file.
         path (str): Path to extract the file.
-    
+
     Returns:
         str: Path to the extracted file.
-    
+
     """
     if path is None:
         folder = os.path.dirname(compressed_file)
diff --git a/reco_utils/dataset/movielens.py b/reco_utils/dataset/movielens.py
index e35a7398b0..bc2e4077cd 100644
--- a/reco_utils/dataset/movielens.py
+++ b/reco_utils/dataset/movielens.py
@@ -8,8 +8,8 @@
 import pandas as pd
 from zipfile import ZipFile
 from reco_utils.dataset.download_utils import maybe_download, download_path
-from reco_utils.common.notebook_utils import is_databricks
-from reco_utils.common.constants import (
+from reco_utils.utils.notebook_utils import is_databricks
+from reco_utils.utils.constants import (
     DEFAULT_USER_COL,
     DEFAULT_ITEM_COL,
     DEFAULT_RATING_COL,
@@ -151,7 +151,7 @@ def load_pandas_df(
     """Loads the MovieLens dataset as pd.DataFrame.
 
     Download the dataset from http://files.grouplens.org/datasets/movielens, unzip, and load.
-    To load movie information only, you can use load_item_df function. 
+    To load movie information only, you can use load_item_df function.
 
     Args:
         size (str): Size of the data to load. One of ("100k", "1m", "10m", "20m").
@@ -165,12 +165,12 @@ def load_pandas_df(
 
     Returns:
         pandas.DataFrame: Movie rating dataset.
-        
+
 
     **Examples**
 
     .. code-block:: python
-    
+
         # To load just user-id, item-id, and ratings from MovieLens-1M dataset,
         df = load_pandas_df('1m', ('UserId', 'ItemId', 'Rating'))
 
@@ -345,14 +345,14 @@ def load_spark_df(
 
     Download the dataset from http://files.grouplens.org/datasets/movielens, unzip, and load as `pyspark.sql.DataFrame`.
 
-    To load movie information only, you can use `load_item_df` function. 
+    To load movie information only, you can use `load_item_df` function.
 
     Args:
         spark (pyspark.SparkSession): Spark session.
         size (str): Size of the data to load. One of ("100k", "1m", "10m", "20m").
         header (list or tuple): Rating dataset header.
             If schema is provided, this argument is ignored.
-        schema (pyspark.StructType): Dataset schema. 
+        schema (pyspark.StructType): Dataset schema.
         local_cache_path (str): Path (directory or a zip file) to cache the downloaded zip file.
             If None, all the intermediate files will be stored in a temporary directory and removed after use.
         dbutils (Databricks.dbutils): Databricks utility object
@@ -363,11 +363,11 @@ def load_spark_df(
 
     Returns:
         pyspark.sql.DataFrame: Movie rating dataset.
-        
+
     **Examples**
 
     .. code-block:: python
-    
+
         # To load just user-id, item-id, and ratings from MovieLens-1M dataset:
         spark_df = load_spark_df(spark, '1m', ('UserId', 'ItemId', 'Rating'))
 
diff --git a/reco_utils/dataset/pandas_df_utils.py b/reco_utils/dataset/pandas_df_utils.py
index 4f22d4bd33..ca9c1bb1f9 100644
--- a/reco_utils/dataset/pandas_df_utils.py
+++ b/reco_utils/dataset/pandas_df_utils.py
@@ -6,7 +6,7 @@
 import numpy as np
 from functools import lru_cache, wraps
 
-from reco_utils.common.constants import (
+from reco_utils.utils.constants import (
     DEFAULT_USER_COL,
     DEFAULT_ITEM_COL,
     DEFAULT_RATING_COL,
diff --git a/reco_utils/dataset/python_splitters.py b/reco_utils/dataset/python_splitters.py
index 6a76bb9a72..e66083134d 100644
--- a/reco_utils/dataset/python_splitters.py
+++ b/reco_utils/dataset/python_splitters.py
@@ -4,7 +4,7 @@
 import pandas as pd
 from sklearn.model_selection import train_test_split as sk_split
 
-from reco_utils.common.constants import (
+from reco_utils.utils.constants import (
     DEFAULT_ITEM_COL,
     DEFAULT_USER_COL,
     DEFAULT_TIMESTAMP_COL,
@@ -245,8 +245,8 @@ def numpy_stratified_split(X, ratio=0.75, seed=42):
         seed (int): random seed
 
     Returns:
-        numpy.ndarray, numpy.ndarray: 
-        - Xtr: The train set user/item affinity matrix. 
+        numpy.ndarray, numpy.ndarray:
+        - Xtr: The train set user/item affinity matrix.
         - Xtst: The test set user/item affinity matrix.
     """
 
diff --git a/reco_utils/dataset/spark_splitters.py b/reco_utils/dataset/spark_splitters.py
index 4e6c32210d..a7012e2137 100644
--- a/reco_utils/dataset/spark_splitters.py
+++ b/reco_utils/dataset/spark_splitters.py
@@ -8,7 +8,7 @@
 except ImportError:
     pass  # skip this import if we are in pure python environment
 
-from reco_utils.common.constants import (
+from reco_utils.utils.constants import (
     DEFAULT_ITEM_COL,
     DEFAULT_USER_COL,
     DEFAULT_TIMESTAMP_COL,
@@ -19,15 +19,15 @@
 
 def spark_random_split(data, ratio=0.75, seed=42):
     """Spark random splitter.
-    
+
     Randomly split the data into several splits.
 
     Args:
         data (pyspark.sql.DataFrame): Spark DataFrame to be split.
         ratio (float or list): Ratio for splitting data. If it is a single float number
-            it splits data into two halves and the ratio argument indicates the ratio of 
-            training data set; if it is a list of float numbers, the splitter splits 
-            data into several portions corresponding to the split ratios. If a list 
+            it splits data into two halves and the ratio argument indicates the ratio of
+            training data set; if it is a list of float numbers, the splitter splits
+            data into several portions corresponding to the split ratios. If a list
             is provided and the ratios are not summed to 1, they will be normalized.
         seed (int): Seed.
 
@@ -56,30 +56,30 @@ def _do_stratification_spark(
 ):
     """Helper function to perform stratified splits.
 
-        This function splits data in a stratified manner. That is, the same values for the
-        filter_by column are retained in each split, but the corresponding set of entries
-        are divided according to the ratio provided.
-
-        Args:
-            data (pyspark.sql.DataFrame): Spark DataFrame to be split.
-            ratio (float or list): Ratio for splitting data. If it is a single float number
-                it splits data into two sets and the ratio argument indicates the ratio of
-                training data set; if it is a list of float numbers, the splitter splits 
-                data into several portions corresponding to the split ratios. If a list is 
-                provided and the ratios are not summed to 1, they will be normalized.
-            min_rating (int): minimum number of ratings for user or item.
-            filter_by (str): either "user" or "item", depending on which of the two is to filter
-                with min_rating.
-            is_partitioned (bool): flag to partition data by filter_by column
-            is_random (bool): flag to make split randomly or use timestamp column
-            seed (int): Seed.
-            col_user (str): column name of user IDs.
-            col_item (str): column name of item IDs.
-            col_timestamp (str): column name of timestamps.
-
-        Args:
-
-        Returns:
+    This function splits data in a stratified manner. That is, the same values for the
+    filter_by column are retained in each split, but the corresponding set of entries
+    are divided according to the ratio provided.
+
+    Args:
+        data (pyspark.sql.DataFrame): Spark DataFrame to be split.
+        ratio (float or list): Ratio for splitting data. If it is a single float number
+            it splits data into two sets and the ratio argument indicates the ratio of
+            training data set; if it is a list of float numbers, the splitter splits
+            data into several portions corresponding to the split ratios. If a list is
+            provided and the ratios are not summed to 1, they will be normalized.
+        min_rating (int): minimum number of ratings for user or item.
+        filter_by (str): either "user" or "item", depending on which of the two is to filter
+            with min_rating.
+        is_partitioned (bool): flag to partition data by filter_by column
+        is_random (bool): flag to make split randomly or use timestamp column
+        seed (int): Seed.
+        col_user (str): column name of user IDs.
+        col_item (str): column name of item IDs.
+        col_timestamp (str): column name of timestamps.
+
+    Args:
+
+    Returns:
     """
     # A few preliminary checks.
     if filter_by not in ["user", "item"]:
@@ -115,17 +115,16 @@ def _do_stratification_spark(
     window_spec = Window.partitionBy(partition_by).orderBy(order_by)
 
     data = (
-      data
-      .withColumn("_count", F.count(split_by).over(window_count))
-      .withColumn("_rank", F.row_number().over(window_spec) / F.col("_count"))
-      .drop("_count")
+        data.withColumn("_count", F.count(split_by).over(window_count))
+        .withColumn("_rank", F.row_number().over(window_spec) / F.col("_count"))
+        .drop("_count")
     )
 
     multi_split, ratio = process_split_ratio(ratio)
     ratio = ratio if multi_split else [ratio, 1 - ratio]
 
     splits = []
-    prev_split = None 
+    prev_split = None
     for split in np.cumsum(ratio):
         condition = F.col("_rank") <= split
         if prev_split is not None:
@@ -156,8 +155,8 @@ def spark_chrono_split(
         data (pyspark.sql.DataFrame): Spark DataFrame to be split.
         ratio (float or list): Ratio for splitting data. If it is a single float number
             it splits data into two sets and the ratio argument indicates the ratio of
-            training data set; if it is a list of float numbers, the splitter splits 
-            data into several portions corresponding to the split ratios. If a list is 
+            training data set; if it is a list of float numbers, the splitter splits
+            data into several portions corresponding to the split ratios. If a list is
             provided and the ratios are not summed to 1, they will be normalized.
         seed (int): Seed.
         min_rating (int): minimum number of ratings for user or item.
@@ -183,6 +182,7 @@ def spark_chrono_split(
         col_timestamp=col_timestamp,
     )
 
+
 def spark_stratified_split(
     data,
     ratio=0.75,
@@ -228,6 +228,7 @@ def spark_stratified_split(
         col_item=col_item,
     )
 
+
 def spark_timestamp_split(
     data,
     ratio=0.75,
diff --git a/reco_utils/dataset/sparse.py b/reco_utils/dataset/sparse.py
index bc1a4c109c..5516ee3498 100644
--- a/reco_utils/dataset/sparse.py
+++ b/reco_utils/dataset/sparse.py
@@ -9,7 +9,7 @@
 import logging
 
 # import default parameters
-from reco_utils.common.constants import (
+from reco_utils.utils.constants import (
     DEFAULT_USER_COL,
     DEFAULT_ITEM_COL,
     DEFAULT_RATING_COL,
@@ -62,7 +62,7 @@ def _gen_index(self):
         map_users, map_items: dictionaries mapping the original user/item index to matrix indices
         map_back_users, map_back_items: dictionaries to map back the matrix elements to the original
         dataframe indices
-        
+
         Basic mechanics:
         As a first step we retieve the unique elements in the dataset. In this way we can take care
         of either completely missing rows (a user with no ratings) or completely missing columns
@@ -108,7 +108,7 @@ def _gen_index(self):
             np.save(self.save_path + "/item_back_dict", self.map_back_items)
 
     def gen_affinity_matrix(self):
-        """Generate the user/item affinity matrix. 
+        """Generate the user/item affinity matrix.
 
         As a first step, two new columns are added to the input DF, containing the index maps
         generated by the gen_index() method. The new indices, together with the ratings, are
diff --git a/reco_utils/dataset/split_utils.py b/reco_utils/dataset/split_utils.py
index 1e54db5c04..76b567dc85 100644
--- a/reco_utils/dataset/split_utils.py
+++ b/reco_utils/dataset/split_utils.py
@@ -5,7 +5,7 @@
 import numpy as np
 import math
 
-from reco_utils.common.constants import DEFAULT_ITEM_COL, DEFAULT_USER_COL
+from reco_utils.utils.constants import DEFAULT_ITEM_COL, DEFAULT_USER_COL
 
 try:
     from pyspark.sql import functions as F, Window
@@ -62,10 +62,10 @@ def min_rating_filter_pandas(
 
     Args:
         data (pandas.DataFrame): DataFrame of user-item tuples. Columns of user and item
-            should be present in the DataFrame while other columns like rating, 
+            should be present in the DataFrame while other columns like rating,
             timestamp, etc. can be optional.
         min_rating (int): minimum number of ratings for user or item.
-        filter_by (str): either "user" or "item", depending on which of the two is to 
+        filter_by (str): either "user" or "item", depending on which of the two is to
             filter with min_rating.
         col_user (str): column name of user ID.
         col_item (str): column name of item ID.
@@ -73,19 +73,12 @@ def min_rating_filter_pandas(
     Returns:
         pandas.DataFrame: DataFrame with at least columns of user and item that has been filtered by the given specifications.
     """
-    split_by_column = _get_column_name(
-        filter_by, col_user, col_item
-    )
+    split_by_column = _get_column_name(filter_by, col_user, col_item)
 
     if min_rating < 1:
         raise ValueError("min_rating should be integer and larger than or equal to 1.")
 
-    return (
-        data
-        .groupby(split_by_column)
-        .filter(lambda x: len(x) >= min_rating)
-    )
-    
+    return data.groupby(split_by_column).filter(lambda x: len(x) >= min_rating)
 
 
 def min_rating_filter_spark(
@@ -103,10 +96,10 @@ def min_rating_filter_spark(
 
     Args:
         data (pyspark.sql.DataFrame): DataFrame of user-item tuples. Columns of user and item
-            should be present in the DataFrame while other columns like rating, 
+            should be present in the DataFrame while other columns like rating,
             timestamp, etc. can be optional.
         min_rating (int): minimum number of ratings for user or item.
-        filter_by (str): either "user" or "item", depending on which of the two is to 
+        filter_by (str): either "user" or "item", depending on which of the two is to
             filter with min_rating.
         col_user (str): column name of user ID.
         col_item (str): column name of item ID.
@@ -115,9 +108,7 @@ def min_rating_filter_spark(
         pyspark.sql.DataFrame: DataFrame with at least columns of user and item that has been filtered by the given specifications.
     """
 
-    split_by_column = _get_column_name(
-        filter_by, col_user, col_item
-    )
+    split_by_column = _get_column_name(filter_by, col_user, col_item)
 
     if min_rating < 1:
         raise ValueError("min_rating should be integer and larger than or equal to 1.")
@@ -125,12 +116,11 @@ def min_rating_filter_spark(
     if min_rating > 1:
         window = Window.partitionBy(split_by_column)
         data = (
-            data
-            .withColumn("_count", F.count(split_by_column).over(window))
+            data.withColumn("_count", F.count(split_by_column).over(window))
             .where(F.col("_count") >= min_rating)
             .drop("_count")
         )
-    
+
     return data
 
 
diff --git a/reco_utils/evaluation/python_evaluation.py b/reco_utils/evaluation/python_evaluation.py
index 9161f16293..69754a4648 100644
--- a/reco_utils/evaluation/python_evaluation.py
+++ b/reco_utils/evaluation/python_evaluation.py
@@ -13,7 +13,7 @@
     log_loss,
 )
 
-from reco_utils.common.constants import (
+from reco_utils.utils.constants import (
     DEFAULT_USER_COL,
     DEFAULT_ITEM_COL,
     DEFAULT_RATING_COL,
@@ -31,14 +31,14 @@
 def check_column_dtypes(func):
     """Checks columns of DataFrame inputs
 
-    This includes the checks on: 
+    This includes the checks on:
 
     * whether the input columns exist in the input DataFrames
     * whether the data types of col_user as well as col_item are matched in the two input DataFrames.
 
     Args:
         func (function): function that will be wrapped
-    
+
     Returns:
         function: Wrapper function for checking dtypes.
     """
@@ -100,7 +100,7 @@ def merge_rating_true_pred(
 ):
     """Join truth and prediction data frames on userID and itemID and return the true
     and predicted rated with the correct index.
-    
+
     Args:
         rating_true (pandas.DataFrame): True data
         rating_pred (pandas.DataFrame): Predicted data
@@ -210,7 +210,7 @@ def rsquared(
         col_item (str): column name for item
         col_rating (str): column name for rating
         col_prediction (str): column name for prediction
-    
+
     Returns:
         float: R squared (min=0, max=1).
     """
@@ -352,7 +352,7 @@ def merge_ranking_true_pred(
     k=DEFAULT_K,
     threshold=DEFAULT_THRESHOLD,
 ):
-    """Filter truth and prediction data frames on common users
+    """Filter truth and prediction data frames on utils users
 
     Args:
         rating_true (pandas.DataFrame): True DataFrame
@@ -361,7 +361,7 @@ def merge_ranking_true_pred(
         col_item (str): column name for item
         col_rating (str): column name for rating
         col_prediction (str): column name for prediction
-        relevancy_method (str): method for determining relevancy ['top_k', 'by_threshold', None]. None means that the 
+        relevancy_method (str): method for determining relevancy ['top_k', 'by_threshold', None]. None means that the
             top k items are directly provided, so there is no need to compute the relevancy operation.
         k (int): number of top k items per user (optional)
         threshold (float): threshold of top items per user (optional)
@@ -438,7 +438,7 @@ def precision_at_k(
         col_item (str): column name for item
         col_rating (str): column name for rating
         col_prediction (str): column name for prediction
-        relevancy_method (str): method for determining relevancy ['top_k', 'by_threshold', None]. None means that the 
+        relevancy_method (str): method for determining relevancy ['top_k', 'by_threshold', None]. None means that the
             top k items are directly provided, so there is no need to compute the relevancy operation.
         k (int): number of top k items per user
         threshold (float): threshold of top items per user (optional)
@@ -485,13 +485,13 @@ def recall_at_k(
         col_item (str): column name for item
         col_rating (str): column name for rating
         col_prediction (str): column name for prediction
-        relevancy_method (str): method for determining relevancy ['top_k', 'by_threshold', None]. None means that the 
+        relevancy_method (str): method for determining relevancy ['top_k', 'by_threshold', None]. None means that the
             top k items are directly provided, so there is no need to compute the relevancy operation.
         k (int): number of top k items per user
         threshold (float): threshold of top items per user (optional)
 
     Returns:
-        float: recall at k (min=0, max=1). The maximum value is 1 even when fewer than 
+        float: recall at k (min=0, max=1). The maximum value is 1 even when fewer than
         k items exist for a user in rating_true.
     """
 
@@ -525,9 +525,9 @@ def ndcg_at_k(
     threshold=DEFAULT_THRESHOLD,
 ):
     """Normalized Discounted Cumulative Gain (nDCG).
-    
+
     Info: https://en.wikipedia.org/wiki/Discounted_cumulative_gain
-    
+
     Args:
         rating_true (pandas.DataFrame): True DataFrame
         rating_pred (pandas.DataFrame): Predicted DataFrame
@@ -535,7 +535,7 @@ def ndcg_at_k(
         col_item (str): column name for item
         col_rating (str): column name for rating
         col_prediction (str): column name for prediction
-        relevancy_method (str): method for determining relevancy ['top_k', 'by_threshold', None]. None means that the 
+        relevancy_method (str): method for determining relevancy ['top_k', 'by_threshold', None]. None means that the
             top k items are directly provided, so there is no need to compute the relevancy operation.
         k (int): number of top k items per user
         threshold (float): threshold of top items per user (optional)
@@ -587,7 +587,7 @@ def map_at_k(
     threshold=DEFAULT_THRESHOLD,
 ):
     """Mean Average Precision at k
-    
+
     The implementation of MAP is referenced from Spark MLlib evaluation metrics.
     https://spark.apache.org/docs/2.3.0/mllib-evaluation-metrics.html#ranking-systems
 
@@ -597,7 +597,7 @@ def map_at_k(
     Note:
         1. The evaluation function is named as 'MAP is at k' because the evaluation class takes top k items for
         the prediction items. The naming is different from Spark.
-        
+
         2. The MAP is meant to calculate Avg. Precision for the relevant items, so it is normalized by the number of
         relevant items in the ground truth data, instead of k.
 
@@ -608,7 +608,7 @@ def map_at_k(
         col_item (str): column name for item
         col_rating (str): column name for rating
         col_prediction (str): column name for prediction
-        relevancy_method (str): method for determining relevancy ['top_k', 'by_threshold', None]. None means that the 
+        relevancy_method (str): method for determining relevancy ['top_k', 'by_threshold', None]. None means that the
             top k items are directly provided, so there is no need to compute the relevancy operation.
         k (int): number of top k items per user
         threshold (float): threshold of top items per user (optional)
@@ -649,7 +649,7 @@ def get_top_k_items(
     """Get the input customer-item-rating tuple in the format of Pandas
     DataFrame, output a Pandas DataFrame in the dense format of top k items
     for each user.
-    
+
     Note:
         If it is implicit rating, just append a column of constants to be
         ratings.
diff --git a/reco_utils/evaluation/spark_diversity_evaluation.py b/reco_utils/evaluation/spark_diversity_evaluation.py
index db00e10f16..0736561ed0 100644
--- a/reco_utils/evaluation/spark_diversity_evaluation.py
+++ b/reco_utils/evaluation/spark_diversity_evaluation.py
@@ -4,7 +4,7 @@
 from pyspark.sql.types import *
 from pyspark.sql import functions as F
 
-from reco_utils.common.constants import (
+from reco_utils.utils.constants import (
     DEFAULT_USER_COL,
     DEFAULT_ITEM_COL,
 )
@@ -21,7 +21,7 @@ def __init__(
         col_item=DEFAULT_ITEM_COL,
         col_relevance=None,
     ):
-        """Initializer. 
+        """Initializer.
 
         This is the Spark version of diversity metrics evaluator.
         The methods of this class calculate following diversity metrics:
@@ -163,7 +163,7 @@ def _get_intralist_similarity(self, df):
 
     def user_diversity(self):
         """Calculate average diversity for recommendations for each user.
-       
+
         The metric definition is based on formula (3) in the following reference:
             - Y.C. Zhang, D.Ó. Séaghdha, D. Quercia and T. Jambor, Auralist: introducing serendipity into music recommendation, WSDM 2012
 
@@ -201,7 +201,7 @@ def item_novelty(self):
         The metric definition is based on following reference:
               - P. Castells, S. Vargas, and J. Wang, Novelty and diversity metrics for recommender systems: choice, discovery and relevance, ECIR 2011
               - Eugene Yan, Serendipity: Accuracy’s unpopular best friend in Recommender Systems, eugeneyan.com, April 2020
-     
+
         Returns:
             pyspark.sql.dataframe.DataFrame: A dataframe with following columns: col_item, item_novelty.
         """
@@ -266,7 +266,7 @@ def user_item_serendipity(self):
         The metric definition is based on following reference:
             - Y.C. Zhang, D.Ó. Séaghdha, D. Quercia and T. Jambor, Auralist: introducing serendipity into music recommendation, WSDM 2012
             - Eugene Yan, Serendipity: Accuracy’s unpopular best friend in Recommender Systems, eugeneyan.com, April 2020
-        
+
         Returns:
             pyspark.sql.dataframe.DataFrame: A dataframe with following columns: col_user, col_item, user_item_serendipity.
         """
@@ -380,8 +380,6 @@ def distributional_coverage(self):
             "p(i)", F.col("count") / count_row_reco
         ).withColumn("entropy(i)", F.col("p(i)") * F.log2(F.col("p(i)")))
         # distributional coverage
-        d_coverage = -df_entropy.agg(
-            F.sum("entropy(i)")
-        ).collect()[0][0]
+        d_coverage = -df_entropy.agg(F.sum("entropy(i)")).collect()[0][0]
 
         return d_coverage
diff --git a/reco_utils/evaluation/spark_evaluation.py b/reco_utils/evaluation/spark_evaluation.py
index 836693929c..baee9818aa 100644
--- a/reco_utils/evaluation/spark_evaluation.py
+++ b/reco_utils/evaluation/spark_evaluation.py
@@ -10,7 +10,7 @@
 except ImportError:
     pass  # skip this import if we are in pure python environment
 
-from reco_utils.common.constants import (
+from reco_utils.utils.constants import (
     DEFAULT_PREDICTION_COL,
     DEFAULT_USER_COL,
     DEFAULT_ITEM_COL,
@@ -117,7 +117,7 @@ def __init__(
 
     def rmse(self):
         """Calculate Root Mean Squared Error.
-        
+
         Returns:
             float: Root mean squared error.
         """
@@ -125,7 +125,7 @@ def rmse(self):
 
     def mae(self):
         """Calculate Mean Absolute Error.
-        
+
         Returns:
             float: Mean Absolute Error.
         """
@@ -187,7 +187,7 @@ def __init__(
             col_rating (str): column name for rating.
             col_prediction (str): column name for prediction.
             k (int): number of items to recommend to each user.
-            relevancy_method (str): method for determining relevant items. Possible 
+            relevancy_method (str): method for determining relevant items. Possible
                 values are "top_k", "by_time_stamp", and "by_threshold".
             threshold (float): threshold for determining the relevant recommended items.
                 This is used for the case that predicted ratings follow a known
@@ -305,7 +305,7 @@ def precision_at_k(self):
     def recall_at_k(self):
         """Get recall@K.
 
-        NOTE: 
+        NOTE:
             More details can be found `here <http://spark.apache.org/docs/2.1.1/api/python/pyspark.mllib.html#pyspark.mllib.evaluation.RankingMetrics.meanAveragePrecision>`_.
 
         Return:
@@ -320,7 +320,7 @@ def recall_at_k(self):
     def ndcg_at_k(self):
         """Get Normalized Discounted Cumulative Gain (NDCG)
 
-        NOTE: 
+        NOTE:
             More details can be found `here <http://spark.apache.org/docs/2.1.1/api/python/pyspark.mllib.html#pyspark.mllib.evaluation.RankingMetrics.ndcgAt>`_.
 
         Return:
@@ -333,7 +333,7 @@ def ndcg_at_k(self):
     def map_at_k(self):
         """Get mean average precision at k.
 
-        NOTE: 
+        NOTE:
             More details can be found `here <http://spark.apache.org/docs/2.1.1/api/python/pyspark.mllib.html#pyspark.mllib.evaluation.RankingMetrics.meanAveragePrecision>`_.
 
         Return:
@@ -356,7 +356,7 @@ def _get_top_k_items(
     DataFrame, output a Spark DataFrame in the dense format of top k items
     for each user.
 
-    NOTE: 
+    NOTE:
         if it is implicit rating, just append a column of constants to be ratings.
 
     Args:
diff --git a/reco_utils/recommender/cornac/cornac_utils.py b/reco_utils/recommender/cornac/cornac_utils.py
index 96661bd911..c853841108 100644
--- a/reco_utils/recommender/cornac/cornac_utils.py
+++ b/reco_utils/recommender/cornac/cornac_utils.py
@@ -4,7 +4,7 @@
 import pandas as pd
 import numpy as np
 
-from reco_utils.common.constants import (
+from reco_utils.utils.constants import (
     DEFAULT_USER_COL,
     DEFAULT_ITEM_COL,
     DEFAULT_PREDICTION_COL,
diff --git a/reco_utils/recommender/deeprec/DataModel/ImplicitCF.py b/reco_utils/recommender/deeprec/DataModel/ImplicitCF.py
index bd663b17e2..2e4a66d76c 100644
--- a/reco_utils/recommender/deeprec/DataModel/ImplicitCF.py
+++ b/reco_utils/recommender/deeprec/DataModel/ImplicitCF.py
@@ -6,7 +6,7 @@
 import pandas as pd
 import scipy.sparse as sp
 import time
-from reco_utils.common.constants import (
+from reco_utils.utils.constants import (
     DEFAULT_ITEM_COL,
     DEFAULT_USER_COL,
     DEFAULT_RATING_COL,
@@ -194,7 +194,7 @@ def train_loader(self, batch_size):
             batch_size (int): Batch size of users.
 
         Returns:
-            numpy.ndarray, numpy.ndarray, numpy.ndarray: 
+            numpy.ndarray, numpy.ndarray, numpy.ndarray:
             - Sampled users.
             - Sampled positive items.
             - Sampled negative items.
diff --git a/reco_utils/recommender/deeprec/models/graphrec/lightgcn.py b/reco_utils/recommender/deeprec/models/graphrec/lightgcn.py
index 7651a64550..2328b826de 100644
--- a/reco_utils/recommender/deeprec/models/graphrec/lightgcn.py
+++ b/reco_utils/recommender/deeprec/models/graphrec/lightgcn.py
@@ -13,14 +13,14 @@
     precision_at_k,
     recall_at_k,
 )
-from reco_utils.common.python_utils import get_top_k_scored_items
+from reco_utils.utils.python_utils import get_top_k_scored_items
 
 
 class LightGCN(object):
     """LightGCN model
 
     :Citation:
-    
+
         He, Xiangnan, Kuan Deng, Xiang Wang, Yan Li, Yongdong Zhang, and Meng Wang.
         "LightGCN: Simplifying and Powering Graph Convolution Network for Recommendation." arXiv
         preprint arXiv:2002.02126, 2020.
diff --git a/reco_utils/recommender/fastai/fastai_utils.py b/reco_utils/recommender/fastai/fastai_utils.py
index 62c66c5baa..89c7051bc5 100644
--- a/reco_utils/recommender/fastai/fastai_utils.py
+++ b/reco_utils/recommender/fastai/fastai_utils.py
@@ -8,7 +8,7 @@
 import fastprogress
 from fastprogress.fastprogress import force_console_behavior
 
-from reco_utils.common import constants as cc
+from reco_utils.utils import constants as cc
 
 
 def cartesian_product(*arrays):
@@ -38,7 +38,7 @@ def score(
     top_k=None,
 ):
     """Score all users+items provided and reduce to top_k items per user if top_k>0
-    
+
     Args:
         learner (object): Model.
         test_df (pandas.DataFrame): Test dataframe.
@@ -48,7 +48,7 @@ def score(
         top_k (int): Number of top items to recommend.
 
     Returns:
-        pandas.DataFrame: Result of recommendation 
+        pandas.DataFrame: Result of recommendation
     """
     # replace values not known to the model with NaN
     total_users, total_items = learner.data.train_ds.x.classes.values()
diff --git a/reco_utils/recommender/geoimc/geoimc_data.py b/reco_utils/recommender/geoimc/geoimc_data.py
index 46a4c55f7a..5eb312d596 100644
--- a/reco_utils/recommender/geoimc/geoimc_data.py
+++ b/reco_utils/recommender/geoimc/geoimc_data.py
@@ -12,14 +12,15 @@
 from sklearn.preprocessing import normalize
 from numba import jit, prange
 
-from reco_utils.common.python_utils import binarize
+from reco_utils.utils.python_utils import binarize
 from .geoimc_utils import length_normalize, reduce_dims
 
 
 logging.basicConfig(level=logging.INFO)
 logger = logging.getLogger("geoimc")
 
-class DataPtr():
+
+class DataPtr:
     """
     Holds data and its respective indices
     """
@@ -39,7 +40,6 @@ def __init__(self, data, entities):
         self.data_indices = None
         self.entity_indices = [None, None]
 
-
     def get_data(self):
         """
         Returns:
@@ -49,33 +49,26 @@ def get_data(self):
             return self.data
         return self.data[self.data_indices]
 
-
     def get_entity(self, of="row"):
-        """ Get entity
+        """Get entity
 
         Args:
             of (str): The entity, either 'row' or 'col'
         Returns:
             numpy.ndarray: Entity matrix (based on the entity_indices filter)
         """
-        idx = 0 if of=="row" else 1
+        idx = 0 if of == "row" else 1
         if self.entity_indices[idx] is None:
             return self.entities[idx]
         return self.entities[idx][self.entity_indices[idx]]
 
 
-class Dataset():
+class Dataset:
     """
     Base class that holds necessary (minimal) information needed
     """
 
-    def __init__(
-            self,
-            name,
-            features_dim=0,
-            normalize=False,
-            target_transform=''
-    ):
+    def __init__(self, name, features_dim=0, normalize=False, target_transform=""):
         """Initialize parameters
 
         Args:
@@ -97,11 +90,8 @@ def __init__(
         self.feat_normalize = normalize
         self.target_transform = target_transform
 
-
     def normalize(self):
-        """Normalizes the entity features
-
-        """
+        """Normalizes the entity features"""
         if self.feat_normalize:
             for i in range(len(self.entities)):
                 if isspmatrix_csr(self.entities[i]):
@@ -110,7 +100,6 @@ def normalize(self):
                 else:
                     self.entities[i] = length_normalize(self.entities[i])
 
-
     def generate_train_test_data(self, data, test_ratio=0.3):
         """Generate train, test split. The split is performed on the row
         entities. So, this essentially becomes a cold start row entity test.
@@ -127,16 +116,13 @@ def generate_train_test_data(self, data, test_ratio=0.3):
             np.array(range(0, data.shape[0])),
             test_size=test_ratio,
             shuffle=True,
-            random_state=0
+            random_state=0,
         )
         self.training_data.entity_indices[0] = self.training_data.data_indices
         self.test_data.entity_indices[0] = self.test_data.data_indices
 
-
     def reduce_dims(self):
-        """Reduces the dimensionality of entity features.
-
-        """
+        """Reduces the dimensionality of entity features."""
         if self.features_dim != 0:
             self.entities[0] = reduce_dims(self.entities[0], self.features_dim)
             self.entities[1] = reduce_dims(self.entities[1], self.features_dim)
@@ -153,7 +139,6 @@ def __init__(self, **kwargs):
         self.min_rating = 1
         self.max_rating = 5
 
-
     def df2coo(self, df):
         """Convert the input dataframe into a coo matrix
 
@@ -161,46 +146,57 @@ def df2coo(self, df):
             df (pandas.DataFrame): DataFrame containing the target matrix information.
         """
         data = []
-        row = list(df['user id']-1)
-        col = list(df['item id']-1)
+        row = list(df["user id"] - 1)
+        col = list(df["item id"] - 1)
         for idx in range(0, len(df)):
-            val = df['rating'].iloc[idx]
+            val = df["rating"].iloc[idx]
             data += [val]
 
-        if self.target_transform == 'normalize':
-            data = data/np.sqrt(np.sum(np.arange(self.min_rating, self.max_rating+1)**2))
-        elif self.target_transform == 'binarize':
+        if self.target_transform == "normalize":
+            data = data / np.sqrt(
+                np.sum(np.arange(self.min_rating, self.max_rating + 1) ** 2)
+            )
+        elif self.target_transform == "binarize":
             data = binarize(np.array(data), 3)
 
         # TODO: Get this from `u.info`
         return coo_matrix((data, (row, col)), shape=(943, 1682))
 
-
     def _read_from_file(self, path):
         """Read the traget matrix from file at path.
 
         Args:
             path (str): Path to the target matrix
         """
-        df = pd.read_csv(path, delimiter='\t', names=['user id','item id','rating','timestamp'], encoding="ISO-8859-1")
-        df.drop(['timestamp'], axis=1, inplace=True)
+        df = pd.read_csv(
+            path,
+            delimiter="\t",
+            names=["user id", "item id", "rating", "timestamp"],
+            encoding="ISO-8859-1",
+        )
+        df.drop(["timestamp"], axis=1, inplace=True)
         return self.df2coo(df)
 
-
     def load_data(self, path):
-        """ Load dataset
+        """Load dataset
 
         Args:
             path (str): Path to the directory containing ML100K dataset
             e1_path (str): Path to the file containing row (user) features of ML100K dataset
             e2_path (str): Path to the file containing col (movie) features of ML100K dataset
         """
-        self.entities = [self._load_user_features(f"{path}/u.user"), self._load_item_features(f"{path}/u.item")]
+        self.entities = [
+            self._load_user_features(f"{path}/u.user"),
+            self._load_item_features(f"{path}/u.item"),
+        ]
         self.normalize()
         self.reduce_dims()
-        self.training_data = DataPtr(self._read_from_file(f"{path}/u1.base").tocsr(), self.entities)
-        self.test_data = DataPtr(self._read_from_file(f"{path}/u1.test").tocsr(), self.entities)
-
+        self.training_data = DataPtr(
+            self._read_from_file(f"{path}/u1.base").tocsr(), self.entities
+        )
+        self.test_data = DataPtr(
+            self._read_from_file(f"{path}/u1.test").tocsr(), self.entities
+        )
 
     def _load_user_features(self, path):
         """Load user features
@@ -209,21 +205,26 @@ def _load_user_features(self, path):
             path (str): Path to the file containing user features information
 
         """
-        data = pd.read_csv(path, delimiter='|', names=['user_id', 'age', 'gender', 'occupation', 'zip_code'])
+        data = pd.read_csv(
+            path,
+            delimiter="|",
+            names=["user_id", "age", "gender", "occupation", "zip_code"],
+        )
         features_df = pd.concat(
-            [data['user_id'],
-             pd.get_dummies(data['user_id']),
-             pd.get_dummies(data['age']),
-             pd.get_dummies(data['gender']),
-             pd.get_dummies(data['occupation']),
-             pd.get_dummies(data['zip_code'])],
-            axis=1
+            [
+                data["user_id"],
+                pd.get_dummies(data["user_id"]),
+                pd.get_dummies(data["age"]),
+                pd.get_dummies(data["gender"]),
+                pd.get_dummies(data["occupation"]),
+                pd.get_dummies(data["zip_code"]),
+            ],
+            axis=1,
         )
-        features_df.drop(['user_id'], axis=1, inplace=True)
+        features_df.drop(["user_id"], axis=1, inplace=True)
         user_features = np.nan_to_num(features_df.to_numpy())
         return user_features
 
-
     def _load_item_features(self, path):
         """Load item features
 
@@ -231,38 +232,43 @@ def _load_item_features(self, path):
             path (str): Path to the file containing item features information
 
         """
-        header =[
-            'movie_id',
-            'movie_title',
-            'release_date',
-            'video_release_date',
-            'IMDb_URL',
-            'unknown',
-            'Action',
-            'Adventure',
-            'Animation',
-            'Childrens',
-            'Comedy',
-            'Crime',
-            'Documentary',
-            'Drama',
-            'Fantasy',
-            'Film-Noir',
-            'Horror',
-            'Musical',
-            'Mystery',
-            'Romance',
-            'Sci-Fi',
-            'Thriller',
-            'War',
-            'Western']
-        data = pd.read_csv(path, delimiter='|', names=header, encoding="ISO-8859-1")
-
-        features_df = pd.concat([
-            pd.get_dummies(data['movie_title']),
-            pd.get_dummies(data['release_date']),
-            pd.get_dummies('video_release_date'),
-            pd.get_dummies('IMDb_URL'),
-            data[header[5:]]], axis=1)
+        header = [
+            "movie_id",
+            "movie_title",
+            "release_date",
+            "video_release_date",
+            "IMDb_URL",
+            "unknown",
+            "Action",
+            "Adventure",
+            "Animation",
+            "Childrens",
+            "Comedy",
+            "Crime",
+            "Documentary",
+            "Drama",
+            "Fantasy",
+            "Film-Noir",
+            "Horror",
+            "Musical",
+            "Mystery",
+            "Romance",
+            "Sci-Fi",
+            "Thriller",
+            "War",
+            "Western",
+        ]
+        data = pd.read_csv(path, delimiter="|", names=header, encoding="ISO-8859-1")
+
+        features_df = pd.concat(
+            [
+                pd.get_dummies(data["movie_title"]),
+                pd.get_dummies(data["release_date"]),
+                pd.get_dummies("video_release_date"),
+                pd.get_dummies("IMDb_URL"),
+                data[header[5:]],
+            ],
+            axis=1,
+        )
         item_features = np.nan_to_num(features_df.to_numpy())
         return item_features
diff --git a/reco_utils/recommender/geoimc/geoimc_predict.py b/reco_utils/recommender/geoimc/geoimc_predict.py
index fc9bbf3870..15554847b5 100644
--- a/reco_utils/recommender/geoimc/geoimc_predict.py
+++ b/reco_utils/recommender/geoimc/geoimc_predict.py
@@ -6,7 +6,8 @@
 from numba import njit, jit, prange
 
 from .geoimc_utils import length_normalize
-from reco_utils.common.python_utils import binarize as conv_binary
+from reco_utils.utils.python_utils import binarize as conv_binary
+
 
 class PlainScalarProduct(object):
     """
@@ -14,12 +15,7 @@ class PlainScalarProduct(object):
     as the retrieval criterion
     """
 
-    def __init__(
-            self,
-            X,
-            Y,
-            **kwargs
-    ):
+    def __init__(self, X, Y, **kwargs):
         """
         Args:
             X: numpy matrix of shape (users, features)
@@ -28,25 +24,18 @@ def __init__(
         self.X = X
         self.Y = Y
 
-
     def sim(self, **kwargs):
-        """Calculate the similarity score
-        """
+        """Calculate the similarity score"""
         sim = self.X.dot(self.Y.T)
         return sim
 
 
-class Inferer():
+class Inferer:
     """
     Holds necessary (minimal) information needed for inference
     """
 
-    def __init__(
-            self,
-            method='dot',
-            k=10,
-            transformation=''
-    ):
+    def __init__(self, method="dot", k=10, transformation=""):
         """Initialize parameters
 
         Args:
@@ -64,7 +53,6 @@ def __init__(
         self.k = k
         self.transformation = transformation
 
-
     def _get_method(self, k):
         """Get the inferer method
 
@@ -74,13 +62,12 @@ def _get_method(self, k):
         Returns:
             class: A class object implementing the inferer 'k'
         """
-        if k == 'dot':
+        if k == "dot":
             method = PlainScalarProduct
         else:
             raise ValueError(f"{k} is unknown.")
         return method
 
-
     def infer(self, dataPtr, W, **kwargs):
         """Main inference method
 
@@ -96,18 +83,15 @@ def infer(self, dataPtr, W, **kwargs):
             a = dataPtr.get_entity("row").dot(W[0]).dot(sqrtm(W[1]))
             b = dataPtr.get_entity("col").dot(W[2]).dot(sqrtm(W[1]))
 
-        sim_score = self.method(
-            a,
-            b
-        ).sim(**kwargs)
+        sim_score = self.method(a, b).sim(**kwargs)
 
-        if self.transformation == 'mean':
+        if self.transformation == "mean":
             prediction = conv_binary(sim_score, sim_score.mean())
-        elif self.transformation == 'topk':
+        elif self.transformation == "topk":
             masked_sim_score = sim_score.copy()
 
             for i in range(sim_score.shape[0]):
-                topKidx = np.argpartition(masked_sim_score[i], -self.k)[-self.k:]
+                topKidx = np.argpartition(masked_sim_score[i], -self.k)[-self.k :]
                 mask = np.ones(sim_score[i].size, dtype=bool)
                 mask[topKidx] = False
 
diff --git a/reco_utils/recommender/ncf/dataset.py b/reco_utils/recommender/ncf/dataset.py
index ce6a12fd50..c7b94a0648 100644
--- a/reco_utils/recommender/ncf/dataset.py
+++ b/reco_utils/recommender/ncf/dataset.py
@@ -3,7 +3,7 @@
 import pandas as pd
 import warnings
 
-from reco_utils.common.constants import (
+from reco_utils.utils.constants import (
     DEFAULT_ITEM_COL,
     DEFAULT_USER_COL,
     DEFAULT_RATING_COL,
@@ -27,21 +27,21 @@ def __init__(
         binary=True,
         seed=None,
     ):
-        """Constructor 
-        
+        """Constructor
+
         Args:
             train (pandas.DataFrame): Training data with at least columns (col_user, col_item, col_rating).
-            test (pandas.DataFrame): Test data with at least columns (col_user, col_item, col_rating). test can be None, 
+            test (pandas.DataFrame): Test data with at least columns (col_user, col_item, col_rating). test can be None,
                 if so, we only process the training data.
             n_neg (int): Number of negative samples for training set.
             n_neg_test (int): Number of negative samples for test set.
             col_user (str): User column name.
             col_item (str): Item column name.
-            col_rating (str): Rating column name. 
+            col_rating (str): Rating column name.
             col_timestamp (str): Timestamp column name.
-            binary (bool): If true, set rating > 0 to rating = 1. 
+            binary (bool): If true, set rating > 0 to rating = 1.
             seed (int): Seed.
-        
+
         """
         # initialize user and item index
         self.user_idx = None
@@ -66,14 +66,14 @@ def _data_processing(self, train, test, binary):
         """Process the dataset to reindex userID and itemID, also set rating as binary feedback
 
         Args:
-            train (pandas.DataFrame): Training data with at least columns (col_user, col_item, col_rating). 
+            train (pandas.DataFrame): Training data with at least columns (col_user, col_item, col_rating).
             test (pandas.DataFrame): Test data with at least columns (col_user, col_item, col_rating)
                     test can be None, if so, we only process the training data.
             binary (bool): If true, set rating>0 to rating = 1.
 
         Returns:
             list: train and test pandas.DataFrame Dataset, which have been reindexed.
-        
+
         """
         # If testing dataset is None
         df = train if test is None else train.append(test)
@@ -109,12 +109,12 @@ def _reindex(self, df, binary):
         """Process dataset to reindex userID and itemID, also set rating as binary feedback
 
         Args:
-            df (pandas.DataFrame): dataframe with at least columns (col_user, col_item, col_rating) 
-            binary (bool): if true, set rating>0 to rating = 1 
+            df (pandas.DataFrame): dataframe with at least columns (col_user, col_item, col_rating)
+            binary (bool): if true, set rating>0 to rating = 1
 
         Returns:
             list: train and test pandas.DataFrame Dataset, which have been reindexed.
-        
+
         """
 
         # If testing dataset is None
@@ -140,7 +140,7 @@ def _reindex(self, df, binary):
     def _init_train_data(self):
         """Return all negative items (in train dataset) and store them in self.interact_status[self.col_item + '_negative']
         store train dataset in self.users, self.items and self.ratings
-        
+
         """
 
         self.item_pool = set(self.train[self.col_item].unique())
@@ -277,11 +277,11 @@ def negative_sampling(self):
 
     def train_loader(self, batch_size, shuffle=True):
         """Feed train data every batch.
-        
+
         Args:
             batch_size (int): Batch size.
             shuffle (bool): Ff true, train data will be shuffled.
-        
+
         Yields:
             list: A list of userID list, itemID list, and rating list. Public data loader returns the userID, itemID consistent with raw data.
         """
@@ -305,7 +305,7 @@ def train_loader(self, batch_size, shuffle=True):
 
     def test_loader(self):
         """Feed leave-one-out data every user
-        
+
         Generate test batch by every positive test instance,
         (eg. \[1, 2, 1\] is a positive user & item pair in test set
         (\[userID, itemID, rating\] for this tuple). This function
diff --git a/reco_utils/recommender/rlrmc/RLRMCdataset.py b/reco_utils/recommender/rlrmc/RLRMCdataset.py
index 637e6e4e33..4dcdb9326d 100644
--- a/reco_utils/recommender/rlrmc/RLRMCdataset.py
+++ b/reco_utils/recommender/rlrmc/RLRMCdataset.py
@@ -5,7 +5,7 @@
 import pandas as pd
 from scipy.sparse import csr_matrix
 
-from reco_utils.common.constants import (
+from reco_utils.utils.constants import (
     DEFAULT_ITEM_COL,
     DEFAULT_USER_COL,
     DEFAULT_RATING_COL,
diff --git a/reco_utils/recommender/sar/sar_singlenode.py b/reco_utils/recommender/sar/sar_singlenode.py
index 08fb860d2e..688c3282f6 100644
--- a/reco_utils/recommender/sar/sar_singlenode.py
+++ b/reco_utils/recommender/sar/sar_singlenode.py
@@ -7,14 +7,14 @@
 import logging
 from scipy import sparse
 
-from reco_utils.common.python_utils import (
+from reco_utils.utils.python_utils import (
     jaccard,
     lift,
     exponential_decay,
     get_top_k_scored_items,
     rescale,
 )
-from reco_utils.common import constants
+from reco_utils.utils import constants
 
 
 COOCCUR = "cooccurrence"
@@ -111,7 +111,7 @@ def __init__(
         self.index2item = None
 
     def compute_affinity_matrix(self, df, rating_col):
-        """ Affinity matrix.
+        """Affinity matrix.
 
         The user-affinity matrix can be constructed by treating the users and items as
         indices in a sparse matrix, and the events as the data. Here, we're treating
@@ -157,7 +157,7 @@ def compute_time_decay(self, df, decay_column):
         return df.groupby([self.col_user, self.col_item]).sum().reset_index()
 
     def compute_coocurrence_matrix(self, df):
-        """ Co-occurrence matrix.
+        """Co-occurrence matrix.
 
         The co-occurrence matrix is defined as :math:`C = U^T * U`
 
diff --git a/reco_utils/recommender/surprise/surprise_utils.py b/reco_utils/recommender/surprise/surprise_utils.py
index 696f4c3282..10b894b96c 100644
--- a/reco_utils/recommender/surprise/surprise_utils.py
+++ b/reco_utils/recommender/surprise/surprise_utils.py
@@ -5,12 +5,12 @@
 import numpy as np
 import pandas as pd
 
-from reco_utils.common.constants import (
+from reco_utils.utils.constants import (
     DEFAULT_USER_COL,
     DEFAULT_ITEM_COL,
     DEFAULT_PREDICTION_COL,
 )
-from reco_utils.common.general_utils import invert_dictionary
+from reco_utils.utils.general_utils import invert_dictionary
 
 
 def surprise_trainset_to_df(
@@ -25,7 +25,7 @@ def surprise_trainset_to_df(
         col_user (str): User column name.
         col_item (str): Item column name.
         col_rating (str): Rating column name.
-    
+
     Returns:
         pandas.DataFrame: A dataframe with user column (str), item column (str), and rating column (float).
     """
@@ -53,13 +53,13 @@ def predict(
     predcol=DEFAULT_PREDICTION_COL,
 ):
     """Computes predictions of an algorithm from Surprise on the data. Can be used for computing rating metrics like RMSE.
-    
+
     Args:
         algo (surprise.prediction_algorithms.algo_base.AlgoBase): an algorithm from Surprise
         data (pandas.DataFrame): the data on which to predict
         usercol (str): name of the user column
         itemcol (str): name of the item column
-    
+
     Returns:
         pandas.DataFrame: Dataframe with usercol, itemcol, predcol
     """
@@ -84,14 +84,14 @@ def compute_ranking_predictions(
 ):
     """Computes predictions of an algorithm from Surprise on all users and items in data. It can be used for computing
     ranking metrics like NDCG.
-    
+
     Args:
         algo (surprise.prediction_algorithms.algo_base.AlgoBase): an algorithm from Surprise
         data (pandas.DataFrame): the data from which to get the users and items
         usercol (str): name of the user column
         itemcol (str): name of the item column
         remove_seen (bool): flag to remove (user, item) pairs seen in the training data
-    
+
     Returns:
         pandas.DataFrame: Dataframe with usercol, itemcol, predcol
     """
diff --git a/reco_utils/recommender/vowpal_wabbit/vw.py b/reco_utils/recommender/vowpal_wabbit/vw.py
index 90a237aae7..e70432d76b 100644
--- a/reco_utils/recommender/vowpal_wabbit/vw.py
+++ b/reco_utils/recommender/vowpal_wabbit/vw.py
@@ -12,7 +12,7 @@
 from tempfile import TemporaryDirectory
 import pandas as pd
 
-from reco_utils.common.constants import (
+from reco_utils.utils.constants import (
     DEFAULT_USER_COL,
     DEFAULT_ITEM_COL,
     DEFAULT_RATING_COL,
@@ -67,7 +67,7 @@ def to_vw_cmd(params):
 
         Args:
             params (dict): key = parameter, value = value (use True if parameter is just a flag)
-        
+
         Returns:
             list[str]: vw command line parameters as list of strings
         """
@@ -88,10 +88,10 @@ def to_vw_cmd(params):
 
     def parse_train_params(self, params):
         """Parse input hyper-parameters to build vw train commands
-        
+
         Args:
             params (dict): key = parameter, value = value (use True if parameter is just a flag)
-        
+
         Returns:
             list[str]: vw command line parameters as list of strings
         """
@@ -127,10 +127,10 @@ def parse_train_params(self, params):
 
     def parse_test_params(self, params):
         """Parse input hyper-parameters to build vw test commands
-        
+
         Args:
             params (dict): key = parameter, value = value (use True if parameter is just a flag)
-        
+
         Returns:
             list[str]: vw command line parameters as list of strings
         """
@@ -188,7 +188,7 @@ def parse_test_params(self, params):
 
     def to_vw_file(self, df, train=True):
         """Convert Pandas DataFrame to vw input format file
-        
+
         Args:
             df (pandas.DataFrame): input DataFrame
             train (bool): flag for train mode (or test mode if False)
@@ -228,7 +228,7 @@ def to_vw_file(self, df, train=True):
 
     def fit(self, df):
         """Train model
-        
+
         Args:
             df (pandas.DataFrame): input training data
         """
@@ -241,7 +241,7 @@ def fit(self, df):
 
     def predict(self, df):
         """Predict results
-        
+
         Args:
             df (pandas.DataFrame): input test data
         """
diff --git a/reco_utils/recommender/wide_deep/wide_deep_utils.py b/reco_utils/recommender/wide_deep/wide_deep_utils.py
index 907928d84a..0181a3d2e5 100644
--- a/reco_utils/recommender/wide_deep/wide_deep_utils.py
+++ b/reco_utils/recommender/wide_deep/wide_deep_utils.py
@@ -3,8 +3,8 @@
 
 import tensorflow as tf
 
-from reco_utils.common.constants import DEFAULT_USER_COL, DEFAULT_ITEM_COL
-from reco_utils.common.tf_utils import MODEL_DIR
+from reco_utils.utils.constants import DEFAULT_USER_COL, DEFAULT_ITEM_COL
+from reco_utils.utils.tf_utils import MODEL_DIR
 
 
 def build_feature_columns(
@@ -37,9 +37,9 @@ def build_feature_columns(
             'wide_deep' for a combination of linear model and neural networks.
 
     Returns:
-        list, list: 
-        - The wide feature columns 
-        - The deep feature columns. If only the wide model is selected, the deep column list is empty and viceversa. 
+        list, list:
+        - The wide feature columns
+        - The deep feature columns. If only the wide model is selected, the deep column list is empty and viceversa.
     """
     if model_type not in ["wide", "deep", "wide_deep"]:
         raise ValueError("Model type should be either 'wide', 'deep', or 'wide_deep'")
@@ -102,7 +102,7 @@ def _build_deep_columns(
         item_dim (int): Item embedding dimension.
         item_feat_col (str): Item feature column name.
         item_feat_shape (int or an iterable of integers): Item feature array shape.
-    
+
     Returns:
         list: Deep feature columns.
     """
@@ -140,7 +140,7 @@ def build_model(
     seed=None,
 ):
     """Build wide-deep model.
-    
+
     To generate wide model, pass wide_columns only.
     To generate deep model, pass deep_columns only.
     To generate wide_deep model, pass both wide_columns and deep_columns.
diff --git a/reco_utils/tuning/nni/ncf_training.py b/reco_utils/tuning/nni/ncf_training.py
index 6393eef2a0..f62a0b9a44 100644
--- a/reco_utils/tuning/nni/ncf_training.py
+++ b/reco_utils/tuning/nni/ncf_training.py
@@ -12,7 +12,7 @@
 import reco_utils.evaluation.python_evaluation as evaluation
 from reco_utils.recommender.ncf.ncf_singlenode import NCF
 from reco_utils.recommender.ncf.dataset import Dataset as NCFDataset
-from reco_utils.common.constants import SEED as DEFAULT_SEED
+from reco_utils.utils.constants import SEED as DEFAULT_SEED
 
 logging.basicConfig(level=logging.DEBUG)
 logger = logging.getLogger("ncf")
diff --git a/tests/conftest.py b/tests/conftest.py
index 57e0efa6c9..d0618bb7df 100644
--- a/tests/conftest.py
+++ b/tests/conftest.py
@@ -19,7 +19,7 @@
 import pytest
 from sklearn.model_selection import train_test_split
 
-from reco_utils.common.constants import (
+from reco_utils.utils.constants import (
     DEFAULT_USER_COL,
     DEFAULT_ITEM_COL,
     DEFAULT_RATING_COL,
@@ -27,7 +27,7 @@
 )
 from reco_utils.dataset.python_splitters import numpy_stratified_split
 from reco_utils.dataset.python_splitters import python_chrono_split
-from reco_utils.common.spark_utils import start_or_get_spark
+from reco_utils.utils.spark_utils import start_or_get_spark
 
 
 @pytest.fixture(scope="session")
diff --git a/tests/integration/examples/test_notebooks_gpu.py b/tests/integration/examples/test_notebooks_gpu.py
index 8467fcc06d..c663eb98be 100644
--- a/tests/integration/examples/test_notebooks_gpu.py
+++ b/tests/integration/examples/test_notebooks_gpu.py
@@ -11,7 +11,7 @@
     pass  # disable error while collecting tests for non-notebook environments
 
 
-from reco_utils.common.gpu_utils import get_number_gpus
+from reco_utils.utils.gpu_utils import get_number_gpus
 
 
 TOL = 0.5
diff --git a/tests/smoke/examples/test_notebooks_gpu.py b/tests/smoke/examples/test_notebooks_gpu.py
index 9e80c722f5..9a0abe50e3 100644
--- a/tests/smoke/examples/test_notebooks_gpu.py
+++ b/tests/smoke/examples/test_notebooks_gpu.py
@@ -3,13 +3,14 @@
 
 
 import pytest
+
 try:
     import papermill as pm
     import scrapbook as sb
 except ImportError:
     pass  # disable error while collecting tests for non-notebook environments
 
-from reco_utils.common.gpu_utils import get_number_gpus
+from reco_utils.utils.gpu_utils import get_number_gpus
 
 
 TOL = 0.5
diff --git a/tests/unit/examples/test_notebooks_gpu.py b/tests/unit/examples/test_notebooks_gpu.py
index d8acac1cf1..407c03eefd 100644
--- a/tests/unit/examples/test_notebooks_gpu.py
+++ b/tests/unit/examples/test_notebooks_gpu.py
@@ -3,12 +3,13 @@
 
 import os
 import pytest
+
 try:
     import papermill as pm
 except ImportError:
     pass  # disable error while collecting tests for non-notebook environments
 
-from reco_utils.common.gpu_utils import get_number_gpus
+from reco_utils.utils.gpu_utils import get_number_gpus
 
 
 @pytest.mark.notebooks
diff --git a/tests/unit/reco_utils/common/test_general_utils.py b/tests/unit/reco_utils/common/test_general_utils.py
index 05503bdcfe..556f31d1de 100644
--- a/tests/unit/reco_utils/common/test_general_utils.py
+++ b/tests/unit/reco_utils/common/test_general_utils.py
@@ -2,7 +2,7 @@
 # Licensed under the MIT License.
 
 import pytest
-from reco_utils.common.general_utils import invert_dictionary, get_number_processors
+from reco_utils.utils.general_utils import invert_dictionary, get_number_processors
 
 
 def test_invert_dictionary():
diff --git a/tests/unit/reco_utils/common/test_gpu_utils.py b/tests/unit/reco_utils/common/test_gpu_utils.py
index 15a4c5b888..7be8057d22 100644
--- a/tests/unit/reco_utils/common/test_gpu_utils.py
+++ b/tests/unit/reco_utils/common/test_gpu_utils.py
@@ -11,7 +11,7 @@
     pass  # skip this import if we are in cpu environment
 
 
-from reco_utils.common.gpu_utils import (
+from reco_utils.utils.gpu_utils import (
     get_cuda_version,
     get_cudnn_version,
     get_gpu_info,
diff --git a/tests/unit/reco_utils/common/test_k8s_utils.py b/tests/unit/reco_utils/common/test_k8s_utils.py
index 33c02d553c..5f812ccfc9 100644
--- a/tests/unit/reco_utils/common/test_k8s_utils.py
+++ b/tests/unit/reco_utils/common/test_k8s_utils.py
@@ -1,7 +1,7 @@
 # Copyright (c) Microsoft Corporation. All rights reserved.
 # Licensed under the MIT License.
 
-from reco_utils.common.k8s_utils import (
+from reco_utils.utils.k8s_utils import (
     qps_to_replicas,
     replicas_to_qps,
     nodes_to_replicas,
diff --git a/tests/unit/reco_utils/common/test_notebook_utils.ipynb b/tests/unit/reco_utils/common/test_notebook_utils.ipynb
index 51ed34d7c9..81b62382b3 100644
--- a/tests/unit/reco_utils/common/test_notebook_utils.ipynb
+++ b/tests/unit/reco_utils/common/test_notebook_utils.ipynb
@@ -6,7 +6,7 @@
     "collapsed": true
    },
    "source": [
-    "# This is a test notebook for reco_utils.common.notebook_utils module"
+    "# This is a test notebook for reco_utils.utils.notebook_utils module"
    ]
   },
   {
@@ -20,7 +20,7 @@
     
     "\n",
     "import scrapbook as sb\n",
-    "from reco_utils.common.notebook_utils import is_jupyter, is_databricks"
+    "from reco_utils.utils.notebook_utils import is_jupyter, is_databricks"
    ]
   },
   {
diff --git a/tests/unit/reco_utils/common/test_notebook_utils.py b/tests/unit/reco_utils/common/test_notebook_utils.py
index 7ce67cf270..0cbbbc120d 100644
--- a/tests/unit/reco_utils/common/test_notebook_utils.py
+++ b/tests/unit/reco_utils/common/test_notebook_utils.py
@@ -3,12 +3,13 @@
 
 from pathlib import Path
 import pytest
+
 try:
     import papermill as pm
     import scrapbook as sb
 except ImportError:
     pass  # disable error while collecting tests for non-notebook environments
-from reco_utils.common.notebook_utils import is_jupyter, is_databricks
+from reco_utils.utils.notebook_utils import is_jupyter, is_databricks
 
 
 @pytest.mark.notebooks
diff --git a/tests/unit/reco_utils/common/test_plot.py b/tests/unit/reco_utils/common/test_plot.py
index 8719371fec..856a5e8042 100644
--- a/tests/unit/reco_utils/common/test_plot.py
+++ b/tests/unit/reco_utils/common/test_plot.py
@@ -6,7 +6,7 @@
 matplotlib.use("Agg")
 import matplotlib.pyplot as plt
 import pytest
-from reco_utils.common.plot import line_graph
+from reco_utils.utils.plot import line_graph
 
 
 def test_line_graph():
diff --git a/tests/unit/reco_utils/common/test_python_utils.py b/tests/unit/reco_utils/common/test_python_utils.py
index 44a33bc751..4b65f2cc9c 100644
--- a/tests/unit/reco_utils/common/test_python_utils.py
+++ b/tests/unit/reco_utils/common/test_python_utils.py
@@ -5,7 +5,7 @@
 import numpy as np
 import pytest
 
-from reco_utils.common.python_utils import (
+from reco_utils.utils.python_utils import (
     exponential_decay,
     jaccard,
     lift,
diff --git a/tests/unit/reco_utils/common/test_tf_utils.py b/tests/unit/reco_utils/common/test_tf_utils.py
index 6fe0fd8053..282d24ea81 100644
--- a/tests/unit/reco_utils/common/test_tf_utils.py
+++ b/tests/unit/reco_utils/common/test_tf_utils.py
@@ -6,7 +6,7 @@
 import numpy as np
 import pandas as pd
 import pytest
-from reco_utils.common.constants import (
+from reco_utils.utils.constants import (
     DEFAULT_USER_COL,
     DEFAULT_ITEM_COL,
     DEFAULT_RATING_COL,
@@ -15,7 +15,7 @@
 from reco_utils.evaluation.python_evaluation import rmse
 
 try:
-    from reco_utils.common.tf_utils import (
+    from reco_utils.utils.tf_utils import (
         build_optimizer,
         evaluation_log_hook,
         export_model,
diff --git a/tests/unit/reco_utils/common/test_timer.py b/tests/unit/reco_utils/common/test_timer.py
index 2e144f461f..6ff27f08b5 100644
--- a/tests/unit/reco_utils/common/test_timer.py
+++ b/tests/unit/reco_utils/common/test_timer.py
@@ -4,7 +4,7 @@
 
 import pytest
 import time
-from reco_utils.common.timer import Timer
+from reco_utils.utils.timer import Timer
 
 
 TOL = 0.03
diff --git a/tests/unit/reco_utils/dataset/test_python_splitter.py b/tests/unit/reco_utils/dataset/test_python_splitter.py
index 6a80bcccc5..09cc44009e 100644
--- a/tests/unit/reco_utils/dataset/test_python_splitter.py
+++ b/tests/unit/reco_utils/dataset/test_python_splitter.py
@@ -17,7 +17,7 @@
     numpy_stratified_split,
 )
 
-from reco_utils.common.constants import (
+from reco_utils.utils.constants import (
     DEFAULT_USER_COL,
     DEFAULT_ITEM_COL,
     DEFAULT_RATING_COL,
diff --git a/tests/unit/reco_utils/dataset/test_spark_splitter.py b/tests/unit/reco_utils/dataset/test_spark_splitter.py
index 1d9417cf9d..8b179be92e 100644
--- a/tests/unit/reco_utils/dataset/test_spark_splitter.py
+++ b/tests/unit/reco_utils/dataset/test_spark_splitter.py
@@ -4,7 +4,7 @@
 import numpy as np
 import pandas as pd
 import pytest
-from reco_utils.common.constants import (
+from reco_utils.utils.constants import (
     DEFAULT_USER_COL,
     DEFAULT_ITEM_COL,
     DEFAULT_RATING_COL,
diff --git a/tests/unit/reco_utils/dataset/test_sparse.py b/tests/unit/reco_utils/dataset/test_sparse.py
index 252c043396..ae3dcf05d9 100644
--- a/tests/unit/reco_utils/dataset/test_sparse.py
+++ b/tests/unit/reco_utils/dataset/test_sparse.py
@@ -6,7 +6,7 @@
 import pytest
 
 from reco_utils.dataset.sparse import AffinityMatrix
-from reco_utils.common.constants import (
+from reco_utils.utils.constants import (
     DEFAULT_USER_COL,
     DEFAULT_ITEM_COL,
     DEFAULT_RATING_COL,
diff --git a/tests/unit/reco_utils/evaluation/test_python_evaluation.py b/tests/unit/reco_utils/evaluation/test_python_evaluation.py
index 20eeb587ee..9b7b11afd0 100644
--- a/tests/unit/reco_utils/evaluation/test_python_evaluation.py
+++ b/tests/unit/reco_utils/evaluation/test_python_evaluation.py
@@ -6,7 +6,7 @@
 import pytest
 from unittest.mock import Mock
 from sklearn.preprocessing import minmax_scale
-from reco_utils.common.constants import (
+from reco_utils.utils.constants import (
     DEFAULT_USER_COL,
     DEFAULT_ITEM_COL,
     DEFAULT_RATING_COL,
@@ -65,6 +65,7 @@ def rating_nohit():
     )
 # fmt: on
 
+
 @pytest.fixture
 def rating_true_binary(rating_true):
     # Convert true ratings to binary
diff --git a/tests/unit/reco_utils/recommender/test_cornac_utils.py b/tests/unit/reco_utils/recommender/test_cornac_utils.py
index 20e6fee361..8d0e2a5091 100644
--- a/tests/unit/reco_utils/recommender/test_cornac_utils.py
+++ b/tests/unit/reco_utils/recommender/test_cornac_utils.py
@@ -6,7 +6,7 @@
 import pytest
 import cornac
 
-from reco_utils.common.constants import (
+from reco_utils.utils.constants import (
     DEFAULT_USER_COL,
     DEFAULT_ITEM_COL,
     DEFAULT_RATING_COL,
diff --git a/tests/unit/reco_utils/recommender/test_geoimc.py b/tests/unit/reco_utils/recommender/test_geoimc.py
index 717c29e185..c144a706a3 100644
--- a/tests/unit/reco_utils/recommender/test_geoimc.py
+++ b/tests/unit/reco_utils/recommender/test_geoimc.py
@@ -9,7 +9,7 @@
 from scipy.sparse import csr_matrix
 from pandas.testing import assert_frame_equal
 
-from reco_utils.common.python_utils import binarize
+from reco_utils.utils.python_utils import binarize
 from reco_utils.recommender.geoimc.geoimc_data import DataPtr
 from reco_utils.recommender.geoimc.geoimc_predict import PlainScalarProduct, Inferer
 from reco_utils.recommender.geoimc.geoimc_algorithm import IMCProblem
diff --git a/tests/unit/reco_utils/recommender/test_ncf_dataset.py b/tests/unit/reco_utils/recommender/test_ncf_dataset.py
index 98f5a4ffd1..b94df47f9c 100644
--- a/tests/unit/reco_utils/recommender/test_ncf_dataset.py
+++ b/tests/unit/reco_utils/recommender/test_ncf_dataset.py
@@ -2,7 +2,7 @@
 # Licensed under the MIT License.
 
 
-from reco_utils.common.constants import (
+from reco_utils.utils.constants import (
     DEFAULT_USER_COL,
     DEFAULT_ITEM_COL,
     SEED,
diff --git a/tests/unit/reco_utils/recommender/test_ncf_singlenode.py b/tests/unit/reco_utils/recommender/test_ncf_singlenode.py
index f7b1e8a75b..b2f635e2ae 100644
--- a/tests/unit/reco_utils/recommender/test_ncf_singlenode.py
+++ b/tests/unit/reco_utils/recommender/test_ncf_singlenode.py
@@ -9,7 +9,7 @@
 try:
     from reco_utils.recommender.ncf.ncf_singlenode import NCF
     from reco_utils.recommender.ncf.dataset import Dataset
-    from reco_utils.common.constants import (
+    from reco_utils.utils.constants import (
         DEFAULT_USER_COL,
         DEFAULT_ITEM_COL,
         SEED,
diff --git a/tests/unit/reco_utils/recommender/test_sar_singlenode.py b/tests/unit/reco_utils/recommender/test_sar_singlenode.py
index b9ba284e7f..b16629e9c1 100644
--- a/tests/unit/reco_utils/recommender/test_sar_singlenode.py
+++ b/tests/unit/reco_utils/recommender/test_sar_singlenode.py
@@ -10,7 +10,7 @@
 from pandas.testing import assert_frame_equal
 import urllib
 
-from reco_utils.common.constants import DEFAULT_PREDICTION_COL
+from reco_utils.utils.constants import DEFAULT_PREDICTION_COL
 from reco_utils.recommender.sar.sar_singlenode import SARSingleNode
 
 
diff --git a/tests/unit/reco_utils/recommender/test_surprise_utils.py b/tests/unit/reco_utils/recommender/test_surprise_utils.py
index 63c51d051a..dde32f68a5 100644
--- a/tests/unit/reco_utils/recommender/test_surprise_utils.py
+++ b/tests/unit/reco_utils/recommender/test_surprise_utils.py
@@ -6,7 +6,7 @@
 import pytest
 import surprise
 
-from reco_utils.common.constants import (
+from reco_utils.utils.constants import (
     DEFAULT_USER_COL,
     DEFAULT_ITEM_COL,
     DEFAULT_RATING_COL,
diff --git a/tests/unit/reco_utils/recommender/test_wide_deep_utils.py b/tests/unit/reco_utils/recommender/test_wide_deep_utils.py
index 1efbd94f7f..bd013b175c 100644
--- a/tests/unit/reco_utils/recommender/test_wide_deep_utils.py
+++ b/tests/unit/reco_utils/recommender/test_wide_deep_utils.py
@@ -4,14 +4,14 @@
 import os
 import pytest
 import pandas as pd
-from reco_utils.common.constants import (
+from reco_utils.utils.constants import (
     DEFAULT_USER_COL,
     DEFAULT_ITEM_COL,
     DEFAULT_RATING_COL,
 )
 
 try:
-    from reco_utils.common.tf_utils import pandas_input_fn, MODEL_DIR
+    from reco_utils.utils.tf_utils import pandas_input_fn, MODEL_DIR
     from reco_utils.recommender.wide_deep.wide_deep_utils import (
         build_model,
         build_feature_columns,

From 48757db2d75b0bf4499fbedbc04c60f700bdd6b7 Mon Sep 17 00:00:00 2001
From: miguelgfierro <miguelgfierro@users.noreply.github.com>
Date: Thu, 15 Jul 2021 16:28:43 +0000
Subject: [PATCH 02/17] dataset to datasets :boom::boom:

---
 .../entries/stratified_splitter_entry.py      | 27 +++++--
 docs/source/dataset.rst                       | 26 +++----
 examples/00_quick_start/als_movielens.ipynb   |  4 +-
 .../00_quick_start/fastai_movielens.ipynb     |  4 +-
 .../00_quick_start/geoimc_movielens.ipynb     |  2 +-
 .../00_quick_start/lightgbm_tinycriteo.ipynb  |  2 +-
 examples/00_quick_start/ncf_movielens.ipynb   |  4 +-
 examples/00_quick_start/rbm_movielens.ipynb   |  6 +-
 examples/00_quick_start/rlrmc_movielens.ipynb |  6 +-
 examples/00_quick_start/sar_movielens.ipynb   |  4 +-
 .../sar_movielens_with_azureml.ipynb          |  6 +-
 .../sequential_recsys_amazondataset.ipynb     |  4 +-
 examples/00_quick_start/tfidf_covid.ipynb     |  2 +-
 .../00_quick_start/wide_deep_movielens.ipynb  |  6 +-
 examples/01_prepare_data/data_split.ipynb     |  6 +-
 examples/01_prepare_data/mind_utils.ipynb     |  4 +-
 .../wikidata_knowledge_graph.ipynb            |  4 +-
 .../als_deep_dive.ipynb                       |  4 +-
 .../baseline_deep_dive.ipynb                  |  6 +-
 .../cornac_bivae_deep_dive.ipynb              |  4 +-
 .../cornac_bpr_deep_dive.ipynb                |  4 +-
 .../lightgcn_deep_dive.ipynb                  |  4 +-
 .../multi_vae_deep_dive.ipynb                 |  8 +-
 .../rbm_deep_dive.ipynb                       |  6 +-
 .../sar_deep_dive.ipynb                       |  4 +-
 .../standard_vae_deep_dive.ipynb              |  8 +-
 .../surprise_svd_deep_dive.ipynb              |  4 +-
 .../dkn_deep_dive.ipynb                       |  4 +-
 .../mmlspark_lightgbm_criteo.ipynb            |  4 +-
 .../vowpal_wabbit_deep_dive.ipynb             |  4 +-
 examples/02_model_hybrid/fm_deep_dive.ipynb   |  4 +-
 .../02_model_hybrid/lightfm_deep_dive.ipynb   |  2 +-
 examples/02_model_hybrid/ncf_deep_dive.ipynb  |  4 +-
 .../als_movielens_diversity_metrics.ipynb     |  4 +-
 .../azureml_hyperdrive_surprise_svd.ipynb     |  4 +-
 .../azureml_hyperdrive_wide_and_deep.ipynb    |  6 +-
 .../nni_ncf.ipynb                             |  4 +-
 .../nni_surprise_svd.ipynb                    |  4 +-
 .../tuning_spark_als.ipynb                    |  4 +-
 .../aks_locust_load_test.ipynb                |  2 +-
 .../05_operationalize/als_movie_o16n.ipynb    |  8 +-
 .../lightgbm_criteo_o16n.ipynb                |  2 +-
 examples/06_benchmarks/movielens.ipynb        |  4 +-
 .../KDD2020-tutorial/step5_run_lightgcn.ipynb |  4 +-
 reco_utils/dataset/amazon_reviews.py          |  2 +-
 reco_utils/dataset/criteo.py                  |  2 +-
 reco_utils/dataset/mind.py                    | 76 ++++++++++---------
 reco_utils/dataset/movielens.py               |  2 +-
 reco_utils/dataset/python_splitters.py        |  2 +-
 reco_utils/dataset/spark_splitters.py         |  2 +-
 reco_utils/evaluation/python_evaluation.py    |  2 +-
 .../recommender/deeprec/deeprec_utils.py      |  2 +-
 reco_utils/recommender/geoimc/geoimc_utils.py |  4 +-
 .../recommender/newsrec/newsrec_utils.py      | 19 +++--
 tests/conftest.py                             |  4 +-
 .../reco_utils/dataset/test_criteo.py         |  2 +-
 .../reco_utils/dataset/test_mind.py           |  2 +-
 .../reco_utils/dataset/test_movielens.py      |  2 +-
 tests/smoke/reco_utils/dataset/test_criteo.py |  2 +-
 tests/smoke/reco_utils/dataset/test_mind.py   |  2 +-
 .../reco_utils/dataset/test_movielens.py      |  2 +-
 .../recommender/test_deeprec_model.py         | 10 ++-
 .../recommender/test_deeprec_utils.py         |  6 +-
 .../reco_utils/dataset/test_covid_utils.py    |  6 +-
 tests/unit/reco_utils/dataset/test_dataset.py |  2 +-
 .../dataset/test_pandas_df_utils.py           |  2 +-
 .../dataset/test_python_splitter.py           |  4 +-
 .../reco_utils/dataset/test_spark_splitter.py |  4 +-
 tests/unit/reco_utils/dataset/test_sparse.py  |  2 +-
 .../unit/reco_utils/dataset/test_wikidata.py  |  2 +-
 .../recommender/test_deeprec_model.py         |  6 +-
 .../recommender/test_deeprec_utils.py         |  2 +-
 72 files changed, 219 insertions(+), 193 deletions(-)

diff --git a/contrib/azureml_designer_modules/entries/stratified_splitter_entry.py b/contrib/azureml_designer_modules/entries/stratified_splitter_entry.py
index bbde573d6e..b64f162d30 100644
--- a/contrib/azureml_designer_modules/entries/stratified_splitter_entry.py
+++ b/contrib/azureml_designer_modules/entries/stratified_splitter_entry.py
@@ -1,7 +1,7 @@
 import argparse
 
 from azureml.studio.core.logger import module_logger as logger
-from reco_utils.dataset.python_splitters import python_stratified_split
+from reco_utils.datasets.python_splitters import python_stratified_split
 from azureml.studio.core.data_frame_schema import DataFrameSchema
 from azureml.studio.core.io.data_frame_directory import (
     load_data_frame_from_directory,
@@ -13,30 +13,41 @@
     parser = argparse.ArgumentParser()
 
     parser.add_argument(
-        "--input-path", help="The input directory.",
+        "--input-path",
+        help="The input directory.",
     )
 
     parser.add_argument(
-        "--ratio", type=float, help="A float parameter.",
+        "--ratio",
+        type=float,
+        help="A float parameter.",
     )
 
     parser.add_argument(
-        "--col-user", type=str, help="A string parameter.",
+        "--col-user",
+        type=str,
+        help="A string parameter.",
     )
 
     parser.add_argument(
-        "--col-item", type=str, help="A string parameter.",
+        "--col-item",
+        type=str,
+        help="A string parameter.",
     )
 
     parser.add_argument(
-        "--seed", type=int, help="An int parameter.",
+        "--seed",
+        type=int,
+        help="An int parameter.",
     )
 
     parser.add_argument(
-        "--output-train", help="The output training data directory.",
+        "--output-train",
+        help="The output training data directory.",
     )
     parser.add_argument(
-        "--output-test", help="The output test data directory.",
+        "--output-test",
+        help="The output test data directory.",
     )
 
     args, _ = parser.parse_known_args()
diff --git a/docs/source/dataset.rst b/docs/source/dataset.rst
index 928d3e817c..0179d93654 100644
--- a/docs/source/dataset.rst
+++ b/docs/source/dataset.rst
@@ -20,7 +20,7 @@ information, ratings, and a plaintext review.
     J. McAuley and J. Leskovec, "Hidden factors and hidden topics: understanding rating dimensions with review text", 
     RecSys, 2013.
 
-.. automodule:: reco_utils.dataset.amazon_reviews
+.. automodule:: reco_utils.datasets.amazon_reviews
     :members:
 
 CORD-19
@@ -44,7 +44,7 @@ to generate new insights in support of the fight against this infectious disease
     Funk, K., Kinney, R., Liu, Z., Merrill, W. and Mooney, P. "Cord-19: The COVID-19 Open Research Dataset.", 2020.
 
 
-.. automodule:: reco_utils.dataset.covid_utils
+.. automodule:: reco_utils.datasets.covid_utils
     :members:
 
 Criteo
@@ -55,7 +55,7 @@ for millions of display Ads. Every Ad has has 40 attributes, the first attribute
 that the Ad has been clicked on and a 0 represents it wasn't clicked on. The rest consist of 13 integer columns and 
 26 categorical columns.
 
-.. automodule:: reco_utils.dataset.criteo
+.. automodule:: reco_utils.datasets.criteo
     :members:
 
 MIND
@@ -76,7 +76,7 @@ this impression. To protect user privacy, each user was de-linked from the produ
 
 
 
-.. automodule:: reco_utils.dataset.mind
+.. automodule:: reco_utils.datasets.mind
     :members:  
 
 MovieLens
@@ -101,52 +101,52 @@ It comes with several sizes:
     ACM Transactions on Interactive Intelligent Systems (TiiS) 5, 4, Article 19, 
     DOI=http://dx.doi.org/10.1145/2827872, 2015.
 
-.. automodule:: reco_utils.dataset.movielens
+.. automodule:: reco_utils.datasets.movielens
     :members:
 
 Download utilities 
 ******************
 
-.. automodule:: reco_utils.dataset.download_utils
+.. automodule:: reco_utils.datasets.download_utils
     :members:
 
 
 Cosmos CLI utilities
 *********************
 
-.. automodule:: reco_utils.dataset.cosmos_cli
+.. automodule:: reco_utils.datasets.cosmos_cli
     :members:
 
 
 Pandas dataframe utilities
 ***************************
 
-.. automodule:: reco_utils.dataset.pandas_df_utils
+.. automodule:: reco_utils.datasets.pandas_df_utils
     :members:
 
 
 Splitter utilities
 ******************
 
-.. automodule:: reco_utils.dataset.python_splitters
+.. automodule:: reco_utils.datasets.python_splitters
     :members:
 
-.. automodule:: reco_utils.dataset.spark_splitters
+.. automodule:: reco_utils.datasets.spark_splitters
     :members:
 
-.. automodule:: reco_utils.dataset.split_utils
+.. automodule:: reco_utils.datasets.split_utils
     :members:
 
 
 Sparse utilities
 ****************
 
-.. automodule:: reco_utils.dataset.sparse
+.. automodule:: reco_utils.datasets.sparse
     :members:
   
 
 Knowledge graph utilities
 *************************
 
-.. automodule:: reco_utils.dataset.wikidata
+.. automodule:: reco_utils.datasets.wikidata
     :members:
diff --git a/examples/00_quick_start/als_movielens.ipynb b/examples/00_quick_start/als_movielens.ipynb
index 84a26276ea..18a9f4db7b 100644
--- a/examples/00_quick_start/als_movielens.ipynb
+++ b/examples/00_quick_start/als_movielens.ipynb
@@ -53,9 +53,9 @@
     "from pyspark.sql.types import StringType, FloatType, IntegerType, LongType\n",
     "\n",
     "from reco_utils.utils.timer import Timer\n",
-    "from reco_utils.dataset import movielens\n",
+    "from reco_utils.datasets import movielens\n",
     "from reco_utils.utils.notebook_utils import is_jupyter\n",
-    "from reco_utils.dataset.spark_splitters import spark_random_split\n",
+    "from reco_utils.datasets.spark_splitters import spark_random_split\n",
     "from reco_utils.evaluation.spark_evaluation import SparkRatingEvaluation, SparkRankingEvaluation\n",
     "from reco_utils.utils.spark_utils import start_or_get_spark\n",
     "\n",
diff --git a/examples/00_quick_start/fastai_movielens.ipynb b/examples/00_quick_start/fastai_movielens.ipynb
index d79bfb5f13..dbfaf0027f 100644
--- a/examples/00_quick_start/fastai_movielens.ipynb
+++ b/examples/00_quick_start/fastai_movielens.ipynb
@@ -50,8 +50,8 @@
     "from fastai.collab import EmbeddingDotBias, collab_learner, CollabDataBunch, load_learner\n",
     "\n",
     "from reco_utils.utils.timer import Timer\n",
-    "from reco_utils.dataset import movielens\n",
-    "from reco_utils.dataset.python_splitters import python_stratified_split\n",
+    "from reco_utils.datasets import movielens\n",
+    "from reco_utils.datasets.python_splitters import python_stratified_split\n",
     "from reco_utils.recommender.fastai.fastai_utils import cartesian_product, score\n",
     "from reco_utils.evaluation.python_evaluation import map_at_k, ndcg_at_k, precision_at_k, recall_at_k\n",
     "from reco_utils.evaluation.python_evaluation import rmse, mae, rsquared, exp_var\n",
diff --git a/examples/00_quick_start/geoimc_movielens.ipynb b/examples/00_quick_start/geoimc_movielens.ipynb
index f658a2e0ee..7b4fd8ef18 100644
--- a/examples/00_quick_start/geoimc_movielens.ipynb
+++ b/examples/00_quick_start/geoimc_movielens.ipynb
@@ -27,7 +27,7 @@
     "import papermill as pm\n",
     "import scrapbook as sb\n",
     "\n",
-    "from reco_utils.dataset import movielens\n",
+    "from reco_utils.datasets import movielens\n",
     "from reco_utils.recommender.geoimc.geoimc_data import ML_100K\n",
     "from reco_utils.recommender.geoimc.geoimc_algorithm import IMCProblem\n",
     "from reco_utils.recommender.geoimc.geoimc_predict import Inferer\n",
diff --git a/examples/00_quick_start/lightgbm_tinycriteo.ipynb b/examples/00_quick_start/lightgbm_tinycriteo.ipynb
index 0b01a41181..20a38685ae 100644
--- a/examples/00_quick_start/lightgbm_tinycriteo.ipynb
+++ b/examples/00_quick_start/lightgbm_tinycriteo.ipynb
@@ -59,7 +59,7 @@
     "from sklearn.metrics import roc_auc_score, log_loss\n",
     "\n",
     "import reco_utils.recommender.lightgbm.lightgbm_utils as lgb_utils\n",
-    "import reco_utils.dataset.criteo as criteo\n",
+    "import reco_utils.datasets.criteo as criteo\n",
     "\n",
     "print(\"System version: {}\".format(sys.version))\n",
     "print(\"LightGBM version: {}\".format(lgb.__version__))"
diff --git a/examples/00_quick_start/ncf_movielens.ipynb b/examples/00_quick_start/ncf_movielens.ipynb
index 716486a594..f5564aa685 100644
--- a/examples/00_quick_start/ncf_movielens.ipynb
+++ b/examples/00_quick_start/ncf_movielens.ipynb
@@ -55,9 +55,9 @@
     "from reco_utils.utils.timer import Timer\n",
     "from reco_utils.recommender.ncf.ncf_singlenode import NCF\n",
     "from reco_utils.recommender.ncf.dataset import Dataset as NCFDataset\n",
-    "from reco_utils.dataset import movielens\n",
+    "from reco_utils.datasets import movielens\n",
     "from reco_utils.utils.notebook_utils import is_jupyter\n",
-    "from reco_utils.dataset.python_splitters import python_chrono_split\n",
+    "from reco_utils.datasets.python_splitters import python_chrono_split\n",
     "from reco_utils.evaluation.python_evaluation import (rmse, mae, rsquared, exp_var, map_at_k, ndcg_at_k, precision_at_k, \n",
     "                                                     recall_at_k, get_top_k_items)\n",
     "\n",
diff --git a/examples/00_quick_start/rbm_movielens.ipynb b/examples/00_quick_start/rbm_movielens.ipynb
index 80c45c6be3..33ad814122 100644
--- a/examples/00_quick_start/rbm_movielens.ipynb
+++ b/examples/00_quick_start/rbm_movielens.ipynb
@@ -70,11 +70,11 @@
     "tf.get_logger().setLevel('ERROR') # only show error messages\n",
     "\n",
     "from reco_utils.recommender.rbm.rbm import RBM\n",
-    "from reco_utils.dataset.python_splitters import numpy_stratified_split\n",
-    "from reco_utils.dataset.sparse import AffinityMatrix\n",
+    "from reco_utils.datasets.python_splitters import numpy_stratified_split\n",
+    "from reco_utils.datasets.sparse import AffinityMatrix\n",
     "\n",
     "\n",
-    "from reco_utils.dataset import movielens\n",
+    "from reco_utils.datasets import movielens\n",
     "from reco_utils.evaluation.python_evaluation import map_at_k, ndcg_at_k, precision_at_k, recall_at_k\n",
     "\n",
     "#For interactive mode only\n",
diff --git a/examples/00_quick_start/rlrmc_movielens.ipynb b/examples/00_quick_start/rlrmc_movielens.ipynb
index 11efbbea31..e1d71dc768 100644
--- a/examples/00_quick_start/rlrmc_movielens.ipynb
+++ b/examples/00_quick_start/rlrmc_movielens.ipynb
@@ -33,9 +33,9 @@
     "import time\n",
     "import pandas as pd\n",
     "\n",
-    "from reco_utils.dataset.python_splitters import python_random_split\n",
-    "from reco_utils.dataset.python_splitters import python_stratified_split\n",
-    "from reco_utils.dataset import movielens\n",
+    "from reco_utils.datasets.python_splitters import python_random_split\n",
+    "from reco_utils.datasets.python_splitters import python_stratified_split\n",
+    "from reco_utils.datasets import movielens\n",
     "from reco_utils.recommender.rlrmc.RLRMCdataset import RLRMCdataset \n",
     "from reco_utils.recommender.rlrmc.RLRMCalgorithm import RLRMCalgorithm \n",
     "# Pymanopt installation is required via\n",
diff --git a/examples/00_quick_start/sar_movielens.ipynb b/examples/00_quick_start/sar_movielens.ipynb
index 93f30e9b4d..2e65683ffe 100644
--- a/examples/00_quick_start/sar_movielens.ipynb
+++ b/examples/00_quick_start/sar_movielens.ipynb
@@ -66,8 +66,8 @@
     "\n",
     "from reco_utils.utils.python_utils import binarize\n",
     "from reco_utils.utils.timer import Timer\n",
-    "from reco_utils.dataset import movielens\n",
-    "from reco_utils.dataset.python_splitters import python_stratified_split\n",
+    "from reco_utils.datasets import movielens\n",
+    "from reco_utils.datasets.python_splitters import python_stratified_split\n",
     "from reco_utils.evaluation.python_evaluation import (\n",
     "    map_at_k,\n",
     "    ndcg_at_k,\n",
diff --git a/examples/00_quick_start/sar_movielens_with_azureml.ipynb b/examples/00_quick_start/sar_movielens_with_azureml.ipynb
index 46ba3a05ed..8a972d2407 100644
--- a/examples/00_quick_start/sar_movielens_with_azureml.ipynb
+++ b/examples/00_quick_start/sar_movielens_with_azureml.ipynb
@@ -83,7 +83,7 @@
     "from azureml.train.estimator import Estimator\n",
     "from azureml.widgets import RunDetails\n",
     "\n",
-    "from reco_utils.dataset import movielens\n",
+    "from reco_utils.datasets import movielens\n",
     "\n",
     "print(\"azureml.core version: {}\".format(azureml.core.VERSION))"
    ]
@@ -338,8 +338,8 @@
     "from sklearn.externals import joblib\n",
     "\n",
     "from reco_utils.utils.timer import Timer\n",
-    "from reco_utils.dataset import movielens\n",
-    "from reco_utils.dataset.python_splitters import python_stratified_split\n",
+    "from reco_utils.datasets import movielens\n",
+    "from reco_utils.datasets.python_splitters import python_stratified_split\n",
     "from reco_utils.evaluation.python_evaluation import map_at_k, ndcg_at_k, precision_at_k, recall_at_k\n",
     "from reco_utils.recommender.sar.sar_singlenode import SARSingleNode\n",
     "\n",
diff --git a/examples/00_quick_start/sequential_recsys_amazondataset.ipynb b/examples/00_quick_start/sequential_recsys_amazondataset.ipynb
index 5ff2c15039..c0a14583e2 100644
--- a/examples/00_quick_start/sequential_recsys_amazondataset.ipynb
+++ b/examples/00_quick_start/sequential_recsys_amazondataset.ipynb
@@ -68,8 +68,8 @@
     "from reco_utils.recommender.deeprec.deeprec_utils import (\n",
     "    prepare_hparams\n",
     ")\n",
-    "from reco_utils.dataset.amazon_reviews import download_and_extract, data_preprocessing\n",
-    "from reco_utils.dataset.download_utils import maybe_download\n",
+    "from reco_utils.datasets.amazon_reviews import download_and_extract, data_preprocessing\n",
+    "from reco_utils.datasets.download_utils import maybe_download\n",
     "\n",
     "\n",
     "from reco_utils.recommender.deeprec.models.sequential.sli_rec import SLI_RECModel as SeqModel\n",
diff --git a/examples/00_quick_start/tfidf_covid.ipynb b/examples/00_quick_start/tfidf_covid.ipynb
index 00c7ba490e..9a2b56d707 100644
--- a/examples/00_quick_start/tfidf_covid.ipynb
+++ b/examples/00_quick_start/tfidf_covid.ipynb
@@ -38,7 +38,7 @@
    "source": [
     "import sys\n",
     "# Import functions\n",
-    "from reco_utils.dataset import covid_utils\n",
+    "from reco_utils.datasets import covid_utils\n",
     "from reco_utils.recommender.tfidf.tfidf_utils import TfidfRecommender\n",
     "\n",
     "# Print version\n",
diff --git a/examples/00_quick_start/wide_deep_movielens.ipynb b/examples/00_quick_start/wide_deep_movielens.ipynb
index 1fa6ae280a..905354da18 100644
--- a/examples/00_quick_start/wide_deep_movielens.ipynb
+++ b/examples/00_quick_start/wide_deep_movielens.ipynb
@@ -73,9 +73,9 @@
     "    SEED\n",
     ")\n",
     "from reco_utils.utils import tf_utils, gpu_utils, plot\n",
-    "from reco_utils.dataset import movielens\n",
-    "from reco_utils.dataset.pandas_df_utils import user_item_pairs\n",
-    "from reco_utils.dataset.python_splitters import python_random_split\n",
+    "from reco_utils.datasets import movielens\n",
+    "from reco_utils.datasets.pandas_df_utils import user_item_pairs\n",
+    "from reco_utils.datasets.python_splitters import python_random_split\n",
     "import reco_utils.evaluation.python_evaluation as evaluator\n",
     "import reco_utils.recommender.wide_deep.wide_deep_utils as wide_deep\n",
     "\n",
diff --git a/examples/01_prepare_data/data_split.ipynb b/examples/01_prepare_data/data_split.ipynb
index 6119834d42..a184944fe7 100644
--- a/examples/01_prepare_data/data_split.ipynb
+++ b/examples/01_prepare_data/data_split.ipynb
@@ -57,13 +57,13 @@
     "from datetime import datetime, timedelta\n",
     "\n",
     "from reco_utils.utils.spark_utils import start_or_get_spark\n",
-    "from reco_utils.dataset.download_utils import maybe_download\n",
-    "from reco_utils.dataset.python_splitters import (\n",
+    "from reco_utils.datasets.download_utils import maybe_download\n",
+    "from reco_utils.datasets.python_splitters import (\n",
     "    python_random_split, \n",
     "    python_chrono_split, \n",
     "    python_stratified_split\n",
     ")\n",
-    "from reco_utils.dataset.spark_splitters import (\n",
+    "from reco_utils.datasets.spark_splitters import (\n",
     "    spark_random_split, \n",
     "    spark_chrono_split, \n",
     "    spark_stratified_split,\n",
diff --git a/examples/01_prepare_data/mind_utils.ipynb b/examples/01_prepare_data/mind_utils.ipynb
index 1a7ba75701..5a25b72e29 100644
--- a/examples/01_prepare_data/mind_utils.ipynb
+++ b/examples/01_prepare_data/mind_utils.ipynb
@@ -53,13 +53,13 @@
     "import scrapbook as sb\n",
     "\n",
     "from tempfile import TemporaryDirectory\n",
-    "from reco_utils.dataset.mind import (download_mind,\n",
+    "from reco_utils.datasets.mind import (download_mind,\n",
     "                                     extract_mind,\n",
     "                                     download_and_extract_glove,\n",
     "                                     load_glove_matrix,\n",
     "                                     word_tokenize\n",
     "                                    )\n",
-    "from reco_utils.dataset.download_utils import unzip_file\n",
+    "from reco_utils.datasets.download_utils import unzip_file\n",
     "\n",
     "print(\"System version: {}\".format(sys.version))\n"
    ]
diff --git a/examples/01_prepare_data/wikidata_knowledge_graph.ipynb b/examples/01_prepare_data/wikidata_knowledge_graph.ipynb
index 28c061d96b..b688996f0f 100644
--- a/examples/01_prepare_data/wikidata_knowledge_graph.ipynb
+++ b/examples/01_prepare_data/wikidata_knowledge_graph.ipynb
@@ -39,9 +39,9 @@
     "import pandas as pd\n",
     "import networkx as nx\n",
     "import matplotlib.pyplot as plt\n",
-    "from reco_utils.dataset import movielens\n",
+    "from reco_utils.datasets import movielens\n",
     "\n",
-    "from reco_utils.dataset.wikidata import (search_wikidata, \n",
+    "from reco_utils.datasets.wikidata import (search_wikidata, \n",
     "                                         find_wikidata_id, \n",
     "                                         query_entity_links, \n",
     "                                         read_linked_entities,\n",
diff --git a/examples/02_model_collaborative_filtering/als_deep_dive.ipynb b/examples/02_model_collaborative_filtering/als_deep_dive.ipynb
index 3c5fa91bb7..605933977b 100644
--- a/examples/02_model_collaborative_filtering/als_deep_dive.ipynb
+++ b/examples/02_model_collaborative_filtering/als_deep_dive.ipynb
@@ -120,11 +120,11 @@
     "from pyspark.sql.types import StructType, StructField\n",
     "from pyspark.sql.types import FloatType, IntegerType, LongType\n",
     "\n",
-    "from reco_utils.dataset import movielens\n",
+    "from reco_utils.datasets import movielens\n",
     "from reco_utils.common.spark_utils import start_or_get_spark\n",
     "from reco_utils.evaluation.spark_evaluation import SparkRankingEvaluation, SparkRatingEvaluation\n",
     "from reco_utils.tuning.parameter_sweep import generate_param_grid\n",
-    "from reco_utils.dataset.spark_splitters import spark_random_split\n",
+    "from reco_utils.datasets.spark_splitters import spark_random_split\n",
     "\n",
     "print(\"System version: {}\".format(sys.version))\n",
     "print(\"Pandas version: {}\".format(pd.__version__))\n",
diff --git a/examples/02_model_collaborative_filtering/baseline_deep_dive.ipynb b/examples/02_model_collaborative_filtering/baseline_deep_dive.ipynb
index d00ca8182c..ec880c1730 100644
--- a/examples/02_model_collaborative_filtering/baseline_deep_dive.ipynb
+++ b/examples/02_model_collaborative_filtering/baseline_deep_dive.ipynb
@@ -71,9 +71,9 @@
     "import pandas as pd\n",
     "\n",
     "from reco_utils.utils.notebook_utils import is_jupyter\n",
-    "from reco_utils.dataset import movielens\n",
-    "from reco_utils.dataset.python_splitters import python_random_split\n",
-    "from reco_utils.dataset.pandas_df_utils import filter_by\n",
+    "from reco_utils.datasets import movielens\n",
+    "from reco_utils.datasets.python_splitters import python_random_split\n",
+    "from reco_utils.datasets.pandas_df_utils import filter_by\n",
     "from reco_utils.evaluation.python_evaluation import (\n",
     "    rmse, mae, rsquared, exp_var,\n",
     "    map_at_k, ndcg_at_k, precision_at_k, recall_at_k\n",
diff --git a/examples/02_model_collaborative_filtering/cornac_bivae_deep_dive.ipynb b/examples/02_model_collaborative_filtering/cornac_bivae_deep_dive.ipynb
index df1b840a1b..838761fc34 100644
--- a/examples/02_model_collaborative_filtering/cornac_bivae_deep_dive.ipynb
+++ b/examples/02_model_collaborative_filtering/cornac_bivae_deep_dive.ipynb
@@ -51,8 +51,8 @@
     "import papermill as pm\n",
     "import scrapbook as sb\n",
     "import pandas as pd\n",
-    "from reco_utils.dataset import movielens\n",
-    "from reco_utils.dataset.python_splitters import python_random_split\n",
+    "from reco_utils.datasets import movielens\n",
+    "from reco_utils.datasets.python_splitters import python_random_split\n",
     "from reco_utils.evaluation.python_evaluation import map_at_k, ndcg_at_k, precision_at_k, recall_at_k\n",
     "from reco_utils.recommender.cornac.cornac_utils import predict_ranking\n",
     "from reco_utils.utils.timer import Timer\n",
diff --git a/examples/02_model_collaborative_filtering/cornac_bpr_deep_dive.ipynb b/examples/02_model_collaborative_filtering/cornac_bpr_deep_dive.ipynb
index 29ab3f9fd1..dbba6a4164 100644
--- a/examples/02_model_collaborative_filtering/cornac_bpr_deep_dive.ipynb
+++ b/examples/02_model_collaborative_filtering/cornac_bpr_deep_dive.ipynb
@@ -49,8 +49,8 @@
     "import papermill as pm\n",
     "import scrapbook as sb\n",
     "import pandas as pd\n",
-    "from reco_utils.dataset import movielens\n",
-    "from reco_utils.dataset.python_splitters import python_random_split\n",
+    "from reco_utils.datasets import movielens\n",
+    "from reco_utils.datasets.python_splitters import python_random_split\n",
     "from reco_utils.evaluation.python_evaluation import map_at_k, ndcg_at_k, precision_at_k, recall_at_k\n",
     "from reco_utils.recommender.cornac.cornac_utils import predict_ranking\n",
     "from reco_utils.utils.timer import Timer\n",
diff --git a/examples/02_model_collaborative_filtering/lightgcn_deep_dive.ipynb b/examples/02_model_collaborative_filtering/lightgcn_deep_dive.ipynb
index 9671ca4fdf..d97f5e1ee4 100644
--- a/examples/02_model_collaborative_filtering/lightgcn_deep_dive.ipynb
+++ b/examples/02_model_collaborative_filtering/lightgcn_deep_dive.ipynb
@@ -55,8 +55,8 @@
     "from reco_utils.utils.timer import Timer\n",
     "from reco_utils.recommender.deeprec.models.graphrec.lightgcn import LightGCN\n",
     "from reco_utils.recommender.deeprec.DataModel.ImplicitCF import ImplicitCF\n",
-    "from reco_utils.dataset import movielens\n",
-    "from reco_utils.dataset.python_splitters import python_stratified_split\n",
+    "from reco_utils.datasets import movielens\n",
+    "from reco_utils.datasets.python_splitters import python_stratified_split\n",
     "from reco_utils.evaluation.python_evaluation import map_at_k, ndcg_at_k, precision_at_k, recall_at_k\n",
     "from reco_utils.utils.constants import SEED as DEFAULT_SEED\n",
     "from reco_utils.recommender.deeprec.deeprec_utils import prepare_hparams\n",
diff --git a/examples/02_model_collaborative_filtering/multi_vae_deep_dive.ipynb b/examples/02_model_collaborative_filtering/multi_vae_deep_dive.ipynb
index b2b94f6b5a..413aeda975 100644
--- a/examples/02_model_collaborative_filtering/multi_vae_deep_dive.ipynb
+++ b/examples/02_model_collaborative_filtering/multi_vae_deep_dive.ipynb
@@ -97,12 +97,12 @@
     "import keras\n",
     "\n",
     "from reco_utils.utils.timer import Timer\n",
-    "from reco_utils.dataset import movielens\n",
-    "from reco_utils.dataset.split_utils import min_rating_filter_pandas\n",
-    "from reco_utils.dataset.python_splitters import numpy_stratified_split\n",
+    "from reco_utils.datasets import movielens\n",
+    "from reco_utils.datasets.split_utils import min_rating_filter_pandas\n",
+    "from reco_utils.datasets.python_splitters import numpy_stratified_split\n",
     "from reco_utils.evaluation.python_evaluation import map_at_k, ndcg_at_k, precision_at_k, recall_at_k\n",
     "\n",
-    "from reco_utils.dataset.sparse import AffinityMatrix\n",
+    "from reco_utils.datasets.sparse import AffinityMatrix\n",
     "from reco_utils.utils.python_utils import binarize\n",
     "from reco_utils.recommender.vae.multinomial_vae import Mult_VAE\n",
     "\n",
diff --git a/examples/02_model_collaborative_filtering/rbm_deep_dive.ipynb b/examples/02_model_collaborative_filtering/rbm_deep_dive.ipynb
index 2aa462dfac..8787aa16a7 100644
--- a/examples/02_model_collaborative_filtering/rbm_deep_dive.ipynb
+++ b/examples/02_model_collaborative_filtering/rbm_deep_dive.ipynb
@@ -90,11 +90,11 @@
     "\n",
     "#RBM \n",
     "from reco_utils.recommender.rbm.rbm import RBM\n",
-    "from reco_utils.dataset.python_splitters import numpy_stratified_split\n",
-    "from reco_utils.dataset.sparse import AffinityMatrix\n",
+    "from reco_utils.datasets.python_splitters import numpy_stratified_split\n",
+    "from reco_utils.datasets.sparse import AffinityMatrix\n",
     "\n",
     "#Evaluation libraries\n",
-    "from reco_utils.dataset import movielens \n",
+    "from reco_utils.datasets import movielens \n",
     "\n",
     "from reco_utils.evaluation.python_evaluation import (\n",
     "    map_at_k,\n",
diff --git a/examples/02_model_collaborative_filtering/sar_deep_dive.ipynb b/examples/02_model_collaborative_filtering/sar_deep_dive.ipynb
index 5a37c637d8..254f5bc12f 100644
--- a/examples/02_model_collaborative_filtering/sar_deep_dive.ipynb
+++ b/examples/02_model_collaborative_filtering/sar_deep_dive.ipynb
@@ -131,8 +131,8 @@
     "import pandas as pd\n",
     "import papermill as pm\n",
     "\n",
-    "from reco_utils.dataset import movielens\n",
-    "from reco_utils.dataset.python_splitters import python_stratified_split\n",
+    "from reco_utils.datasets import movielens\n",
+    "from reco_utils.datasets.python_splitters import python_stratified_split\n",
     "from reco_utils.evaluation.python_evaluation import map_at_k, ndcg_at_k, precision_at_k, recall_at_k\n",
     "from reco_utils.recommender.sar.sar_singlenode import SARSingleNode\n",
     "\n",
diff --git a/examples/02_model_collaborative_filtering/standard_vae_deep_dive.ipynb b/examples/02_model_collaborative_filtering/standard_vae_deep_dive.ipynb
index e3423c070e..5ec4626695 100644
--- a/examples/02_model_collaborative_filtering/standard_vae_deep_dive.ipynb
+++ b/examples/02_model_collaborative_filtering/standard_vae_deep_dive.ipynb
@@ -97,13 +97,13 @@
     "import keras\n",
     "\n",
     "from reco_utils.utils.timer import Timer\n",
-    "from reco_utils.dataset import movielens\n",
-    "from reco_utils.dataset.split_utils import min_rating_filter_pandas\n",
-    "from reco_utils.dataset.python_splitters import numpy_stratified_split\n",
+    "from reco_utils.datasets import movielens\n",
+    "from reco_utils.datasets.split_utils import min_rating_filter_pandas\n",
+    "from reco_utils.datasets.python_splitters import numpy_stratified_split\n",
     "from reco_utils.evaluation.python_evaluation import map_at_k, ndcg_at_k, precision_at_k, recall_at_k\n",
     "from reco_utils.utils.constants import SEED as DEFAULT_SEED\n",
     "\n",
-    "from reco_utils.dataset.sparse import AffinityMatrix\n",
+    "from reco_utils.datasets.sparse import AffinityMatrix\n",
     "from reco_utils.utils.python_utils import binarize\n",
     "from reco_utils.recommender.vae.standard_vae import StandardVAE\n",
     "\n",
diff --git a/examples/02_model_collaborative_filtering/surprise_svd_deep_dive.ipynb b/examples/02_model_collaborative_filtering/surprise_svd_deep_dive.ipynb
index 5e804a9ecc..d8068ecb20 100644
--- a/examples/02_model_collaborative_filtering/surprise_svd_deep_dive.ipynb
+++ b/examples/02_model_collaborative_filtering/surprise_svd_deep_dive.ipynb
@@ -106,8 +106,8 @@
     "import pandas as pd\n",
     "\n",
     "from reco_utils.utils.timer import Timer\n",
-    "from reco_utils.dataset import movielens\n",
-    "from reco_utils.dataset.python_splitters import python_random_split\n",
+    "from reco_utils.datasets import movielens\n",
+    "from reco_utils.datasets.python_splitters import python_random_split\n",
     "from reco_utils.evaluation.python_evaluation import (rmse, mae, rsquared, exp_var, map_at_k, ndcg_at_k, precision_at_k, \n",
     "                                                     recall_at_k, get_top_k_items)\n",
     "from reco_utils.recommender.surprise.surprise_utils import predict, compute_ranking_predictions\n",
diff --git a/examples/02_model_content_based_filtering/dkn_deep_dive.ipynb b/examples/02_model_content_based_filtering/dkn_deep_dive.ipynb
index 6bab53479e..210c27655b 100644
--- a/examples/02_model_content_based_filtering/dkn_deep_dive.ipynb
+++ b/examples/02_model_content_based_filtering/dkn_deep_dive.ipynb
@@ -139,8 +139,8 @@
     "import tensorflow as tf\n",
     "tf.get_logger().setLevel('ERROR') # only show error messages\n",
     "\n",
-    "from reco_utils.dataset.download_utils import maybe_download\n",
-    "from reco_utils.dataset.mind import (download_mind, \n",
+    "from reco_utils.datasets.download_utils import maybe_download\n",
+    "from reco_utils.datasets.mind import (download_mind, \n",
     "                                     extract_mind, \n",
     "                                     read_clickhistory, \n",
     "                                     get_train_input, \n",
diff --git a/examples/02_model_content_based_filtering/mmlspark_lightgbm_criteo.ipynb b/examples/02_model_content_based_filtering/mmlspark_lightgbm_criteo.ipynb
index b10283149c..5216d72f50 100644
--- a/examples/02_model_content_based_filtering/mmlspark_lightgbm_criteo.ipynb
+++ b/examples/02_model_content_based_filtering/mmlspark_lightgbm_criteo.ipynb
@@ -73,8 +73,8 @@
     "\n",
     "from reco_utils.utils.spark_utils import start_or_get_spark\n",
     "from reco_utils.utils.notebook_utils import is_databricks\n",
-    "from reco_utils.dataset.criteo import load_spark_df\n",
-    "from reco_utils.dataset.spark_splitters import spark_random_split\n",
+    "from reco_utils.datasets.criteo import load_spark_df\n",
+    "from reco_utils.datasets.spark_splitters import spark_random_split\n",
     "\n",
     "# Setup MML Spark\n",
     "if not is_databricks():\n",
diff --git a/examples/02_model_content_based_filtering/vowpal_wabbit_deep_dive.ipynb b/examples/02_model_content_based_filtering/vowpal_wabbit_deep_dive.ipynb
index 52ea265657..5960b4a405 100644
--- a/examples/02_model_content_based_filtering/vowpal_wabbit_deep_dive.ipynb
+++ b/examples/02_model_content_based_filtering/vowpal_wabbit_deep_dive.ipynb
@@ -87,8 +87,8 @@
     "import scrapbook as sb\n",
     "\n",
     "from reco_utils.utils.notebook_utils import is_jupyter\n",
-    "from reco_utils.dataset.movielens import load_pandas_df\n",
-    "from reco_utils.dataset.python_splitters import python_random_split\n",
+    "from reco_utils.datasets.movielens import load_pandas_df\n",
+    "from reco_utils.datasets.python_splitters import python_random_split\n",
     "from reco_utils.evaluation.python_evaluation import (rmse, mae, exp_var, rsquared, get_top_k_items,\n",
     "                                                     map_at_k, ndcg_at_k, precision_at_k, recall_at_k)\n",
     "\n",
diff --git a/examples/02_model_hybrid/fm_deep_dive.ipynb b/examples/02_model_hybrid/fm_deep_dive.ipynb
index a22046f85f..c5c366ecef 100644
--- a/examples/02_model_hybrid/fm_deep_dive.ipynb
+++ b/examples/02_model_hybrid/fm_deep_dive.ipynb
@@ -253,9 +253,9 @@
     "\n",
     "from reco_utils.utils.constants import SEED\n",
     "from reco_utils.utils.timer import Timer\n",
-    "from reco_utils.dataset.download_utils import maybe_download, unzip_file\n",
+    "from reco_utils.datasets.download_utils import maybe_download, unzip_file\n",
     "from reco_utils.tuning.parameter_sweep import generate_param_grid\n",
-    "from reco_utils.dataset.pandas_df_utils import LibffmConverter\n",
+    "from reco_utils.datasets.pandas_df_utils import LibffmConverter\n",
     "\n",
     "print(\"System version: {}\".format(sys.version))\n",
     "print(\"Xlearn version: {}\".format(xl.__version__))"
diff --git a/examples/02_model_hybrid/lightfm_deep_dive.ipynb b/examples/02_model_hybrid/lightfm_deep_dive.ipynb
index 1f6e649159..686564d638 100755
--- a/examples/02_model_hybrid/lightfm_deep_dive.ipynb
+++ b/examples/02_model_hybrid/lightfm_deep_dive.ipynb
@@ -155,7 +155,7 @@
     "    precision_at_k, recall_at_k)\n",
     "\n",
     "from reco_utils.common.timer import Timer\n",
-    "from reco_utils.dataset import movielens\n",
+    "from reco_utils.datasets import movielens\n",
     "from reco_utils.recommender.lightfm.lightfm_utils import (\n",
     "    track_model_metrics, prepare_test_df, prepare_all_predictions,\n",
     "    compare_metric, similar_users, similar_items)\n",
diff --git a/examples/02_model_hybrid/ncf_deep_dive.ipynb b/examples/02_model_hybrid/ncf_deep_dive.ipynb
index 4f0e3f3894..481ebd13c6 100644
--- a/examples/02_model_hybrid/ncf_deep_dive.ipynb
+++ b/examples/02_model_hybrid/ncf_deep_dive.ipynb
@@ -56,8 +56,8 @@
     "from reco_utils.utils.timer import Timer\n",
     "from reco_utils.recommender.ncf.ncf_singlenode import NCF\n",
     "from reco_utils.recommender.ncf.dataset import Dataset as NCFDataset\n",
-    "from reco_utils.dataset import movielens\n",
-    "from reco_utils.dataset.python_splitters import python_chrono_split\n",
+    "from reco_utils.datasets import movielens\n",
+    "from reco_utils.datasets.python_splitters import python_chrono_split\n",
     "from reco_utils.evaluation.python_evaluation import (rmse, mae, rsquared, exp_var, map_at_k, ndcg_at_k, precision_at_k, \n",
     "                                                     recall_at_k, get_top_k_items)\n",
     "from reco_utils.utils.constants import SEED as DEFAULT_SEED\n",
diff --git a/examples/03_evaluate/als_movielens_diversity_metrics.ipynb b/examples/03_evaluate/als_movielens_diversity_metrics.ipynb
index 1733c06b1f..bbf0495b84 100644
--- a/examples/03_evaluate/als_movielens_diversity_metrics.ipynb
+++ b/examples/03_evaluate/als_movielens_diversity_metrics.ipynb
@@ -69,9 +69,9 @@
     "from pyspark.sql.types import StringType, FloatType, IntegerType, LongType\n",
     "\n",
     "from reco_utils.utils.timer import Timer\n",
-    "from reco_utils.dataset import movielens\n",
+    "from reco_utils.datasets import movielens\n",
     "from reco_utils.utils.notebook_utils import is_jupyter\n",
-    "from reco_utils.dataset.spark_splitters import spark_random_split\n",
+    "from reco_utils.datasets.spark_splitters import spark_random_split\n",
     "from reco_utils.evaluation.spark_evaluation import SparkRatingEvaluation, SparkRankingEvaluation\n",
     "from reco_utils.utils.spark_utils import start_or_get_spark\n",
     "\n",
diff --git a/examples/04_model_select_and_optimize/azureml_hyperdrive_surprise_svd.ipynb b/examples/04_model_select_and_optimize/azureml_hyperdrive_surprise_svd.ipynb
index eab6bcb8dc..db0e7417d3 100644
--- a/examples/04_model_select_and_optimize/azureml_hyperdrive_surprise_svd.ipynb
+++ b/examples/04_model_select_and_optimize/azureml_hyperdrive_surprise_svd.ipynb
@@ -64,8 +64,8 @@
     "import azureml.widgets\n",
     "import azureml.train.hyperdrive as hd\n",
     "\n",
-    "from reco_utils.dataset import movielens\n",
-    "from reco_utils.dataset.python_splitters import python_random_split\n",
+    "from reco_utils.datasets import movielens\n",
+    "from reco_utils.datasets.python_splitters import python_random_split\n",
     "from reco_utils.evaluation.python_evaluation import rmse, precision_at_k, ndcg_at_k\n",
     "from reco_utils.recommender.surprise.surprise_utils import predict, compute_ranking_predictions\n",
     "\n",
diff --git a/examples/04_model_select_and_optimize/azureml_hyperdrive_wide_and_deep.ipynb b/examples/04_model_select_and_optimize/azureml_hyperdrive_wide_and_deep.ipynb
index 5f3d4b2538..22de9c726d 100644
--- a/examples/04_model_select_and_optimize/azureml_hyperdrive_wide_and_deep.ipynb
+++ b/examples/04_model_select_and_optimize/azureml_hyperdrive_wide_and_deep.ipynb
@@ -88,9 +88,9 @@
     "from reco_utils.utils.timer import Timer\n",
     "from reco_utils.utils.constants import SEED\n",
     "from reco_utils.utils.tf_utils import pandas_input_fn_for_saved_model\n",
-    "from reco_utils.dataset import movielens\n",
-    "from reco_utils.dataset.pandas_df_utils import user_item_pairs\n",
-    "from reco_utils.dataset.python_splitters import python_random_split\n",
+    "from reco_utils.datasets import movielens\n",
+    "from reco_utils.datasets.pandas_df_utils import user_item_pairs\n",
+    "from reco_utils.datasets.python_splitters import python_random_split\n",
     "import reco_utils.evaluation.python_evaluation as evaluator\n",
     "\n",
     "print(\"Azure ML SDK Version:\", aml.core.VERSION)\n",
diff --git a/examples/04_model_select_and_optimize/nni_ncf.ipynb b/examples/04_model_select_and_optimize/nni_ncf.ipynb
index 396691f33b..6d75262d3c 100644
--- a/examples/04_model_select_and_optimize/nni_ncf.ipynb
+++ b/examples/04_model_select_and_optimize/nni_ncf.ipynb
@@ -68,8 +68,8 @@
     "\n",
     "import reco_utils\n",
     "from reco_utils.utils.timer import Timer\n",
-    "from reco_utils.dataset import movielens\n",
-    "from reco_utils.dataset.python_splitters import python_chrono_split\n",
+    "from reco_utils.datasets import movielens\n",
+    "from reco_utils.datasets.python_splitters import python_chrono_split\n",
     "from reco_utils.evaluation.python_evaluation import rmse, precision_at_k, ndcg_at_k\n",
     "from reco_utils.tuning.nni.nni_utils import (\n",
     "    check_experiment_status, \n",
diff --git a/examples/04_model_select_and_optimize/nni_surprise_svd.ipynb b/examples/04_model_select_and_optimize/nni_surprise_svd.ipynb
index 80fa152563..6eb9f3d65d 100644
--- a/examples/04_model_select_and_optimize/nni_surprise_svd.ipynb
+++ b/examples/04_model_select_and_optimize/nni_surprise_svd.ipynb
@@ -62,8 +62,8 @@
     "\n",
     "import reco_utils\n",
     "from reco_utils.utils.timer import Timer\n",
-    "from reco_utils.dataset import movielens\n",
-    "from reco_utils.dataset.python_splitters import python_random_split\n",
+    "from reco_utils.datasets import movielens\n",
+    "from reco_utils.datasets.python_splitters import python_random_split\n",
     "from reco_utils.evaluation.python_evaluation import rmse, precision_at_k, ndcg_at_k\n",
     "from reco_utils.tuning.nni.nni_utils import (check_experiment_status, check_stopped, check_metrics_written, get_trials,\n",
     "                                      stop_nni, start_nni)\n",
diff --git a/examples/04_model_select_and_optimize/tuning_spark_als.ipynb b/examples/04_model_select_and_optimize/tuning_spark_als.ipynb
index bec2b4c872..fd9987a95d 100644
--- a/examples/04_model_select_and_optimize/tuning_spark_als.ipynb
+++ b/examples/04_model_select_and_optimize/tuning_spark_als.ipynb
@@ -84,8 +84,8 @@
     "from reco_utils.utils.timer import Timer\n",
     "from reco_utils.utils.spark_utils import start_or_get_spark\n",
     "from reco_utils.evaluation.spark_evaluation import SparkRankingEvaluation, SparkRatingEvaluation\n",
-    "from reco_utils.dataset.movielens import load_spark_df\n",
-    "from reco_utils.dataset.spark_splitters import spark_random_split\n",
+    "from reco_utils.datasets.movielens import load_spark_df\n",
+    "from reco_utils.datasets.spark_splitters import spark_random_split\n",
     "\n",
     "print(\"System version: {}\".format(sys.version))\n",
     "print(\"Pandas version: {}\".format(pd.__version__))\n",
diff --git a/examples/05_operationalize/aks_locust_load_test.ipynb b/examples/05_operationalize/aks_locust_load_test.ipynb
index 92dd171f59..b3de297bc6 100644
--- a/examples/05_operationalize/aks_locust_load_test.ipynb
+++ b/examples/05_operationalize/aks_locust_load_test.ipynb
@@ -50,7 +50,7 @@
     "from azureml.core import VERSION as azureml_version\n",
     "from azureml.core.webservice import AksWebservice\n",
     "\n",
-    "from reco_utils.dataset.criteo import get_spark_schema, load_pandas_df\n",
+    "from reco_utils.datasets.criteo import get_spark_schema, load_pandas_df\n",
     "\n",
     "# Check core SDK version number\n",
     "print(\"Azure ML SDK version: {}\".format(azureml_version))"
diff --git a/examples/05_operationalize/als_movie_o16n.ipynb b/examples/05_operationalize/als_movie_o16n.ipynb
index a8c5097e87..d70e3c2724 100644
--- a/examples/05_operationalize/als_movie_o16n.ipynb
+++ b/examples/05_operationalize/als_movie_o16n.ipynb
@@ -98,10 +98,10 @@
     "\n",
     "from reco_utils.utils.timer import Timer\n",
     "from reco_utils.utils.spark_utils import start_or_get_spark\n",
-    "from reco_utils.dataset import movielens\n",
-    "from reco_utils.dataset.cosmos_cli import find_collection, read_collection, read_database, find_database\n",
-    "from reco_utils.dataset.download_utils import maybe_download\n",
-    "from reco_utils.dataset.spark_splitters import spark_random_split\n",
+    "from reco_utils.datasets import movielens\n",
+    "from reco_utils.datasets.cosmos_cli import find_collection, read_collection, read_database, find_database\n",
+    "from reco_utils.datasets.download_utils import maybe_download\n",
+    "from reco_utils.datasets.spark_splitters import spark_random_split\n",
     "from reco_utils.evaluation.spark_evaluation import SparkRatingEvaluation, SparkRankingEvaluation\n",
     "from reco_utils.utils.notebook_utils import is_databricks\n",
     "\n",
diff --git a/examples/05_operationalize/lightgbm_criteo_o16n.ipynb b/examples/05_operationalize/lightgbm_criteo_o16n.ipynb
index 3f6948e5fc..1f83eb5038 100644
--- a/examples/05_operationalize/lightgbm_criteo_o16n.ipynb
+++ b/examples/05_operationalize/lightgbm_criteo_o16n.ipynb
@@ -94,7 +94,7 @@
     "import json\n",
     "import shutil\n",
     "\n",
-    "from reco_utils.dataset.criteo import get_spark_schema, load_spark_df\n",
+    "from reco_utils.datasets.criteo import get_spark_schema, load_spark_df\n",
     "from reco_utils.utils.k8s_utils import qps_to_replicas, replicas_to_qps, nodes_to_replicas\n",
     "\n",
     "from azureml.core import Workspace\n",
diff --git a/examples/06_benchmarks/movielens.ipynb b/examples/06_benchmarks/movielens.ipynb
index f82ada1599..940275b0a3 100644
--- a/examples/06_benchmarks/movielens.ipynb
+++ b/examples/06_benchmarks/movielens.ipynb
@@ -108,8 +108,8 @@
     "\n",
     "from reco_utils.utils.general_utils import get_number_processors\n",
     "from reco_utils.utils.gpu_utils import get_cuda_version, get_cudnn_version\n",
-    "from reco_utils.dataset import movielens\n",
-    "from reco_utils.dataset.python_splitters import python_stratified_split\n",
+    "from reco_utils.datasets import movielens\n",
+    "from reco_utils.datasets.python_splitters import python_stratified_split\n",
     "\n",
     "from benchmark_utils import * \n",
     "\n",
diff --git a/examples/07_tutorials/KDD2020-tutorial/step5_run_lightgcn.ipynb b/examples/07_tutorials/KDD2020-tutorial/step5_run_lightgcn.ipynb
index 68b5f0e4c2..46e4b845df 100644
--- a/examples/07_tutorials/KDD2020-tutorial/step5_run_lightgcn.ipynb
+++ b/examples/07_tutorials/KDD2020-tutorial/step5_run_lightgcn.ipynb
@@ -39,8 +39,8 @@
     "from reco_utils.utils.timer import Timer\n",
     "from reco_utils.recommender.deeprec.models.graphrec.lightgcn import LightGCN\n",
     "from reco_utils.recommender.deeprec.DataModel.ImplicitCF import ImplicitCF\n",
-    "from reco_utils.dataset import movielens\n",
-    "from reco_utils.dataset.python_splitters import python_stratified_split\n",
+    "from reco_utils.datasets import movielens\n",
+    "from reco_utils.datasets.python_splitters import python_stratified_split\n",
     "from reco_utils.evaluation.python_evaluation import map_at_k, ndcg_at_k, precision_at_k, recall_at_k\n",
     "from reco_utils.utils.constants import SEED as DEFAULT_SEED\n",
     "from reco_utils.recommender.deeprec.deeprec_utils import prepare_hparams\n",
diff --git a/reco_utils/dataset/amazon_reviews.py b/reco_utils/dataset/amazon_reviews.py
index 75f70215e2..9ab82ade34 100644
--- a/reco_utils/dataset/amazon_reviews.py
+++ b/reco_utils/dataset/amazon_reviews.py
@@ -12,7 +12,7 @@
 import _pickle as cPickle
 
 from reco_utils.utils.constants import SEED
-from reco_utils.dataset.download_utils import maybe_download, download_path
+from reco_utils.datasets.download_utils import maybe_download, download_path
 
 
 random.seed(SEED)
diff --git a/reco_utils/dataset/criteo.py b/reco_utils/dataset/criteo.py
index 36e435a64a..cb59f3547a 100644
--- a/reco_utils/dataset/criteo.py
+++ b/reco_utils/dataset/criteo.py
@@ -11,7 +11,7 @@
 except ImportError:
     pass  # so the environment without spark doesn't break
 
-from reco_utils.dataset.download_utils import maybe_download, download_path
+from reco_utils.datasets.download_utils import maybe_download, download_path
 from reco_utils.utils.notebook_utils import is_databricks
 
 
diff --git a/reco_utils/dataset/mind.py b/reco_utils/dataset/mind.py
index e98680f2b0..bdbd58965e 100644
--- a/reco_utils/dataset/mind.py
+++ b/reco_utils/dataset/mind.py
@@ -10,7 +10,7 @@
 from tqdm import tqdm
 from nltk.tokenize import RegexpTokenizer
 
-from reco_utils.dataset.download_utils import maybe_download, download_path, unzip_file
+from reco_utils.datasets.download_utils import maybe_download, download_path, unzip_file
 
 
 URL_MIND_LARGE_TRAIN = (
@@ -29,31 +29,32 @@
     "https://recodatasets.z20.web.core.windows.net/newsrec/MINDdemo_train.zip"
 )
 URL_MIND_DEMO_VALID = (
-      "https://recodatasets.z20.web.core.windows.net/newsrec/MINDdemo_dev.zip"
+    "https://recodatasets.z20.web.core.windows.net/newsrec/MINDdemo_dev.zip"
 )
 URL_MIND_DEMO_UTILS = (
-      "https://recodatasets.z20.web.core.windows.net/newsrec/MINDdemo_utils.zip"
+    "https://recodatasets.z20.web.core.windows.net/newsrec/MINDdemo_utils.zip"
 )
 
 URL_MIND = {
     "large": (URL_MIND_LARGE_TRAIN, URL_MIND_LARGE_VALID),
     "small": (URL_MIND_SMALL_TRAIN, URL_MIND_SMALL_VALID),
-    "demo": (URL_MIND_DEMO_TRAIN, URL_MIND_DEMO_VALID)
+    "demo": (URL_MIND_DEMO_TRAIN, URL_MIND_DEMO_VALID),
 }
 
 logger = logging.getLogger()
 
+
 def download_mind(size="small", dest_path=None):
     """Download MIND dataset
 
     Args:
         size (str): Dataset size. One of ["small", "large"]
         dest_path (str): Download path. If path is None, it will download the dataset on a temporal path
-        
+
     Returns:
         str, str: Path to train and validation sets.
     """
-    size_options = ["small", "large","demo"]
+    size_options = ["small", "large", "demo"]
     if size not in size_options:
         raise ValueError(f"Wrong size option, available options are {size_options}")
     url_train, url_valid = URL_MIND[size]
@@ -63,7 +64,13 @@ def download_mind(size="small", dest_path=None):
     return train_path, valid_path
 
 
-def extract_mind(train_zip, valid_zip, train_folder="train", valid_folder="valid", clean_zip_file=True):
+def extract_mind(
+    train_zip,
+    valid_zip,
+    train_folder="train",
+    valid_folder="valid",
+    clean_zip_file=True,
+):
     """Extract MIND dataset
 
     Args:
@@ -71,7 +78,7 @@ def extract_mind(train_zip, valid_zip, train_folder="train", valid_folder="valid
         valid_zip (str): Path to valid zip file
         train_folder (str): Destination forder for train set
         valid_folder (str): Destination forder for validation set
-    
+
     Returns:
         str, str: Train and validation folders
     """
@@ -91,8 +98,8 @@ def read_clickhistory(path, filename):
         filename (str): Filename
 
     Returns:
-        list, dict: 
-        - A list of user session with user_id, clicks, positive and negative interactions. 
+        list, dict:
+        - A list of user session with user_id, clicks, positive and negative interactions.
         - A dictionary with user_id click history.
     """
     userid_history = {}
@@ -217,7 +224,7 @@ def get_words_and_entities(train_news, valid_news):
         train_news (str): News train file.
         valid_news (str): News validation file.
 
-    Returns: 
+    Returns:
         dict, dict: Words and entities dictionaries.
     """
     news_words = {}
@@ -234,12 +241,12 @@ def get_words_and_entities(train_news, valid_news):
 
 def download_and_extract_glove(dest_path):
     """Download and extract the Glove embedding
-    
+
     Args:
         dest_path (str): Destination directory path for the downloaded file
 
     Returns:
-        str: File path where Glove was extracted.  
+        str: File path where Glove was extracted.
     """
     url = "http://nlp.stanford.edu/data/glove.6B.zip"
     filepath = maybe_download(url=url, work_directory=dest_path)
@@ -384,46 +391,47 @@ def generate_embeddings(
 
 
 def load_glove_matrix(path_emb, word_dict, word_embedding_dim):
-    '''Load pretrained embedding metrics of words in word_dict
-    
-    Args: 
+    """Load pretrained embedding metrics of words in word_dict
+
+    Args:
         path_emb (string): Folder path of downloaded glove file
         word_dict (dict): word dictionary
         word_embedding_dim: dimention of word embedding vectors
-        
+
     Returns:
         numpy.ndarray, list: pretrained word embedding metrics, words can be found in glove files
-    '''
-    
-    embedding_matrix = np.zeros((len(word_dict)+1, word_embedding_dim))
-    exist_word=[]
+    """
+
+    embedding_matrix = np.zeros((len(word_dict) + 1, word_embedding_dim))
+    exist_word = []
 
-    with open(os.path.join(path_emb, f"glove.6B.{word_embedding_dim}d.txt"),'rb') as f:
+    with open(os.path.join(path_emb, f"glove.6B.{word_embedding_dim}d.txt"), "rb") as f:
         for l in tqdm(f):
-            l=l.split()
+            l = l.split()
             word = l[0].decode()
             if len(word) != 0:
                 if word in word_dict:
                     wordvec = [float(x) for x in l[1:]]
                     index = word_dict[word]
-                    embedding_matrix[index]=np.array(wordvec)
+                    embedding_matrix[index] = np.array(wordvec)
                     exist_word.append(word)
-                    
+
     return embedding_matrix, exist_word
 
+
 def word_tokenize(sent):
-    ''' Tokenize a sententence
-    
+    """Tokenize a sententence
+
     Args:
         sent: the sentence need to be tokenized
-    
+
     Returns:
-        list: words in the sentence   
-    '''
-    
-    #treat consecutive words or special punctuation as words
-    pat = re.compile(r'[\w]+|[.,!?;|]')
+        list: words in the sentence
+    """
+
+    # treat consecutive words or special punctuation as words
+    pat = re.compile(r"[\w]+|[.,!?;|]")
     if isinstance(sent, str):
         return pat.findall(sent.lower())
     else:
-        return []
\ No newline at end of file
+        return []
diff --git a/reco_utils/dataset/movielens.py b/reco_utils/dataset/movielens.py
index bc2e4077cd..5d3be89679 100644
--- a/reco_utils/dataset/movielens.py
+++ b/reco_utils/dataset/movielens.py
@@ -7,7 +7,7 @@
 import warnings
 import pandas as pd
 from zipfile import ZipFile
-from reco_utils.dataset.download_utils import maybe_download, download_path
+from reco_utils.datasets.download_utils import maybe_download, download_path
 from reco_utils.utils.notebook_utils import is_databricks
 from reco_utils.utils.constants import (
     DEFAULT_USER_COL,
diff --git a/reco_utils/dataset/python_splitters.py b/reco_utils/dataset/python_splitters.py
index e66083134d..dc1444c518 100644
--- a/reco_utils/dataset/python_splitters.py
+++ b/reco_utils/dataset/python_splitters.py
@@ -9,7 +9,7 @@
     DEFAULT_USER_COL,
     DEFAULT_TIMESTAMP_COL,
 )
-from reco_utils.dataset.split_utils import (
+from reco_utils.datasets.split_utils import (
     process_split_ratio,
     min_rating_filter_pandas,
     split_pandas_data_with_ratios,
diff --git a/reco_utils/dataset/spark_splitters.py b/reco_utils/dataset/spark_splitters.py
index a7012e2137..9a843ba3be 100644
--- a/reco_utils/dataset/spark_splitters.py
+++ b/reco_utils/dataset/spark_splitters.py
@@ -14,7 +14,7 @@
     DEFAULT_TIMESTAMP_COL,
     DEFAULT_RATING_COL,
 )
-from reco_utils.dataset.split_utils import process_split_ratio, min_rating_filter_spark
+from reco_utils.datasets.split_utils import process_split_ratio, min_rating_filter_spark
 
 
 def spark_random_split(data, ratio=0.75, seed=42):
diff --git a/reco_utils/evaluation/python_evaluation.py b/reco_utils/evaluation/python_evaluation.py
index 69754a4648..5ed9552bb6 100644
--- a/reco_utils/evaluation/python_evaluation.py
+++ b/reco_utils/evaluation/python_evaluation.py
@@ -21,7 +21,7 @@
     DEFAULT_K,
     DEFAULT_THRESHOLD,
 )
-from reco_utils.dataset.pandas_df_utils import (
+from reco_utils.datasets.pandas_df_utils import (
     has_columns,
     has_same_base_dtype,
     lru_cache_df,
diff --git a/reco_utils/recommender/deeprec/deeprec_utils.py b/reco_utils/recommender/deeprec/deeprec_utils.py
index 469803d0a8..4a38118051 100644
--- a/reco_utils/recommender/deeprec/deeprec_utils.py
+++ b/reco_utils/recommender/deeprec/deeprec_utils.py
@@ -17,7 +17,7 @@
 import pickle as pkl
 import tensorflow as tf
 
-from reco_utils.dataset.download_utils import maybe_download
+from reco_utils.datasets.download_utils import maybe_download
 
 
 def flat_config(config):
diff --git a/reco_utils/recommender/geoimc/geoimc_utils.py b/reco_utils/recommender/geoimc/geoimc_utils.py
index 843ae3f32f..a6febbc67b 100644
--- a/reco_utils/recommender/geoimc/geoimc_utils.py
+++ b/reco_utils/recommender/geoimc/geoimc_utils.py
@@ -4,7 +4,7 @@
 import numpy as np
 from sklearn.decomposition import PCA
 
-from reco_utils.dataset.download_utils import maybe_download
+from reco_utils.datasets.download_utils import maybe_download
 
 
 def length_normalize(matrix):
@@ -16,7 +16,7 @@ def length_normalize(matrix):
     Returns:
         Normalized matrix
     """
-    norms = np.sqrt(np.sum(matrix**2, axis=1))
+    norms = np.sqrt(np.sum(matrix ** 2, axis=1))
     norms[norms == 0] = 1
     return matrix / norms[:, np.newaxis]
 
diff --git a/reco_utils/recommender/newsrec/newsrec_utils.py b/reco_utils/recommender/newsrec/newsrec_utils.py
index b45e194a10..b6be84f60c 100644
--- a/reco_utils/recommender/newsrec/newsrec_utils.py
+++ b/reco_utils/recommender/newsrec/newsrec_utils.py
@@ -14,7 +14,7 @@
 import numpy as np
 import yaml
 import zipfile
-from reco_utils.dataset.download_utils import maybe_download
+from reco_utils.datasets.download_utils import maybe_download
 from reco_utils.recommender.deeprec.deeprec_utils import (
     flat_config,
     load_yaml,
@@ -28,7 +28,7 @@
 
 def check_type(config):
     """Check that the config parameters are the correct type
-    
+
     Args:
         config (dict): Configuration dictionary.
 
@@ -96,10 +96,10 @@ def check_type(config):
 
 def check_nn_config(f_config):
     """Check neural networks configuration.
-    
+
     Args:
         f_config (dict): Neural network configuration.
-    
+
     Raises:
         ValueError: If the parameters are not correct.
     """
@@ -299,7 +299,7 @@ def prepare_hparams(yaml_file=None, **kwargs):
 
 
 def word_tokenize(sent):
-    """ Split sentence into word list using regex.
+    """Split sentence into word list using regex.
     Args:
         sent (str): Input sentence
 
@@ -314,13 +314,13 @@ def word_tokenize(sent):
 
 
 def newsample(news, ratio):
-    """ Sample ratio samples from news list. 
+    """Sample ratio samples from news list.
     If length of news is less than ratio, pad zeros.
 
     Args:
         news (list): input news list
         ratio (int): sample number
-    
+
     Returns:
         list: output of sample list.
     """
@@ -331,11 +331,11 @@ def newsample(news, ratio):
 
 
 def get_mind_data_set(type):
-    """ Get MIND dataset address 
+    """Get MIND dataset address
 
     Args:
         type (str): type of mind dataset, must be in ['large', 'small', 'demo']
-        
+
     Returns:
         list: data url and train valid dataset name
     """
@@ -364,4 +364,3 @@ def get_mind_data_set(type):
             "MINDdemo_dev.zip",
             "MINDdemo_utils.zip",
         )
-
diff --git a/tests/conftest.py b/tests/conftest.py
index d0618bb7df..2a2fa64db0 100644
--- a/tests/conftest.py
+++ b/tests/conftest.py
@@ -25,8 +25,8 @@
     DEFAULT_RATING_COL,
     DEFAULT_TIMESTAMP_COL,
 )
-from reco_utils.dataset.python_splitters import numpy_stratified_split
-from reco_utils.dataset.python_splitters import python_chrono_split
+from reco_utils.datasets.python_splitters import numpy_stratified_split
+from reco_utils.datasets.python_splitters import python_chrono_split
 from reco_utils.utils.spark_utils import start_or_get_spark
 
 
diff --git a/tests/integration/reco_utils/dataset/test_criteo.py b/tests/integration/reco_utils/dataset/test_criteo.py
index 9dcf6cf0a3..07c97690b9 100644
--- a/tests/integration/reco_utils/dataset/test_criteo.py
+++ b/tests/integration/reco_utils/dataset/test_criteo.py
@@ -4,7 +4,7 @@
 import os
 import pytest
 import pandas as pd
-from reco_utils.dataset import criteo
+from reco_utils.datasets import criteo
 
 
 @pytest.mark.integration
diff --git a/tests/integration/reco_utils/dataset/test_mind.py b/tests/integration/reco_utils/dataset/test_mind.py
index 258dabe655..8ff380334b 100644
--- a/tests/integration/reco_utils/dataset/test_mind.py
+++ b/tests/integration/reco_utils/dataset/test_mind.py
@@ -6,7 +6,7 @@
 import papermill as pm
 import scrapbook as sb
 
-from reco_utils.dataset.mind import download_mind, extract_mind
+from reco_utils.datasets.mind import download_mind, extract_mind
 
 
 @pytest.mark.integration
diff --git a/tests/integration/reco_utils/dataset/test_movielens.py b/tests/integration/reco_utils/dataset/test_movielens.py
index f4a2b9c128..ea3a2bdf01 100644
--- a/tests/integration/reco_utils/dataset/test_movielens.py
+++ b/tests/integration/reco_utils/dataset/test_movielens.py
@@ -3,7 +3,7 @@
 
 import os
 import pytest
-from reco_utils.dataset.movielens import (
+from reco_utils.datasets.movielens import (
     load_pandas_df,
     load_spark_df,
     load_item_df,
diff --git a/tests/smoke/reco_utils/dataset/test_criteo.py b/tests/smoke/reco_utils/dataset/test_criteo.py
index 804fc86c41..cfef90257b 100644
--- a/tests/smoke/reco_utils/dataset/test_criteo.py
+++ b/tests/smoke/reco_utils/dataset/test_criteo.py
@@ -4,7 +4,7 @@
 import os
 import pytest
 import pandas as pd
-from reco_utils.dataset import criteo
+from reco_utils.datasets import criteo
 
 
 @pytest.mark.smoke
diff --git a/tests/smoke/reco_utils/dataset/test_mind.py b/tests/smoke/reco_utils/dataset/test_mind.py
index f9726905d5..c704367e61 100644
--- a/tests/smoke/reco_utils/dataset/test_mind.py
+++ b/tests/smoke/reco_utils/dataset/test_mind.py
@@ -4,7 +4,7 @@
 import pytest
 import os
 import requests
-from reco_utils.dataset.mind import download_mind, extract_mind
+from reco_utils.datasets.mind import download_mind, extract_mind
 
 
 @pytest.mark.smoke
diff --git a/tests/smoke/reco_utils/dataset/test_movielens.py b/tests/smoke/reco_utils/dataset/test_movielens.py
index 9553ca9e43..44441feb58 100644
--- a/tests/smoke/reco_utils/dataset/test_movielens.py
+++ b/tests/smoke/reco_utils/dataset/test_movielens.py
@@ -3,7 +3,7 @@
 
 import os
 import pytest
-from reco_utils.dataset.movielens import (
+from reco_utils.datasets.movielens import (
     load_pandas_df,
     load_spark_df,
     load_item_df,
diff --git a/tests/smoke/reco_utils/recommender/test_deeprec_model.py b/tests/smoke/reco_utils/recommender/test_deeprec_model.py
index 0533539562..9cbc5ee979 100644
--- a/tests/smoke/reco_utils/recommender/test_deeprec_model.py
+++ b/tests/smoke/reco_utils/recommender/test_deeprec_model.py
@@ -4,6 +4,7 @@
 import os
 import papermill as pm
 import pytest
+
 try:
     import tensorflow as tf
     from reco_utils.recommender.deeprec.deeprec_utils import (
@@ -18,11 +19,14 @@
     from reco_utils.recommender.deeprec.io.sequential_iterator import SequentialIterator
     from reco_utils.recommender.deeprec.models.sequential.sli_rec import SLI_RECModel
     from reco_utils.recommender.deeprec.models.sequential.sum import SUMModel
-    from reco_utils.dataset.amazon_reviews import download_and_extract, data_preprocessing
+    from reco_utils.datasets.amazon_reviews import (
+        download_and_extract,
+        data_preprocessing,
+    )
     from reco_utils.recommender.deeprec.models.graphrec.lightgcn import LightGCN
     from reco_utils.recommender.deeprec.DataModel.ImplicitCF import ImplicitCF
-    from reco_utils.dataset import movielens
-    from reco_utils.dataset.python_splitters import python_stratified_split
+    from reco_utils.datasets import movielens
+    from reco_utils.datasets.python_splitters import python_stratified_split
 except ImportError:
     pass  # disable error while collecting tests for non-gpu environments
 
diff --git a/tests/smoke/reco_utils/recommender/test_deeprec_utils.py b/tests/smoke/reco_utils/recommender/test_deeprec_utils.py
index 28b45c6a98..b297a30327 100644
--- a/tests/smoke/reco_utils/recommender/test_deeprec_utils.py
+++ b/tests/smoke/reco_utils/recommender/test_deeprec_utils.py
@@ -3,9 +3,13 @@
 
 import os
 import pytest
+
 try:
     import tensorflow as tf
-    from reco_utils.dataset.amazon_reviews import download_and_extract, data_preprocessing
+    from reco_utils.datasets.amazon_reviews import (
+        download_and_extract,
+        data_preprocessing,
+    )
     from reco_utils.recommender.deeprec.deeprec_utils import (
         prepare_hparams,
         download_deeprec_resources,
diff --git a/tests/unit/reco_utils/dataset/test_covid_utils.py b/tests/unit/reco_utils/dataset/test_covid_utils.py
index a289078bea..2e04912b40 100644
--- a/tests/unit/reco_utils/dataset/test_covid_utils.py
+++ b/tests/unit/reco_utils/dataset/test_covid_utils.py
@@ -3,7 +3,7 @@
 
 from unittest.mock import patch, MagicMock
 import pytest
-from reco_utils.dataset.covid_utils import (
+from reco_utils.datasets.covid_utils import (
     remove_duplicates,
     remove_nan,
     clean_dataframe,
@@ -68,7 +68,7 @@ def json(self):
 
         return MockResponse()
 
-    with patch("reco_utils.dataset.covid_utils.requests.get", side_effect=mock_get):
+    with patch("reco_utils.datasets.covid_utils.requests.get", side_effect=mock_get):
         result = retrieve_text(entry=dict(pdf_json_files="a"), container_name="test")
     assert "test" == result
 
@@ -85,7 +85,7 @@ def mock_retrieve_text(
         return "full text"
 
     with patch(
-        "reco_utils.dataset.covid_utils.retrieve_text", side_effect=mock_retrieve_text
+        "reco_utils.datasets.covid_utils.retrieve_text", side_effect=mock_retrieve_text
     ):
         full = get_public_domain_text(df, container_name="test")
 
diff --git a/tests/unit/reco_utils/dataset/test_dataset.py b/tests/unit/reco_utils/dataset/test_dataset.py
index 59f4f9f647..0c9d851b55 100644
--- a/tests/unit/reco_utils/dataset/test_dataset.py
+++ b/tests/unit/reco_utils/dataset/test_dataset.py
@@ -6,7 +6,7 @@
 import requests
 from tempfile import TemporaryDirectory
 import logging
-from reco_utils.dataset.download_utils import maybe_download, download_path
+from reco_utils.datasets.download_utils import maybe_download, download_path
 
 
 @pytest.fixture
diff --git a/tests/unit/reco_utils/dataset/test_pandas_df_utils.py b/tests/unit/reco_utils/dataset/test_pandas_df_utils.py
index b7baace671..45599dc352 100644
--- a/tests/unit/reco_utils/dataset/test_pandas_df_utils.py
+++ b/tests/unit/reco_utils/dataset/test_pandas_df_utils.py
@@ -7,7 +7,7 @@
 from tempfile import TemporaryDirectory
 import os
 
-from reco_utils.dataset.pandas_df_utils import (
+from reco_utils.datasets.pandas_df_utils import (
     user_item_pairs,
     filter_by,
     LibffmConverter,
diff --git a/tests/unit/reco_utils/dataset/test_python_splitter.py b/tests/unit/reco_utils/dataset/test_python_splitter.py
index 09cc44009e..d4555a5bcf 100644
--- a/tests/unit/reco_utils/dataset/test_python_splitter.py
+++ b/tests/unit/reco_utils/dataset/test_python_splitter.py
@@ -5,12 +5,12 @@
 import numpy as np
 import pytest
 
-from reco_utils.dataset.split_utils import (
+from reco_utils.datasets.split_utils import (
     min_rating_filter_pandas,
     split_pandas_data_with_ratios,
 )
 
-from reco_utils.dataset.python_splitters import (
+from reco_utils.datasets.python_splitters import (
     python_chrono_split,
     python_random_split,
     python_stratified_split,
diff --git a/tests/unit/reco_utils/dataset/test_spark_splitter.py b/tests/unit/reco_utils/dataset/test_spark_splitter.py
index 8b179be92e..925dac6549 100644
--- a/tests/unit/reco_utils/dataset/test_spark_splitter.py
+++ b/tests/unit/reco_utils/dataset/test_spark_splitter.py
@@ -12,10 +12,10 @@
 )
 
 try:
-    from reco_utils.dataset.split_utils import min_rating_filter_spark
+    from reco_utils.datasets.split_utils import min_rating_filter_spark
     from pyspark.sql import functions as F
     from pyspark.sql.functions import col
-    from reco_utils.dataset.spark_splitters import (
+    from reco_utils.datasets.spark_splitters import (
         spark_chrono_split,
         spark_random_split,
         spark_stratified_split,
diff --git a/tests/unit/reco_utils/dataset/test_sparse.py b/tests/unit/reco_utils/dataset/test_sparse.py
index ae3dcf05d9..de1d7d95ae 100644
--- a/tests/unit/reco_utils/dataset/test_sparse.py
+++ b/tests/unit/reco_utils/dataset/test_sparse.py
@@ -5,7 +5,7 @@
 import numpy as np
 import pytest
 
-from reco_utils.dataset.sparse import AffinityMatrix
+from reco_utils.datasets.sparse import AffinityMatrix
 from reco_utils.utils.constants import (
     DEFAULT_USER_COL,
     DEFAULT_ITEM_COL,
diff --git a/tests/unit/reco_utils/dataset/test_wikidata.py b/tests/unit/reco_utils/dataset/test_wikidata.py
index 5fa3a64831..bf7b1cbd6a 100644
--- a/tests/unit/reco_utils/dataset/test_wikidata.py
+++ b/tests/unit/reco_utils/dataset/test_wikidata.py
@@ -4,7 +4,7 @@
 import pytest
 
 
-from reco_utils.dataset.wikidata import (
+from reco_utils.datasets.wikidata import (
     search_wikidata,
     find_wikidata_id,
     query_entity_links,
diff --git a/tests/unit/reco_utils/recommender/test_deeprec_model.py b/tests/unit/reco_utils/recommender/test_deeprec_model.py
index 6786ec79ad..177faa8463 100644
--- a/tests/unit/reco_utils/recommender/test_deeprec_model.py
+++ b/tests/unit/reco_utils/recommender/test_deeprec_model.py
@@ -3,9 +3,9 @@
 
 import pytest
 import os
-from reco_utils.dataset import movielens
-from reco_utils.dataset.amazon_reviews import download_and_extract, data_preprocessing
-from reco_utils.dataset.python_splitters import python_stratified_split
+from reco_utils.datasets import movielens
+from reco_utils.datasets.amazon_reviews import download_and_extract, data_preprocessing
+from reco_utils.datasets.python_splitters import python_stratified_split
 
 try:
     from reco_utils.recommender.deeprec.DataModel.ImplicitCF import ImplicitCF
diff --git a/tests/unit/reco_utils/recommender/test_deeprec_utils.py b/tests/unit/reco_utils/recommender/test_deeprec_utils.py
index 604b4eff39..0508c15a3a 100644
--- a/tests/unit/reco_utils/recommender/test_deeprec_utils.py
+++ b/tests/unit/reco_utils/recommender/test_deeprec_utils.py
@@ -3,7 +3,7 @@
 
 import os
 import pytest
-from reco_utils.dataset.amazon_reviews import download_and_extract, data_preprocessing
+from reco_utils.datasets.amazon_reviews import download_and_extract, data_preprocessing
 
 try:
     from reco_utils.recommender.deeprec.deeprec_utils import (

From 4f8f4610f732cd8872ed08b366113b21f58a78de Mon Sep 17 00:00:00 2001
From: miguelgfierro <miguelgfierro@users.noreply.github.com>
Date: Thu, 15 Jul 2021 16:29:48 +0000
Subject: [PATCH 03/17] rename files :boom:

---
 docs/source/{dataset.rst => datasets.rst} | 0
 docs/source/{common.rst => utils.rst}     | 0
 2 files changed, 0 insertions(+), 0 deletions(-)
 rename docs/source/{dataset.rst => datasets.rst} (100%)
 rename docs/source/{common.rst => utils.rst} (100%)

diff --git a/docs/source/dataset.rst b/docs/source/datasets.rst
similarity index 100%
rename from docs/source/dataset.rst
rename to docs/source/datasets.rst
diff --git a/docs/source/common.rst b/docs/source/utils.rst
similarity index 100%
rename from docs/source/common.rst
rename to docs/source/utils.rst

From e567d5c0d6023eaea30659db8816ee79d1d8cea6 Mon Sep 17 00:00:00 2001
From: miguelgfierro <miguelgfierro@users.noreply.github.com>
Date: Thu, 15 Jul 2021 16:35:28 +0000
Subject: [PATCH 04/17] recommender to models :boom::boom:

---
 .../entries/train_sar_entry.py                |   2 +-
 docs/source/recommender.rst                   | 100 +++++++++---------
 examples/00_quick_start/dkn_MIND.ipynb        |   8 +-
 .../00_quick_start/fastai_movielens.ipynb     |   2 +-
 .../00_quick_start/geoimc_movielens.ipynb     |   6 +-
 .../00_quick_start/lightgbm_tinycriteo.ipynb  |   2 +-
 examples/00_quick_start/lstur_MIND.ipynb      |  12 +--
 examples/00_quick_start/naml_MIND.ipynb       |  12 +--
 examples/00_quick_start/ncf_movielens.ipynb   |   4 +-
 examples/00_quick_start/npa_MIND.ipynb        |  12 +--
 examples/00_quick_start/nrms_MIND.ipynb       |  12 +--
 examples/00_quick_start/rbm_movielens.ipynb   |   2 +-
 examples/00_quick_start/rlrmc_movielens.ipynb |   4 +-
 examples/00_quick_start/sar_movielens.ipynb   |   2 +-
 .../sar_movielens_with_azureml.ipynb          |   2 +-
 .../sequential_recsys_amazondataset.ipynb     |  20 ++--
 examples/00_quick_start/tfidf_covid.ipynb     |   2 +-
 .../00_quick_start/wide_deep_movielens.ipynb  |   2 +-
 examples/00_quick_start/xdeepfm_criteo.ipynb  |  12 +--
 .../cornac_bivae_deep_dive.ipynb              |   2 +-
 .../cornac_bpr_deep_dive.ipynb                |   2 +-
 .../lightgcn_deep_dive.ipynb                  |   6 +-
 .../multi_vae_deep_dive.ipynb                 |   2 +-
 .../rbm_deep_dive.ipynb                       |   2 +-
 .../sar_deep_dive.ipynb                       |   2 +-
 .../standard_vae_deep_dive.ipynb              |   2 +-
 .../surprise_svd_deep_dive.ipynb              |   2 +-
 .../dkn_deep_dive.ipynb                       |  10 +-
 .../02_model_hybrid/lightfm_deep_dive.ipynb   |   2 +-
 examples/02_model_hybrid/ncf_deep_dive.ipynb  |   4 +-
 .../azureml_hyperdrive_surprise_svd.ipynb     |   2 +-
 .../nni_ncf.ipynb                             |   4 +-
 .../nni_surprise_svd.ipynb                    |   2 +-
 .../train_scripts/svd_training.py             |   2 +-
 examples/06_benchmarks/benchmark_utils.py     |  18 ++--
 .../KDD2020-tutorial/step3_run_dkn.ipynb      |  10 +-
 .../step4_run_dkn_item2item.ipynb             |  10 +-
 .../KDD2020-tutorial/step5_run_lightgcn.ipynb |   8 +-
 .../deeprec/io/dkn_item2item_iterator.py      |   2 +-
 .../recommender/deeprec/io/dkn_iterator.py    |   6 +-
 .../deeprec/io/nextitnet_iterator.py          |   4 +-
 .../deeprec/io/sequential_iterator.py         |   4 +-
 .../recommender/deeprec/models/base_model.py  |   6 +-
 reco_utils/recommender/deeprec/models/dkn.py  |   2 +-
 .../deeprec/models/dkn_item2item.py           |   4 +-
 .../deeprec/models/graphrec/lightgcn.py       |   2 +-
 .../deeprec/models/sequential/asvd.py         |   2 +-
 .../deeprec/models/sequential/caser.py        |   2 +-
 .../deeprec/models/sequential/gru4rec.py      |   2 +-
 .../deeprec/models/sequential/nextitnet.py    |   2 +-
 .../sequential/sequential_base_model.py       |   4 +-
 .../deeprec/models/sequential/sli_rec.py      |   4 +-
 .../deeprec/models/sequential/sum.py          |   4 +-
 .../recommender/deeprec/models/xDeepFM.py     |   2 +-
 .../newsrec/io/mind_all_iterator.py           |   4 +-
 .../recommender/newsrec/io/mind_iterator.py   |   4 +-
 .../recommender/newsrec/models/base_model.py  |   2 +-
 .../recommender/newsrec/models/lstur.py       |  20 ++--
 reco_utils/recommender/newsrec/models/naml.py |  38 ++++---
 reco_utils/recommender/newsrec/models/npa.py  |  18 ++--
 reco_utils/recommender/newsrec/models/nrms.py |  43 +++++---
 .../recommender/newsrec/newsrec_utils.py      |   2 +-
 .../recommender/rlrmc/RLRMCalgorithm.py       |  18 ++--
 reco_utils/tuning/nni/ncf_training.py         |   4 +-
 reco_utils/tuning/nni/svd_training.py         |   2 +-
 .../recommender/test_deeprec_model.py         |  22 ++--
 .../recommender/test_deeprec_utils.py         |  12 +--
 .../recommender/test_newsrec_model.py         |  19 ++--
 .../recommender/test_newsrec_utils.py         |   9 +-
 tests/unit/reco_utils/common/test_tf_utils.py |   2 +-
 .../recommender/test_cornac_utils.py          |   2 +-
 .../recommender/test_deeprec_model.py         |  28 ++---
 .../recommender/test_deeprec_utils.py         |  12 +--
 .../reco_utils/recommender/test_geoimc.py     |   8 +-
 .../recommender/test_lightfm_utils.py         |   2 +-
 .../recommender/test_ncf_dataset.py           |   2 +-
 .../recommender/test_ncf_singlenode.py        |   4 +-
 .../recommender/test_newsrec_model.py         |  16 +--
 .../recommender/test_newsrec_utils.py         |   4 +-
 tests/unit/reco_utils/recommender/test_rbm.py |   2 +-
 .../recommender/test_sar_singlenode.py        |   2 +-
 .../recommender/test_surprise_utils.py        |   2 +-
 .../recommender/test_tfidf_utils.py           |   2 +-
 .../recommender/test_vowpal_wabbit.py         |   4 +-
 .../recommender/test_wide_deep_utils.py       |   2 +-
 85 files changed, 351 insertions(+), 322 deletions(-)

diff --git a/contrib/azureml_designer_modules/entries/train_sar_entry.py b/contrib/azureml_designer_modules/entries/train_sar_entry.py
index f2915fb4e4..ea375b0a12 100644
--- a/contrib/azureml_designer_modules/entries/train_sar_entry.py
+++ b/contrib/azureml_designer_modules/entries/train_sar_entry.py
@@ -4,7 +4,7 @@
 import joblib
 from pathlib import Path
 
-from reco_utils.recommender.sar import SAR
+from reco_utils.models.sar import SAR
 
 from azureml.studio.core.logger import module_logger as logger
 from azureml.studio.core.utils.fileutils import ensure_folder
diff --git a/docs/source/recommender.rst b/docs/source/recommender.rst
index 12fd3def59..b66c5a1ff9 100644
--- a/docs/source/recommender.rst
+++ b/docs/source/recommender.rst
@@ -8,7 +8,7 @@ Recommender system algorithms and utilities.
 Cornac
 ******************************
 
-.. automodule:: reco_utils.recommender.cornac.cornac_utils
+.. automodule:: reco_utils.models.cornac.cornac_utils
     :members:
 
 DeepRec
@@ -16,27 +16,27 @@ DeepRec
 
 Base model
 ==================
-.. automodule:: reco_utils.recommender.deeprec.models.base_model
+.. automodule:: reco_utils.models.deeprec.models.base_model
     :members:
 
 DKN
 ==================
-.. automodule:: reco_utils.recommender.deeprec.models.dkn
+.. automodule:: reco_utils.models.deeprec.models.dkn
     :members:
 
 DKN item-to-item
 ==================
-.. automodule:: reco_utils.recommender.deeprec.models.dkn_item2item
+.. automodule:: reco_utils.models.deeprec.models.dkn_item2item
     :members:
 
 LightGCN
 ==================
-.. automodule:: reco_utils.recommender.deeprec.models.graphrec.lightgcn
+.. automodule:: reco_utils.models.deeprec.models.graphrec.lightgcn
     :members:
 
 xDeepFM
 ==============
-.. automodule:: reco_utils.recommender.deeprec.models.xDeepFM
+.. automodule:: reco_utils.models.deeprec.models.xDeepFM
     :members:
 
 Sequential models
@@ -44,202 +44,202 @@ Sequential models
 
 Sequential base model
 ---------------------------
-.. automodule:: reco_utils.recommender.deeprec.models.sequential.sequential_base_model
+.. automodule:: reco_utils.models.deeprec.models.sequential.sequential_base_model
     :members:
 
 A2SVD
 -------------
-.. automodule:: reco_utils.recommender.deeprec.models.sequential.asvd
+.. automodule:: reco_utils.models.deeprec.models.sequential.asvd
     :members:
 
 Caser
 ----------------
-.. automodule:: reco_utils.recommender.deeprec.models.sequential.caser
+.. automodule:: reco_utils.models.deeprec.models.sequential.caser
     :members:
 
 GRU4Rec
 --------------
-.. automodule:: reco_utils.recommender.deeprec.models.sequential.gru4rec
+.. automodule:: reco_utils.models.deeprec.models.sequential.gru4rec
     :members:
 
 NextItNet
 --------------
-.. automodule:: reco_utils.recommender.deeprec.models.sequential.nextitnet
+.. automodule:: reco_utils.models.deeprec.models.sequential.nextitnet
     :members:
 
 RNN Cells
 ------------
-.. automodule:: reco_utils.recommender.deeprec.models.sequential.rnn_cell_implement
+.. automodule:: reco_utils.models.deeprec.models.sequential.rnn_cell_implement
     :members:
 
 SUM
 -------------------------
-.. automodule:: reco_utils.recommender.deeprec.models.sequential.sum
+.. automodule:: reco_utils.models.deeprec.models.sequential.sum
     :members:
 
-.. automodule:: reco_utils.recommender.deeprec.models.sequential.sum_cells
+.. automodule:: reco_utils.models.deeprec.models.sequential.sum_cells
     :members:
 
 SLIRec
 -------------
-.. automodule:: reco_utils.recommender.deeprec.models.sequential.sli_rec
+.. automodule:: reco_utils.models.deeprec.models.sequential.sli_rec
     :members:
 
 Iterators
 ===========
 
-.. automodule:: reco_utils.recommender.deeprec.io.iterator
+.. automodule:: reco_utils.models.deeprec.io.iterator
     :members:
 
-.. automodule:: reco_utils.recommender.deeprec.io.dkn_iterator
+.. automodule:: reco_utils.models.deeprec.io.dkn_iterator
     :members:
 
-.. automodule:: reco_utils.recommender.deeprec.io.dkn_item2item_iterator
+.. automodule:: reco_utils.models.deeprec.io.dkn_item2item_iterator
     :members:
 
-.. automodule:: reco_utils.recommender.deeprec.io.nextitnet_iterator
+.. automodule:: reco_utils.models.deeprec.io.nextitnet_iterator
     :members:
 
-.. automodule:: reco_utils.recommender.deeprec.io.sequential_iterator
+.. automodule:: reco_utils.models.deeprec.io.sequential_iterator
     :members:
 
 Data processing utilities
 ===========================
 
-.. automodule:: reco_utils.recommender.deeprec.DataModel.ImplicitCF
+.. automodule:: reco_utils.models.deeprec.DataModel.ImplicitCF
     :members:
 
 Utilities
 ============
 
-.. automodule:: reco_utils.recommender.deeprec.deeprec_utils
+.. automodule:: reco_utils.models.deeprec.deeprec_utils
     :members:
 
 FastAI
 ******************************
 
-.. automodule:: reco_utils.recommender.fastai.fastai_utils
+.. automodule:: reco_utils.models.fastai.fastai_utils
     :members:
 
 GeoIMC
 ******************************
 
-.. automodule:: reco_utils.recommender.geoimc.geoimc_algorithm
+.. automodule:: reco_utils.models.geoimc.geoimc_algorithm
     :members:
 
-.. automodule:: reco_utils.recommender.geoimc.geoimc_data
+.. automodule:: reco_utils.models.geoimc.geoimc_data
     :members:
 
-.. automodule:: reco_utils.recommender.geoimc.geoimc_predict
+.. automodule:: reco_utils.models.geoimc.geoimc_predict
     :members:
 
-.. automodule:: reco_utils.recommender.geoimc.geoimc_utils
+.. automodule:: reco_utils.models.geoimc.geoimc_utils
     :members:
 
 LightFM
 ******************************
 
-.. automodule:: reco_utils.recommender.lightfm.lightfm_utils
+.. automodule:: reco_utils.models.lightfm.lightfm_utils
     :members:
 
 LightGBM
 ******************************
 
-.. automodule:: reco_utils.recommender.lightgbm.lightgbm_utils
+.. automodule:: reco_utils.models.lightgbm.lightgbm_utils
     :members:
 
 NCF
 ******************************
 
-.. automodule:: reco_utils.recommender.ncf.dataset
+.. automodule:: reco_utils.models.ncf.dataset
     :members:
 
-.. automodule:: reco_utils.recommender.ncf.ncf_singlenode
+.. automodule:: reco_utils.models.ncf.ncf_singlenode
     :members:
 
 NewsRec
 ******************************
 
-.. automodule:: reco_utils.recommender.newsrec.io.mind_all_iterator
+.. automodule:: reco_utils.models.newsrec.io.mind_all_iterator
     :members:
 
-.. automodule:: reco_utils.recommender.newsrec.io.mind_iterator
+.. automodule:: reco_utils.models.newsrec.io.mind_iterator
     :members:
 
-.. automodule:: reco_utils.recommender.newsrec.models.base_model
+.. automodule:: reco_utils.models.newsrec.models.base_model
     :members:
 
-.. automodule:: reco_utils.recommender.newsrec.models.layers
+.. automodule:: reco_utils.models.newsrec.models.layers
     :members:
 
-.. automodule:: reco_utils.recommender.newsrec.models.lstur
+.. automodule:: reco_utils.models.newsrec.models.lstur
     :members:
 
-.. automodule:: reco_utils.recommender.newsrec.models.naml
+.. automodule:: reco_utils.models.newsrec.models.naml
     :members:
 
-.. automodule:: reco_utils.recommender.newsrec.models.npa
+.. automodule:: reco_utils.models.newsrec.models.npa
     :members:
 
-.. automodule:: reco_utils.recommender.newsrec.models.nrms
+.. automodule:: reco_utils.models.newsrec.models.nrms
     :members:
 
-.. automodule:: reco_utils.recommender.newsrec.newsrec_utils
+.. automodule:: reco_utils.models.newsrec.newsrec_utils
     :members:
 
 RBM
 ******************************
 
-.. automodule:: reco_utils.recommender.rbm.rbm
+.. automodule:: reco_utils.models.rbm.rbm
     :members:
 
 
 RLRMC
 ******************************
 
-.. automodule:: reco_utils.recommender.rlrmc.RLRMCalgorithm
+.. automodule:: reco_utils.models.rlrmc.RLRMCalgorithm
     :members:
 
-.. automodule:: reco_utils.recommender.rlrmc.RLRMCdataset
+.. automodule:: reco_utils.models.rlrmc.RLRMCdataset
     :members:
 
-.. automodule:: reco_utils.recommender.rlrmc.conjugate_gradient_ms
+.. automodule:: reco_utils.models.rlrmc.conjugate_gradient_ms
     :members:
 
 
 SAR
 ******************************
 
-.. automodule:: reco_utils.recommender.sar.sar_singlenode
+.. automodule:: reco_utils.models.sar.sar_singlenode
     :members:
 
 
 Surprise
 ******************************
 
-.. automodule:: reco_utils.recommender.surprise.surprise_utils
+.. automodule:: reco_utils.models.surprise.surprise_utils
     :members:
 
 
 TF-IDF
 ******************************
 
-.. automodule:: reco_utils.recommender.tfidf.tfidf_utils
+.. automodule:: reco_utils.models.tfidf.tfidf_utils
     :members:
 
 
 VAE
 ******************************
 
-.. automodule:: reco_utils.recommender.vae.multinomial_vae
+.. automodule:: reco_utils.models.vae.multinomial_vae
     :members:
 
-.. automodule:: reco_utils.recommender.vae.standard_vae
+.. automodule:: reco_utils.models.vae.standard_vae
     :members:
 
 
 Wide & Deep
 ******************************
 
-.. automodule:: reco_utils.recommender.wide_deep.wide_deep_utils
+.. automodule:: reco_utils.models.wide_deep.wide_deep_utils
     :members:
\ No newline at end of file
diff --git a/examples/00_quick_start/dkn_MIND.ipynb b/examples/00_quick_start/dkn_MIND.ipynb
index f3dfd6a52f..2e05045221 100644
--- a/examples/00_quick_start/dkn_MIND.ipynb
+++ b/examples/00_quick_start/dkn_MIND.ipynb
@@ -87,9 +87,9 @@
     "import tensorflow as tf\n",
     "tf.get_logger().setLevel('ERROR') # only show error messages\n",
     "\n",
-    "from reco_utils.recommender.deeprec.deeprec_utils import download_deeprec_resources, prepare_hparams\n",
-    "from reco_utils.recommender.deeprec.models.dkn import DKN\n",
-    "from reco_utils.recommender.deeprec.io.dkn_iterator import DKNTextIterator\n",
+    "from reco_utils.models.deeprec.deeprec_utils import download_deeprec_resources, prepare_hparams\n",
+    "from reco_utils.models.deeprec.models.dkn import DKN\n",
+    "from reco_utils.models.deeprec.io.dkn_iterator import DKNTextIterator\n",
     "\n",
     "print(f\"System version: {sys.version}\")\n",
     "print(f\"Tensorflow version: {tf.__version__}\")"
@@ -292,7 +292,7 @@
     {
      "data": {
       "text/plain": [
-       "<reco_utils.recommender.deeprec.models.dkn.DKN at 0x7f6d41a62ba8>"
+       "<reco_utils.models.deeprec.models.dkn.DKN at 0x7f6d41a62ba8>"
       ]
      },
      "execution_count": 8,
diff --git a/examples/00_quick_start/fastai_movielens.ipynb b/examples/00_quick_start/fastai_movielens.ipynb
index dbfaf0027f..52662036ba 100644
--- a/examples/00_quick_start/fastai_movielens.ipynb
+++ b/examples/00_quick_start/fastai_movielens.ipynb
@@ -52,7 +52,7 @@
     "from reco_utils.utils.timer import Timer\n",
     "from reco_utils.datasets import movielens\n",
     "from reco_utils.datasets.python_splitters import python_stratified_split\n",
-    "from reco_utils.recommender.fastai.fastai_utils import cartesian_product, score\n",
+    "from reco_utils.models.fastai.fastai_utils import cartesian_product, score\n",
     "from reco_utils.evaluation.python_evaluation import map_at_k, ndcg_at_k, precision_at_k, recall_at_k\n",
     "from reco_utils.evaluation.python_evaluation import rmse, mae, rsquared, exp_var\n",
     "\n",
diff --git a/examples/00_quick_start/geoimc_movielens.ipynb b/examples/00_quick_start/geoimc_movielens.ipynb
index 7b4fd8ef18..148272a424 100644
--- a/examples/00_quick_start/geoimc_movielens.ipynb
+++ b/examples/00_quick_start/geoimc_movielens.ipynb
@@ -28,9 +28,9 @@
     "import scrapbook as sb\n",
     "\n",
     "from reco_utils.datasets import movielens\n",
-    "from reco_utils.recommender.geoimc.geoimc_data import ML_100K\n",
-    "from reco_utils.recommender.geoimc.geoimc_algorithm import IMCProblem\n",
-    "from reco_utils.recommender.geoimc.geoimc_predict import Inferer\n",
+    "from reco_utils.models.geoimc.geoimc_data import ML_100K\n",
+    "from reco_utils.models.geoimc.geoimc_algorithm import IMCProblem\n",
+    "from reco_utils.models.geoimc.geoimc_predict import Inferer\n",
     "from reco_utils.evaluation.python_evaluation import (\n",
     "    rmse, mae\n",
     ")"
diff --git a/examples/00_quick_start/lightgbm_tinycriteo.ipynb b/examples/00_quick_start/lightgbm_tinycriteo.ipynb
index 20a38685ae..fc122f7847 100644
--- a/examples/00_quick_start/lightgbm_tinycriteo.ipynb
+++ b/examples/00_quick_start/lightgbm_tinycriteo.ipynb
@@ -58,7 +58,7 @@
     "from tempfile import TemporaryDirectory\n",
     "from sklearn.metrics import roc_auc_score, log_loss\n",
     "\n",
-    "import reco_utils.recommender.lightgbm.lightgbm_utils as lgb_utils\n",
+    "import reco_utils.models.lightgbm.lightgbm_utils as lgb_utils\n",
     "import reco_utils.datasets.criteo as criteo\n",
     "\n",
     "print(\"System version: {}\".format(sys.version))\n",
diff --git a/examples/00_quick_start/lstur_MIND.ipynb b/examples/00_quick_start/lstur_MIND.ipynb
index 6b17efcbf4..c0beae583a 100644
--- a/examples/00_quick_start/lstur_MIND.ipynb
+++ b/examples/00_quick_start/lstur_MIND.ipynb
@@ -96,11 +96,11 @@
     "import tensorflow as tf\n",
     "tf.get_logger().setLevel('ERROR') # only show error messages\n",
     "\n",
-    "from reco_utils.recommender.deeprec.deeprec_utils import download_deeprec_resources \n",
-    "from reco_utils.recommender.newsrec.newsrec_utils import prepare_hparams\n",
-    "from reco_utils.recommender.newsrec.models.lstur import LSTURModel\n",
-    "from reco_utils.recommender.newsrec.io.mind_iterator import MINDIterator\n",
-    "from reco_utils.recommender.newsrec.newsrec_utils import get_mind_data_set\n",
+    "from reco_utils.models.deeprec.deeprec_utils import download_deeprec_resources \n",
+    "from reco_utils.models.newsrec.newsrec_utils import prepare_hparams\n",
+    "from reco_utils.models.newsrec.models.lstur import LSTURModel\n",
+    "from reco_utils.models.newsrec.io.mind_iterator import MINDIterator\n",
+    "from reco_utils.models.newsrec.newsrec_utils import get_mind_data_set\n",
     "\n",
     "print(\"System version: {}\".format(sys.version))\n",
     "print(\"Tensorflow version: {}\".format(tf.__version__))\n"
@@ -383,7 +383,7 @@
     {
      "data": {
       "text/plain": [
-       "<reco_utils.recommender.newsrec.models.lstur.LSTURModel at 0x7f690ddf8b70>"
+       "<reco_utils.models.newsrec.models.lstur.LSTURModel at 0x7f690ddf8b70>"
       ]
      },
      "execution_count": 8,
diff --git a/examples/00_quick_start/naml_MIND.ipynb b/examples/00_quick_start/naml_MIND.ipynb
index b39e62d147..f3a3c03553 100644
--- a/examples/00_quick_start/naml_MIND.ipynb
+++ b/examples/00_quick_start/naml_MIND.ipynb
@@ -96,11 +96,11 @@
     "import tensorflow as tf\n",
     "tf.get_logger().setLevel('ERROR') # only show error messages\n",
     "\n",
-    "from reco_utils.recommender.deeprec.deeprec_utils import download_deeprec_resources \n",
-    "from reco_utils.recommender.newsrec.newsrec_utils import prepare_hparams\n",
-    "from reco_utils.recommender.newsrec.models.naml import NAMLModel\n",
-    "from reco_utils.recommender.newsrec.io.mind_all_iterator import MINDAllIterator\n",
-    "from reco_utils.recommender.newsrec.newsrec_utils import get_mind_data_set\n",
+    "from reco_utils.models.deeprec.deeprec_utils import download_deeprec_resources \n",
+    "from reco_utils.models.newsrec.newsrec_utils import prepare_hparams\n",
+    "from reco_utils.models.newsrec.models.naml import NAMLModel\n",
+    "from reco_utils.models.newsrec.io.mind_all_iterator import MINDAllIterator\n",
+    "from reco_utils.models.newsrec.newsrec_utils import get_mind_data_set\n",
     "\n",
     "print(\"System version: {}\".format(sys.version))\n",
     "print(\"Tensorflow version: {}\".format(tf.__version__))\n"
@@ -380,7 +380,7 @@
     {
      "data": {
       "text/plain": [
-       "<reco_utils.recommender.newsrec.models.naml.NAMLModel at 0x7f13946c2dd8>"
+       "<reco_utils.models.newsrec.models.naml.NAMLModel at 0x7f13946c2dd8>"
       ]
      },
      "execution_count": 8,
diff --git a/examples/00_quick_start/ncf_movielens.ipynb b/examples/00_quick_start/ncf_movielens.ipynb
index f5564aa685..4311792837 100644
--- a/examples/00_quick_start/ncf_movielens.ipynb
+++ b/examples/00_quick_start/ncf_movielens.ipynb
@@ -53,8 +53,8 @@
     "tf.get_logger().setLevel('ERROR') # only show error messages\n",
     "\n",
     "from reco_utils.utils.timer import Timer\n",
-    "from reco_utils.recommender.ncf.ncf_singlenode import NCF\n",
-    "from reco_utils.recommender.ncf.dataset import Dataset as NCFDataset\n",
+    "from reco_utils.models.ncf.ncf_singlenode import NCF\n",
+    "from reco_utils.models.ncf.dataset import Dataset as NCFDataset\n",
     "from reco_utils.datasets import movielens\n",
     "from reco_utils.utils.notebook_utils import is_jupyter\n",
     "from reco_utils.datasets.python_splitters import python_chrono_split\n",
diff --git a/examples/00_quick_start/npa_MIND.ipynb b/examples/00_quick_start/npa_MIND.ipynb
index 14c95657d5..4096784c0c 100644
--- a/examples/00_quick_start/npa_MIND.ipynb
+++ b/examples/00_quick_start/npa_MIND.ipynb
@@ -96,11 +96,11 @@
     "import tensorflow as tf\n",
     "tf.get_logger().setLevel('ERROR') # only show error messages\n",
     "\n",
-    "from reco_utils.recommender.deeprec.deeprec_utils import download_deeprec_resources \n",
-    "from reco_utils.recommender.newsrec.newsrec_utils import prepare_hparams\n",
-    "from reco_utils.recommender.newsrec.models.npa import NPAModel\n",
-    "from reco_utils.recommender.newsrec.io.mind_iterator import MINDIterator\n",
-    "from reco_utils.recommender.newsrec.newsrec_utils import get_mind_data_set\n",
+    "from reco_utils.models.deeprec.deeprec_utils import download_deeprec_resources \n",
+    "from reco_utils.models.newsrec.newsrec_utils import prepare_hparams\n",
+    "from reco_utils.models.newsrec.models.npa import NPAModel\n",
+    "from reco_utils.models.newsrec.io.mind_iterator import MINDIterator\n",
+    "from reco_utils.models.newsrec.newsrec_utils import get_mind_data_set\n",
     "\n",
     "print(\"System version: {}\".format(sys.version))\n",
     "print(\"Tensorflow version: {}\".format(tf.__version__))"
@@ -362,7 +362,7 @@
     {
      "data": {
       "text/plain": [
-       "<reco_utils.recommender.newsrec.models.npa.NPAModel at 0x7f92704b0f98>"
+       "<reco_utils.models.newsrec.models.npa.NPAModel at 0x7f92704b0f98>"
       ]
      },
      "execution_count": 8,
diff --git a/examples/00_quick_start/nrms_MIND.ipynb b/examples/00_quick_start/nrms_MIND.ipynb
index 8d1d44bdd5..344c01261e 100644
--- a/examples/00_quick_start/nrms_MIND.ipynb
+++ b/examples/00_quick_start/nrms_MIND.ipynb
@@ -96,11 +96,11 @@
     "import tensorflow as tf\n",
     "tf.get_logger().setLevel('ERROR') # only show error messages\n",
     "\n",
-    "from reco_utils.recommender.deeprec.deeprec_utils import download_deeprec_resources \n",
-    "from reco_utils.recommender.newsrec.newsrec_utils import prepare_hparams\n",
-    "from reco_utils.recommender.newsrec.models.nrms import NRMSModel\n",
-    "from reco_utils.recommender.newsrec.io.mind_iterator import MINDIterator\n",
-    "from reco_utils.recommender.newsrec.newsrec_utils import get_mind_data_set\n",
+    "from reco_utils.models.deeprec.deeprec_utils import download_deeprec_resources \n",
+    "from reco_utils.models.newsrec.newsrec_utils import prepare_hparams\n",
+    "from reco_utils.models.newsrec.models.nrms import NRMSModel\n",
+    "from reco_utils.models.newsrec.io.mind_iterator import MINDIterator\n",
+    "from reco_utils.models.newsrec.newsrec_utils import get_mind_data_set\n",
     "\n",
     "print(\"System version: {}\".format(sys.version))\n",
     "print(\"Tensorflow version: {}\".format(tf.__version__))\n"
@@ -377,7 +377,7 @@
     {
      "data": {
       "text/plain": [
-       "<reco_utils.recommender.newsrec.models.nrms.NRMSModel at 0x7f14d45b5a58>"
+       "<reco_utils.models.newsrec.models.nrms.NRMSModel at 0x7f14d45b5a58>"
       ]
      },
      "execution_count": 8,
diff --git a/examples/00_quick_start/rbm_movielens.ipynb b/examples/00_quick_start/rbm_movielens.ipynb
index 33ad814122..9bbf9bf39c 100644
--- a/examples/00_quick_start/rbm_movielens.ipynb
+++ b/examples/00_quick_start/rbm_movielens.ipynb
@@ -69,7 +69,7 @@
     "import tensorflow as tf\n",
     "tf.get_logger().setLevel('ERROR') # only show error messages\n",
     "\n",
-    "from reco_utils.recommender.rbm.rbm import RBM\n",
+    "from reco_utils.models.rbm.rbm import RBM\n",
     "from reco_utils.datasets.python_splitters import numpy_stratified_split\n",
     "from reco_utils.datasets.sparse import AffinityMatrix\n",
     "\n",
diff --git a/examples/00_quick_start/rlrmc_movielens.ipynb b/examples/00_quick_start/rlrmc_movielens.ipynb
index e1d71dc768..e5b13574ea 100644
--- a/examples/00_quick_start/rlrmc_movielens.ipynb
+++ b/examples/00_quick_start/rlrmc_movielens.ipynb
@@ -36,8 +36,8 @@
     "from reco_utils.datasets.python_splitters import python_random_split\n",
     "from reco_utils.datasets.python_splitters import python_stratified_split\n",
     "from reco_utils.datasets import movielens\n",
-    "from reco_utils.recommender.rlrmc.RLRMCdataset import RLRMCdataset \n",
-    "from reco_utils.recommender.rlrmc.RLRMCalgorithm import RLRMCalgorithm \n",
+    "from reco_utils.models.rlrmc.RLRMCdataset import RLRMCdataset \n",
+    "from reco_utils.models.rlrmc.RLRMCalgorithm import RLRMCalgorithm \n",
     "# Pymanopt installation is required via\n",
     "# pip install pymanopt \n",
     "from reco_utils.evaluation.python_evaluation import (\n",
diff --git a/examples/00_quick_start/sar_movielens.ipynb b/examples/00_quick_start/sar_movielens.ipynb
index 2e65683ffe..ae3e859aa2 100644
--- a/examples/00_quick_start/sar_movielens.ipynb
+++ b/examples/00_quick_start/sar_movielens.ipynb
@@ -79,7 +79,7 @@
     "    rsquared,\n",
     "    exp_var\n",
     ")\n",
-    "from reco_utils.recommender.sar import SAR\n",
+    "from reco_utils.models.sar import SAR\n",
     "import sys\n",
     "\n",
     "print(\"System version: {}\".format(sys.version))\n",
diff --git a/examples/00_quick_start/sar_movielens_with_azureml.ipynb b/examples/00_quick_start/sar_movielens_with_azureml.ipynb
index 8a972d2407..e05d2f5eeb 100644
--- a/examples/00_quick_start/sar_movielens_with_azureml.ipynb
+++ b/examples/00_quick_start/sar_movielens_with_azureml.ipynb
@@ -341,7 +341,7 @@
     "from reco_utils.datasets import movielens\n",
     "from reco_utils.datasets.python_splitters import python_stratified_split\n",
     "from reco_utils.evaluation.python_evaluation import map_at_k, ndcg_at_k, precision_at_k, recall_at_k\n",
-    "from reco_utils.recommender.sar.sar_singlenode import SARSingleNode\n",
+    "from reco_utils.models.sar.sar_singlenode import SARSingleNode\n",
     "\n",
     "\n",
     "logging.basicConfig(level=logging.DEBUG, \n",
diff --git a/examples/00_quick_start/sequential_recsys_amazondataset.ipynb b/examples/00_quick_start/sequential_recsys_amazondataset.ipynb
index c0a14583e2..557f4b8c76 100644
--- a/examples/00_quick_start/sequential_recsys_amazondataset.ipynb
+++ b/examples/00_quick_start/sequential_recsys_amazondataset.ipynb
@@ -65,24 +65,24 @@
     "\n",
     "from reco_utils.utils.timer import Timer\n",
     "from reco_utils.utils.constants import SEED\n",
-    "from reco_utils.recommender.deeprec.deeprec_utils import (\n",
+    "from reco_utils.models.deeprec.deeprec_utils import (\n",
     "    prepare_hparams\n",
     ")\n",
     "from reco_utils.datasets.amazon_reviews import download_and_extract, data_preprocessing\n",
     "from reco_utils.datasets.download_utils import maybe_download\n",
     "\n",
     "\n",
-    "from reco_utils.recommender.deeprec.models.sequential.sli_rec import SLI_RECModel as SeqModel\n",
+    "from reco_utils.models.deeprec.models.sequential.sli_rec import SLI_RECModel as SeqModel\n",
     "####  to use the other model, use one of the following lines:\n",
-    "# from reco_utils.recommender.deeprec.models.sequential.asvd import A2SVDModel as SeqModel\n",
-    "# from reco_utils.recommender.deeprec.models.sequential.caser import CaserModel as SeqModel\n",
-    "# from reco_utils.recommender.deeprec.models.sequential.gru4rec import GRU4RecModel as SeqModel\n",
-    "# from reco_utils.recommender.deeprec.models.sequential.sum import SUMModel as SeqModel\n",
+    "# from reco_utils.models.deeprec.models.sequential.asvd import A2SVDModel as SeqModel\n",
+    "# from reco_utils.models.deeprec.models.sequential.caser import CaserModel as SeqModel\n",
+    "# from reco_utils.models.deeprec.models.sequential.gru4rec import GRU4RecModel as SeqModel\n",
+    "# from reco_utils.models.deeprec.models.sequential.sum import SUMModel as SeqModel\n",
     "\n",
-    "#from reco_utils.recommender.deeprec.models.sequential.nextitnet import NextItNetModel\n",
+    "#from reco_utils.models.deeprec.models.sequential.nextitnet import NextItNetModel\n",
     "\n",
-    "from reco_utils.recommender.deeprec.io.sequential_iterator import SequentialIterator\n",
-    "#from reco_utils.recommender.deeprec.io.nextitnet_iterator import NextItNetIterator\n",
+    "from reco_utils.models.deeprec.io.sequential_iterator import SequentialIterator\n",
+    "#from reco_utils.models.deeprec.io.nextitnet_iterator import NextItNetIterator\n",
     "\n",
     "print(\"System version: {}\".format(sys.version))\n",
     "print(\"Tensorflow version: {}\".format(tf.__version__))\n",
@@ -530,7 +530,7 @@
     {
      "data": {
       "text/plain": [
-       "<reco_utils.recommender.deeprec.models.sequential.sli_rec.SLI_RECModel at 0x7f2da0326e80>"
+       "<reco_utils.models.deeprec.models.sequential.sli_rec.SLI_RECModel at 0x7f2da0326e80>"
       ]
      },
      "execution_count": 15,
diff --git a/examples/00_quick_start/tfidf_covid.ipynb b/examples/00_quick_start/tfidf_covid.ipynb
index 9a2b56d707..0fbc5e07cf 100644
--- a/examples/00_quick_start/tfidf_covid.ipynb
+++ b/examples/00_quick_start/tfidf_covid.ipynb
@@ -39,7 +39,7 @@
     "import sys\n",
     "# Import functions\n",
     "from reco_utils.datasets import covid_utils\n",
-    "from reco_utils.recommender.tfidf.tfidf_utils import TfidfRecommender\n",
+    "from reco_utils.models.tfidf.tfidf_utils import TfidfRecommender\n",
     "\n",
     "# Print version\n",
     "print(\"System version: {}\".format(sys.version))"
diff --git a/examples/00_quick_start/wide_deep_movielens.ipynb b/examples/00_quick_start/wide_deep_movielens.ipynb
index 905354da18..55136d4fa5 100644
--- a/examples/00_quick_start/wide_deep_movielens.ipynb
+++ b/examples/00_quick_start/wide_deep_movielens.ipynb
@@ -77,7 +77,7 @@
     "from reco_utils.datasets.pandas_df_utils import user_item_pairs\n",
     "from reco_utils.datasets.python_splitters import python_random_split\n",
     "import reco_utils.evaluation.python_evaluation as evaluator\n",
-    "import reco_utils.recommender.wide_deep.wide_deep_utils as wide_deep\n",
+    "import reco_utils.models.wide_deep.wide_deep_utils as wide_deep\n",
     "\n",
     "print(\"Tensorflow Version:\", tf.VERSION)\n",
     "print(\"GPUs:\\n\", gpu_utils.get_gpu_info())"
diff --git a/examples/00_quick_start/xdeepfm_criteo.ipynb b/examples/00_quick_start/xdeepfm_criteo.ipynb
index ae7d7f421a..a173d6b256 100644
--- a/examples/00_quick_start/xdeepfm_criteo.ipynb
+++ b/examples/00_quick_start/xdeepfm_criteo.ipynb
@@ -54,11 +54,11 @@
     "tf.get_logger().setLevel('ERROR') # only show error messages\n",
     "\n",
     "from reco_utils.utils.constants import SEED\n",
-    "from reco_utils.recommender.deeprec.deeprec_utils import (\n",
+    "from reco_utils.models.deeprec.deeprec_utils import (\n",
     "    download_deeprec_resources, prepare_hparams\n",
     ")\n",
-    "from reco_utils.recommender.deeprec.models.xDeepFM import XDeepFMModel\n",
-    "from reco_utils.recommender.deeprec.io.iterator import FFMTextIterator\n",
+    "from reco_utils.models.deeprec.models.xDeepFM import XDeepFMModel\n",
+    "from reco_utils.models.deeprec.io.iterator import FFMTextIterator\n",
     "\n",
     "print(\"System version: {}\".format(sys.version))\n",
     "print(\"Tensorflow version: {}\".format(tf.__version__))\n"
@@ -315,7 +315,7 @@
     {
      "data": {
       "text/plain": [
-       "<reco_utils.recommender.deeprec.models.xDeepFM.XDeepFMModel at 0x7f9d74f7ff60>"
+       "<reco_utils.models.deeprec.models.xDeepFM.XDeepFMModel at 0x7f9d74f7ff60>"
       ]
      },
      "execution_count": 8,
@@ -400,7 +400,7 @@
     {
      "data": {
       "text/plain": [
-       "<reco_utils.recommender.deeprec.models.xDeepFM.XDeepFMModel at 0x7f9d74f7ff60>"
+       "<reco_utils.models.deeprec.models.xDeepFM.XDeepFMModel at 0x7f9d74f7ff60>"
       ]
      },
      "execution_count": 11,
@@ -556,7 +556,7 @@
     {
      "data": {
       "text/plain": [
-       "<reco_utils.recommender.deeprec.models.xDeepFM.XDeepFMModel at 0x7f9d64b4a2e8>"
+       "<reco_utils.models.deeprec.models.xDeepFM.XDeepFMModel at 0x7f9d64b4a2e8>"
       ]
      },
      "execution_count": 16,
diff --git a/examples/02_model_collaborative_filtering/cornac_bivae_deep_dive.ipynb b/examples/02_model_collaborative_filtering/cornac_bivae_deep_dive.ipynb
index 838761fc34..d1c3aa6e09 100644
--- a/examples/02_model_collaborative_filtering/cornac_bivae_deep_dive.ipynb
+++ b/examples/02_model_collaborative_filtering/cornac_bivae_deep_dive.ipynb
@@ -54,7 +54,7 @@
     "from reco_utils.datasets import movielens\n",
     "from reco_utils.datasets.python_splitters import python_random_split\n",
     "from reco_utils.evaluation.python_evaluation import map_at_k, ndcg_at_k, precision_at_k, recall_at_k\n",
-    "from reco_utils.recommender.cornac.cornac_utils import predict_ranking\n",
+    "from reco_utils.models.cornac.cornac_utils import predict_ranking\n",
     "from reco_utils.utils.timer import Timer\n",
     "from reco_utils.utils.constants import SEED\n",
     "\n",
diff --git a/examples/02_model_collaborative_filtering/cornac_bpr_deep_dive.ipynb b/examples/02_model_collaborative_filtering/cornac_bpr_deep_dive.ipynb
index dbba6a4164..5bfbb580e6 100644
--- a/examples/02_model_collaborative_filtering/cornac_bpr_deep_dive.ipynb
+++ b/examples/02_model_collaborative_filtering/cornac_bpr_deep_dive.ipynb
@@ -52,7 +52,7 @@
     "from reco_utils.datasets import movielens\n",
     "from reco_utils.datasets.python_splitters import python_random_split\n",
     "from reco_utils.evaluation.python_evaluation import map_at_k, ndcg_at_k, precision_at_k, recall_at_k\n",
-    "from reco_utils.recommender.cornac.cornac_utils import predict_ranking\n",
+    "from reco_utils.models.cornac.cornac_utils import predict_ranking\n",
     "from reco_utils.utils.timer import Timer\n",
     "from reco_utils.utils.constants import SEED\n",
     "\n",
diff --git a/examples/02_model_collaborative_filtering/lightgcn_deep_dive.ipynb b/examples/02_model_collaborative_filtering/lightgcn_deep_dive.ipynb
index d97f5e1ee4..e4f6ba2582 100644
--- a/examples/02_model_collaborative_filtering/lightgcn_deep_dive.ipynb
+++ b/examples/02_model_collaborative_filtering/lightgcn_deep_dive.ipynb
@@ -53,13 +53,13 @@
     "tf.get_logger().setLevel('ERROR') # only show error messages\n",
     "\n",
     "from reco_utils.utils.timer import Timer\n",
-    "from reco_utils.recommender.deeprec.models.graphrec.lightgcn import LightGCN\n",
-    "from reco_utils.recommender.deeprec.DataModel.ImplicitCF import ImplicitCF\n",
+    "from reco_utils.models.deeprec.models.graphrec.lightgcn import LightGCN\n",
+    "from reco_utils.models.deeprec.DataModel.ImplicitCF import ImplicitCF\n",
     "from reco_utils.datasets import movielens\n",
     "from reco_utils.datasets.python_splitters import python_stratified_split\n",
     "from reco_utils.evaluation.python_evaluation import map_at_k, ndcg_at_k, precision_at_k, recall_at_k\n",
     "from reco_utils.utils.constants import SEED as DEFAULT_SEED\n",
-    "from reco_utils.recommender.deeprec.deeprec_utils import prepare_hparams\n",
+    "from reco_utils.models.deeprec.deeprec_utils import prepare_hparams\n",
     "\n",
     "print(\"System version: {}\".format(sys.version))\n",
     "print(\"Pandas version: {}\".format(pd.__version__))\n",
diff --git a/examples/02_model_collaborative_filtering/multi_vae_deep_dive.ipynb b/examples/02_model_collaborative_filtering/multi_vae_deep_dive.ipynb
index 413aeda975..cb950b7f9a 100644
--- a/examples/02_model_collaborative_filtering/multi_vae_deep_dive.ipynb
+++ b/examples/02_model_collaborative_filtering/multi_vae_deep_dive.ipynb
@@ -104,7 +104,7 @@
     "\n",
     "from reco_utils.datasets.sparse import AffinityMatrix\n",
     "from reco_utils.utils.python_utils import binarize\n",
-    "from reco_utils.recommender.vae.multinomial_vae import Mult_VAE\n",
+    "from reco_utils.models.vae.multinomial_vae import Mult_VAE\n",
     "\n",
     "from tempfile import TemporaryDirectory\n",
     "\n",
diff --git a/examples/02_model_collaborative_filtering/rbm_deep_dive.ipynb b/examples/02_model_collaborative_filtering/rbm_deep_dive.ipynb
index 8787aa16a7..c74e0923a3 100644
--- a/examples/02_model_collaborative_filtering/rbm_deep_dive.ipynb
+++ b/examples/02_model_collaborative_filtering/rbm_deep_dive.ipynb
@@ -89,7 +89,7 @@
     "import papermill \n",
     "\n",
     "#RBM \n",
-    "from reco_utils.recommender.rbm.rbm import RBM\n",
+    "from reco_utils.models.rbm.rbm import RBM\n",
     "from reco_utils.datasets.python_splitters import numpy_stratified_split\n",
     "from reco_utils.datasets.sparse import AffinityMatrix\n",
     "\n",
diff --git a/examples/02_model_collaborative_filtering/sar_deep_dive.ipynb b/examples/02_model_collaborative_filtering/sar_deep_dive.ipynb
index 254f5bc12f..737c45aafc 100644
--- a/examples/02_model_collaborative_filtering/sar_deep_dive.ipynb
+++ b/examples/02_model_collaborative_filtering/sar_deep_dive.ipynb
@@ -134,7 +134,7 @@
     "from reco_utils.datasets import movielens\n",
     "from reco_utils.datasets.python_splitters import python_stratified_split\n",
     "from reco_utils.evaluation.python_evaluation import map_at_k, ndcg_at_k, precision_at_k, recall_at_k\n",
-    "from reco_utils.recommender.sar.sar_singlenode import SARSingleNode\n",
+    "from reco_utils.models.sar.sar_singlenode import SARSingleNode\n",
     "\n",
     "print(\"System version: {}\".format(sys.version))\n",
     "print(\"Pandas version: {}\".format(pd.__version__))"
diff --git a/examples/02_model_collaborative_filtering/standard_vae_deep_dive.ipynb b/examples/02_model_collaborative_filtering/standard_vae_deep_dive.ipynb
index 5ec4626695..f1fc642f92 100644
--- a/examples/02_model_collaborative_filtering/standard_vae_deep_dive.ipynb
+++ b/examples/02_model_collaborative_filtering/standard_vae_deep_dive.ipynb
@@ -105,7 +105,7 @@
     "\n",
     "from reco_utils.datasets.sparse import AffinityMatrix\n",
     "from reco_utils.utils.python_utils import binarize\n",
-    "from reco_utils.recommender.vae.standard_vae import StandardVAE\n",
+    "from reco_utils.models.vae.standard_vae import StandardVAE\n",
     "\n",
     "print(\"System version: {}\".format(sys.version))\n",
     "print(\"Pandas version: {}\".format(pd.__version__))\n",
diff --git a/examples/02_model_collaborative_filtering/surprise_svd_deep_dive.ipynb b/examples/02_model_collaborative_filtering/surprise_svd_deep_dive.ipynb
index d8068ecb20..91e81764fa 100644
--- a/examples/02_model_collaborative_filtering/surprise_svd_deep_dive.ipynb
+++ b/examples/02_model_collaborative_filtering/surprise_svd_deep_dive.ipynb
@@ -110,7 +110,7 @@
     "from reco_utils.datasets.python_splitters import python_random_split\n",
     "from reco_utils.evaluation.python_evaluation import (rmse, mae, rsquared, exp_var, map_at_k, ndcg_at_k, precision_at_k, \n",
     "                                                     recall_at_k, get_top_k_items)\n",
-    "from reco_utils.recommender.surprise.surprise_utils import predict, compute_ranking_predictions\n",
+    "from reco_utils.models.surprise.surprise_utils import predict, compute_ranking_predictions\n",
     "\n",
     "print(\"System version: {}\".format(sys.version))\n",
     "print(\"Surprise version: {}\".format(surprise.__version__))"
diff --git a/examples/02_model_content_based_filtering/dkn_deep_dive.ipynb b/examples/02_model_content_based_filtering/dkn_deep_dive.ipynb
index 210c27655b..45207efb60 100644
--- a/examples/02_model_content_based_filtering/dkn_deep_dive.ipynb
+++ b/examples/02_model_content_based_filtering/dkn_deep_dive.ipynb
@@ -148,9 +148,9 @@
     "                                     get_user_history,\n",
     "                                     get_words_and_entities,\n",
     "                                     generate_embeddings) \n",
-    "from reco_utils.recommender.deeprec.deeprec_utils import prepare_hparams\n",
-    "from reco_utils.recommender.deeprec.models.dkn import DKN\n",
-    "from reco_utils.recommender.deeprec.io.dkn_iterator import DKNTextIterator\n",
+    "from reco_utils.models.deeprec.deeprec_utils import prepare_hparams\n",
+    "from reco_utils.models.deeprec.models.dkn import DKN\n",
+    "from reco_utils.models.deeprec.io.dkn_iterator import DKNTextIterator\n",
     "\n",
     "print(f\"System version: {sys.version}\")\n",
     "print(f\"Tensorflow version: {tf.__version__}\")"
@@ -391,7 +391,7 @@
     {
      "data": {
       "text/plain": [
-       "<reco_utils.recommender.deeprec.models.dkn.DKN at 0x7fe60850deb8>"
+       "<reco_utils.models.deeprec.models.dkn.DKN at 0x7fe60850deb8>"
       ]
      },
      "execution_count": 10,
@@ -479,7 +479,7 @@
     {
      "data": {
       "text/plain": [
-       "<reco_utils.recommender.deeprec.models.dkn.DKN at 0x7fe60850deb8>"
+       "<reco_utils.models.deeprec.models.dkn.DKN at 0x7fe60850deb8>"
       ]
      },
      "execution_count": 13,
diff --git a/examples/02_model_hybrid/lightfm_deep_dive.ipynb b/examples/02_model_hybrid/lightfm_deep_dive.ipynb
index 686564d638..4a132efbb9 100755
--- a/examples/02_model_hybrid/lightfm_deep_dive.ipynb
+++ b/examples/02_model_hybrid/lightfm_deep_dive.ipynb
@@ -156,7 +156,7 @@
     "\n",
     "from reco_utils.common.timer import Timer\n",
     "from reco_utils.datasets import movielens\n",
-    "from reco_utils.recommender.lightfm.lightfm_utils import (\n",
+    "from reco_utils.models.lightfm.lightfm_utils import (\n",
     "    track_model_metrics, prepare_test_df, prepare_all_predictions,\n",
     "    compare_metric, similar_users, similar_items)\n",
     "\n",
diff --git a/examples/02_model_hybrid/ncf_deep_dive.ipynb b/examples/02_model_hybrid/ncf_deep_dive.ipynb
index 481ebd13c6..4f920ab605 100644
--- a/examples/02_model_hybrid/ncf_deep_dive.ipynb
+++ b/examples/02_model_hybrid/ncf_deep_dive.ipynb
@@ -54,8 +54,8 @@
     "tf.get_logger().setLevel('ERROR') # only show error messages\n",
     "\n",
     "from reco_utils.utils.timer import Timer\n",
-    "from reco_utils.recommender.ncf.ncf_singlenode import NCF\n",
-    "from reco_utils.recommender.ncf.dataset import Dataset as NCFDataset\n",
+    "from reco_utils.models.ncf.ncf_singlenode import NCF\n",
+    "from reco_utils.models.ncf.dataset import Dataset as NCFDataset\n",
     "from reco_utils.datasets import movielens\n",
     "from reco_utils.datasets.python_splitters import python_chrono_split\n",
     "from reco_utils.evaluation.python_evaluation import (rmse, mae, rsquared, exp_var, map_at_k, ndcg_at_k, precision_at_k, \n",
diff --git a/examples/04_model_select_and_optimize/azureml_hyperdrive_surprise_svd.ipynb b/examples/04_model_select_and_optimize/azureml_hyperdrive_surprise_svd.ipynb
index db0e7417d3..2fdacda477 100644
--- a/examples/04_model_select_and_optimize/azureml_hyperdrive_surprise_svd.ipynb
+++ b/examples/04_model_select_and_optimize/azureml_hyperdrive_surprise_svd.ipynb
@@ -67,7 +67,7 @@
     "from reco_utils.datasets import movielens\n",
     "from reco_utils.datasets.python_splitters import python_random_split\n",
     "from reco_utils.evaluation.python_evaluation import rmse, precision_at_k, ndcg_at_k\n",
-    "from reco_utils.recommender.surprise.surprise_utils import predict, compute_ranking_predictions\n",
+    "from reco_utils.models.surprise.surprise_utils import predict, compute_ranking_predictions\n",
     "\n",
     "print(\"System version: {}\".format(sys.version))\n",
     "print(\"Surprise version: {}\".format(surprise.__version__))\n",
diff --git a/examples/04_model_select_and_optimize/nni_ncf.ipynb b/examples/04_model_select_and_optimize/nni_ncf.ipynb
index 6d75262d3c..4597f347fe 100644
--- a/examples/04_model_select_and_optimize/nni_ncf.ipynb
+++ b/examples/04_model_select_and_optimize/nni_ncf.ipynb
@@ -78,8 +78,8 @@
     "    get_trials,\n",
     "    stop_nni, start_nni\n",
     ")\n",
-    "from reco_utils.recommender.ncf.dataset import Dataset as NCFDataset\n",
-    "from reco_utils.recommender.ncf.ncf_singlenode import NCF\n",
+    "from reco_utils.models.ncf.dataset import Dataset as NCFDataset\n",
+    "from reco_utils.models.ncf.ncf_singlenode import NCF\n",
     "from reco_utils.tuning.nni.ncf_utils import compute_test_results, combine_metrics_dicts\n",
     "\n",
     "print(\"System version: {}\".format(sys.version))\n",
diff --git a/examples/04_model_select_and_optimize/nni_surprise_svd.ipynb b/examples/04_model_select_and_optimize/nni_surprise_svd.ipynb
index 6eb9f3d65d..a1b627f654 100644
--- a/examples/04_model_select_and_optimize/nni_surprise_svd.ipynb
+++ b/examples/04_model_select_and_optimize/nni_surprise_svd.ipynb
@@ -67,7 +67,7 @@
     "from reco_utils.evaluation.python_evaluation import rmse, precision_at_k, ndcg_at_k\n",
     "from reco_utils.tuning.nni.nni_utils import (check_experiment_status, check_stopped, check_metrics_written, get_trials,\n",
     "                                      stop_nni, start_nni)\n",
-    "from reco_utils.recommender.surprise.surprise_utils import predict, compute_ranking_predictions\n",
+    "from reco_utils.models.surprise.surprise_utils import predict, compute_ranking_predictions\n",
     "\n",
     "print(\"System version: {}\".format(sys.version))\n",
     "print(\"Surprise version: {}\".format(surprise.__version__))\n",
diff --git a/examples/04_model_select_and_optimize/train_scripts/svd_training.py b/examples/04_model_select_and_optimize/train_scripts/svd_training.py
index e2fcf50f8b..1d469a7204 100644
--- a/examples/04_model_select_and_optimize/train_scripts/svd_training.py
+++ b/examples/04_model_select_and_optimize/train_scripts/svd_training.py
@@ -15,7 +15,7 @@
     HAS_AML = False
 
 from reco_utils.evaluation.python_evaluation import *
-from reco_utils.recommender.surprise.surprise_utils import (
+from reco_utils.models.surprise.surprise_utils import (
     predict,
     compute_ranking_predictions,
 )
diff --git a/examples/06_benchmarks/benchmark_utils.py b/examples/06_benchmarks/benchmark_utils.py
index 26309b044c..e506b7e852 100644
--- a/examples/06_benchmarks/benchmark_utils.py
+++ b/examples/06_benchmarks/benchmark_utils.py
@@ -19,21 +19,21 @@
 )
 from reco_utils.utils.timer import Timer
 from reco_utils.utils.spark_utils import start_or_get_spark
-from reco_utils.recommender.sar.sar_singlenode import SARSingleNode
-from reco_utils.recommender.ncf.ncf_singlenode import NCF
-from reco_utils.recommender.ncf.dataset import Dataset as NCFDataset
-from reco_utils.recommender.surprise.surprise_utils import (
+from reco_utils.models.sar.sar_singlenode import SARSingleNode
+from reco_utils.models.ncf.ncf_singlenode import NCF
+from reco_utils.models.ncf.dataset import Dataset as NCFDataset
+from reco_utils.models.surprise.surprise_utils import (
     predict,
     compute_ranking_predictions,
 )
-from reco_utils.recommender.fastai.fastai_utils import (
+from reco_utils.models.fastai.fastai_utils import (
     cartesian_product,
     score,
 )
-from reco_utils.recommender.cornac.cornac_utils import predict_ranking
-from reco_utils.recommender.deeprec.models.graphrec.lightgcn import LightGCN
-from reco_utils.recommender.deeprec.DataModel.ImplicitCF import ImplicitCF
-from reco_utils.recommender.deeprec.deeprec_utils import prepare_hparams
+from reco_utils.models.cornac.cornac_utils import predict_ranking
+from reco_utils.models.deeprec.models.graphrec.lightgcn import LightGCN
+from reco_utils.models.deeprec.DataModel.ImplicitCF import ImplicitCF
+from reco_utils.models.deeprec.deeprec_utils import prepare_hparams
 from reco_utils.evaluation.spark_evaluation import (
     SparkRatingEvaluation,
     SparkRankingEvaluation,
diff --git a/examples/07_tutorials/KDD2020-tutorial/step3_run_dkn.ipynb b/examples/07_tutorials/KDD2020-tutorial/step3_run_dkn.ipynb
index b6f4cd60ae..c8abe0275a 100644
--- a/examples/07_tutorials/KDD2020-tutorial/step3_run_dkn.ipynb
+++ b/examples/07_tutorials/KDD2020-tutorial/step3_run_dkn.ipynb
@@ -57,9 +57,9 @@
    },
    "outputs": [],
    "source": [
-    "from reco_utils.recommender.deeprec.deeprec_utils import *\n",
-    "from reco_utils.recommender.deeprec.models.dkn import *\n",
-    "from reco_utils.recommender.deeprec.io.dkn_iterator import *\n",
+    "from reco_utils.models.deeprec.deeprec_utils import *\n",
+    "from reco_utils.models.deeprec.models.dkn import *\n",
+    "from reco_utils.models.deeprec.io.dkn_iterator import *\n",
     "import time\n",
     "\n",
     "import tensorflow as tf\n",
@@ -252,7 +252,7 @@
     {
      "data": {
       "text/plain": [
-       "<reco_utils.recommender.deeprec.models.dkn.DKN at 0x7f7c617c2898>"
+       "<reco_utils.models.deeprec.models.dkn.DKN at 0x7f7c617c2898>"
       ]
      },
      "execution_count": 8,
@@ -317,7 +317,7 @@
     {
      "data": {
       "text/plain": [
-       "<reco_utils.recommender.deeprec.models.dkn.DKN at 0x7f7c617c2898>"
+       "<reco_utils.models.deeprec.models.dkn.DKN at 0x7f7c617c2898>"
       ]
      },
      "execution_count": 10,
diff --git a/examples/07_tutorials/KDD2020-tutorial/step4_run_dkn_item2item.ipynb b/examples/07_tutorials/KDD2020-tutorial/step4_run_dkn_item2item.ipynb
index 62389cabb6..671958b5a2 100644
--- a/examples/07_tutorials/KDD2020-tutorial/step4_run_dkn_item2item.ipynb
+++ b/examples/07_tutorials/KDD2020-tutorial/step4_run_dkn_item2item.ipynb
@@ -25,9 +25,9 @@
    "metadata": {},
    "outputs": [],
    "source": [
-    "from reco_utils.recommender.deeprec.deeprec_utils import *\n",
-    "from reco_utils.recommender.deeprec.models.dkn_item2item import *\n",
-    "from reco_utils.recommender.deeprec.io.dkn_item2item_iterator import *\n",
+    "from reco_utils.models.deeprec.deeprec_utils import *\n",
+    "from reco_utils.models.deeprec.models.dkn_item2item import *\n",
+    "from reco_utils.models.deeprec.io.dkn_item2item_iterator import *\n",
     "import time\n",
     "\n",
     "import tensorflow as tf\n",
@@ -203,7 +203,7 @@
     {
      "data": {
       "text/plain": [
-       "<reco_utils.recommender.deeprec.models.dkn_item2item.DKNItem2Item at 0x7f54e400ba58>"
+       "<reco_utils.models.deeprec.models.dkn_item2item.DKNItem2Item at 0x7f54e400ba58>"
       ]
      },
      "execution_count": 7,
@@ -223,7 +223,7 @@
     {
      "data": {
       "text/plain": [
-       "<reco_utils.recommender.deeprec.models.dkn_item2item.DKNItem2Item at 0x7f54e400ba58>"
+       "<reco_utils.models.deeprec.models.dkn_item2item.DKNItem2Item at 0x7f54e400ba58>"
       ]
      },
      "execution_count": 8,
diff --git a/examples/07_tutorials/KDD2020-tutorial/step5_run_lightgcn.ipynb b/examples/07_tutorials/KDD2020-tutorial/step5_run_lightgcn.ipynb
index 46e4b845df..d0e0e51852 100644
--- a/examples/07_tutorials/KDD2020-tutorial/step5_run_lightgcn.ipynb
+++ b/examples/07_tutorials/KDD2020-tutorial/step5_run_lightgcn.ipynb
@@ -37,14 +37,14 @@
     "import numpy as np\n",
     "import tensorflow as tf\n",
     "from reco_utils.utils.timer import Timer\n",
-    "from reco_utils.recommender.deeprec.models.graphrec.lightgcn import LightGCN\n",
-    "from reco_utils.recommender.deeprec.DataModel.ImplicitCF import ImplicitCF\n",
+    "from reco_utils.models.deeprec.models.graphrec.lightgcn import LightGCN\n",
+    "from reco_utils.models.deeprec.DataModel.ImplicitCF import ImplicitCF\n",
     "from reco_utils.datasets import movielens\n",
     "from reco_utils.datasets.python_splitters import python_stratified_split\n",
     "from reco_utils.evaluation.python_evaluation import map_at_k, ndcg_at_k, precision_at_k, recall_at_k\n",
     "from reco_utils.utils.constants import SEED as DEFAULT_SEED\n",
-    "from reco_utils.recommender.deeprec.deeprec_utils import prepare_hparams\n",
-    "from reco_utils.recommender.deeprec.deeprec_utils import cal_metric\n",
+    "from reco_utils.models.deeprec.deeprec_utils import prepare_hparams\n",
+    "from reco_utils.models.deeprec.deeprec_utils import cal_metric\n",
     "from utils.general import *\n",
     "from utils.data_helper import *\n",
     "from utils.task_helper import *\n",
diff --git a/reco_utils/recommender/deeprec/io/dkn_item2item_iterator.py b/reco_utils/recommender/deeprec/io/dkn_item2item_iterator.py
index 55af21bfc6..833d8a8d8f 100644
--- a/reco_utils/recommender/deeprec/io/dkn_item2item_iterator.py
+++ b/reco_utils/recommender/deeprec/io/dkn_item2item_iterator.py
@@ -3,7 +3,7 @@
 
 
 import tensorflow as tf
-from reco_utils.recommender.deeprec.io.dkn_iterator import DKNTextIterator
+from reco_utils.models.deeprec.io.dkn_iterator import DKNTextIterator
 
 
 class DKNItem2itemTextIterator(DKNTextIterator):
diff --git a/reco_utils/recommender/deeprec/io/dkn_iterator.py b/reco_utils/recommender/deeprec/io/dkn_iterator.py
index f2eefa53e6..480db2df79 100644
--- a/reco_utils/recommender/deeprec/io/dkn_iterator.py
+++ b/reco_utils/recommender/deeprec/io/dkn_iterator.py
@@ -4,7 +4,7 @@
 import tensorflow as tf
 import numpy as np
 
-from reco_utils.recommender.deeprec.io.iterator import BaseIterator
+from reco_utils.models.deeprec.io.iterator import BaseIterator
 
 
 __all__ = ["DKNTextIterator"]
@@ -216,8 +216,8 @@ def load_infer_data_from_file(self, infile):
             infile (str): text input file. Each line in this file is an instance.
 
         Yields:
-            obj, list, int: 
-            - An iterator that yields parsed results, in the format of graph `feed_dict`. 
+            obj, list, int:
+            - An iterator that yields parsed results, in the format of graph `feed_dict`.
             - Impression id list.
             - Size of the data in a batch.
         """
diff --git a/reco_utils/recommender/deeprec/io/nextitnet_iterator.py b/reco_utils/recommender/deeprec/io/nextitnet_iterator.py
index d733d33bab..ddd07a6ca3 100644
--- a/reco_utils/recommender/deeprec/io/nextitnet_iterator.py
+++ b/reco_utils/recommender/deeprec/io/nextitnet_iterator.py
@@ -5,8 +5,8 @@
 import numpy as np
 import random
 
-from reco_utils.recommender.deeprec.io.sequential_iterator import SequentialIterator
-from reco_utils.recommender.deeprec.deeprec_utils import load_dict
+from reco_utils.models.deeprec.io.sequential_iterator import SequentialIterator
+from reco_utils.models.deeprec.deeprec_utils import load_dict
 
 
 __all__ = ["NextItNetIterator"]
diff --git a/reco_utils/recommender/deeprec/io/sequential_iterator.py b/reco_utils/recommender/deeprec/io/sequential_iterator.py
index 7c603c9469..14680b01f1 100644
--- a/reco_utils/recommender/deeprec/io/sequential_iterator.py
+++ b/reco_utils/recommender/deeprec/io/sequential_iterator.py
@@ -9,8 +9,8 @@
 import os
 import time
 
-from reco_utils.recommender.deeprec.io.iterator import BaseIterator
-from reco_utils.recommender.deeprec.deeprec_utils import load_dict
+from reco_utils.models.deeprec.io.iterator import BaseIterator
+from reco_utils.models.deeprec.deeprec_utils import load_dict
 
 
 __all__ = ["SequentialIterator"]
diff --git a/reco_utils/recommender/deeprec/models/base_model.py b/reco_utils/recommender/deeprec/models/base_model.py
index 277fff8cd4..c72eda1c69 100644
--- a/reco_utils/recommender/deeprec/models/base_model.py
+++ b/reco_utils/recommender/deeprec/models/base_model.py
@@ -8,7 +8,7 @@
 import numpy as np
 import tensorflow as tf
 from tensorflow import keras
-from reco_utils.recommender.deeprec.deeprec_utils import cal_metric
+from reco_utils.models.deeprec.deeprec_utils import cal_metric
 
 
 __all__ = ["BaseModel"]
@@ -532,8 +532,8 @@ def group_labels(self, labels, preds, group_keys):
             group_keys (list): group key list.
 
         Returns:
-            list, list: 
-            - Labels after group. 
+            list, list:
+            - Labels after group.
             - Predictions after group.
         """
         all_keys = list(set(group_keys))
diff --git a/reco_utils/recommender/deeprec/models/dkn.py b/reco_utils/recommender/deeprec/models/dkn.py
index a6b67bc2f6..8960cbf5f9 100644
--- a/reco_utils/recommender/deeprec/models/dkn.py
+++ b/reco_utils/recommender/deeprec/models/dkn.py
@@ -4,7 +4,7 @@
 import numpy as np
 import tensorflow as tf
 
-from reco_utils.recommender.deeprec.models.base_model import BaseModel
+from reco_utils.models.deeprec.models.base_model import BaseModel
 
 __all__ = ["DKN"]
 
diff --git a/reco_utils/recommender/deeprec/models/dkn_item2item.py b/reco_utils/recommender/deeprec/models/dkn_item2item.py
index e81b346833..c53c8dd879 100644
--- a/reco_utils/recommender/deeprec/models/dkn_item2item.py
+++ b/reco_utils/recommender/deeprec/models/dkn_item2item.py
@@ -4,8 +4,8 @@
 
 import numpy as np
 import tensorflow as tf
-from reco_utils.recommender.deeprec.models.dkn import DKN
-from reco_utils.recommender.deeprec.deeprec_utils import cal_metric
+from reco_utils.models.deeprec.models.dkn import DKN
+from reco_utils.models.deeprec.deeprec_utils import cal_metric
 
 
 r"""
diff --git a/reco_utils/recommender/deeprec/models/graphrec/lightgcn.py b/reco_utils/recommender/deeprec/models/graphrec/lightgcn.py
index 2328b826de..147796d4c8 100644
--- a/reco_utils/recommender/deeprec/models/graphrec/lightgcn.py
+++ b/reco_utils/recommender/deeprec/models/graphrec/lightgcn.py
@@ -31,7 +31,7 @@ def __init__(self, hparams, data, seed=None):
 
         Args:
             hparams (object): A tf.contrib.training.HParams object, hold the entire set of hyperparameters.
-            data (object): A reco_utils.recommender.deeprec.DataModel.ImplicitCF object, load and process data.
+            data (object): A reco_utils.models.deeprec.DataModel.ImplicitCF object, load and process data.
             seed (int): Seed.
 
         """
diff --git a/reco_utils/recommender/deeprec/models/sequential/asvd.py b/reco_utils/recommender/deeprec/models/sequential/asvd.py
index 25f01d28fb..1b19b13437 100644
--- a/reco_utils/recommender/deeprec/models/sequential/asvd.py
+++ b/reco_utils/recommender/deeprec/models/sequential/asvd.py
@@ -2,7 +2,7 @@
 # Licensed under the MIT License.
 
 import tensorflow as tf
-from reco_utils.recommender.deeprec.models.sequential.sequential_base_model import (
+from reco_utils.models.deeprec.models.sequential.sequential_base_model import (
     SequentialBaseModel,
 )
 
diff --git a/reco_utils/recommender/deeprec/models/sequential/caser.py b/reco_utils/recommender/deeprec/models/sequential/caser.py
index 0b96bbf1a8..d7045f29d3 100644
--- a/reco_utils/recommender/deeprec/models/sequential/caser.py
+++ b/reco_utils/recommender/deeprec/models/sequential/caser.py
@@ -2,7 +2,7 @@
 # Licensed under the MIT License.
 
 import tensorflow as tf
-from reco_utils.recommender.deeprec.models.sequential.sequential_base_model import (
+from reco_utils.models.deeprec.models.sequential.sequential_base_model import (
     SequentialBaseModel,
 )
 
diff --git a/reco_utils/recommender/deeprec/models/sequential/gru4rec.py b/reco_utils/recommender/deeprec/models/sequential/gru4rec.py
index a6cc918168..d153deb5c5 100644
--- a/reco_utils/recommender/deeprec/models/sequential/gru4rec.py
+++ b/reco_utils/recommender/deeprec/models/sequential/gru4rec.py
@@ -2,7 +2,7 @@
 # Licensed under the MIT License.
 
 import tensorflow as tf
-from reco_utils.recommender.deeprec.models.sequential.sequential_base_model import (
+from reco_utils.models.deeprec.models.sequential.sequential_base_model import (
     SequentialBaseModel,
 )
 from tensorflow.contrib.rnn import GRUCell, LSTMCell
diff --git a/reco_utils/recommender/deeprec/models/sequential/nextitnet.py b/reco_utils/recommender/deeprec/models/sequential/nextitnet.py
index 65617bd7e1..c604654577 100644
--- a/reco_utils/recommender/deeprec/models/sequential/nextitnet.py
+++ b/reco_utils/recommender/deeprec/models/sequential/nextitnet.py
@@ -2,7 +2,7 @@
 # Licensed under the MIT License.
 
 import tensorflow as tf
-from reco_utils.recommender.deeprec.models.sequential.sequential_base_model import (
+from reco_utils.models.deeprec.models.sequential.sequential_base_model import (
     SequentialBaseModel,
 )
 
diff --git a/reco_utils/recommender/deeprec/models/sequential/sequential_base_model.py b/reco_utils/recommender/deeprec/models/sequential/sequential_base_model.py
index ed6dc2808a..7bcac8d85c 100644
--- a/reco_utils/recommender/deeprec/models/sequential/sequential_base_model.py
+++ b/reco_utils/recommender/deeprec/models/sequential/sequential_base_model.py
@@ -7,8 +7,8 @@
 import numpy as np
 import tensorflow as tf
 
-from reco_utils.recommender.deeprec.models.base_model import BaseModel
-from reco_utils.recommender.deeprec.deeprec_utils import cal_metric, load_dict
+from reco_utils.models.deeprec.models.base_model import BaseModel
+from reco_utils.models.deeprec.deeprec_utils import cal_metric, load_dict
 
 
 __all__ = ["SequentialBaseModel"]
diff --git a/reco_utils/recommender/deeprec/models/sequential/sli_rec.py b/reco_utils/recommender/deeprec/models/sequential/sli_rec.py
index e5bc83e756..0e54217806 100644
--- a/reco_utils/recommender/deeprec/models/sequential/sli_rec.py
+++ b/reco_utils/recommender/deeprec/models/sequential/sli_rec.py
@@ -2,11 +2,11 @@
 # Licensed under the MIT License.
 
 import tensorflow as tf
-from reco_utils.recommender.deeprec.models.sequential.sequential_base_model import (
+from reco_utils.models.deeprec.models.sequential.sequential_base_model import (
     SequentialBaseModel,
 )
 from tensorflow.nn import dynamic_rnn
-from reco_utils.recommender.deeprec.models.sequential.rnn_cell_implement import (
+from reco_utils.models.deeprec.models.sequential.rnn_cell_implement import (
     Time4LSTMCell,
 )
 
diff --git a/reco_utils/recommender/deeprec/models/sequential/sum.py b/reco_utils/recommender/deeprec/models/sequential/sum.py
index 9226a33228..dd9c0c0073 100644
--- a/reco_utils/recommender/deeprec/models/sequential/sum.py
+++ b/reco_utils/recommender/deeprec/models/sequential/sum.py
@@ -3,10 +3,10 @@
 
 import tensorflow as tf
 from tensorflow.nn import dynamic_rnn
-from reco_utils.recommender.deeprec.models.sequential.sequential_base_model import (
+from reco_utils.models.deeprec.models.sequential.sequential_base_model import (
     SequentialBaseModel,
 )
-from reco_utils.recommender.deeprec.models.sequential.sum_cells import (
+from reco_utils.models.deeprec.models.sequential.sum_cells import (
     SUMCell,
     SUMV2Cell,
 )
diff --git a/reco_utils/recommender/deeprec/models/xDeepFM.py b/reco_utils/recommender/deeprec/models/xDeepFM.py
index 56d792d0e1..f673c29e4f 100644
--- a/reco_utils/recommender/deeprec/models/xDeepFM.py
+++ b/reco_utils/recommender/deeprec/models/xDeepFM.py
@@ -4,7 +4,7 @@
 import numpy as np
 import tensorflow as tf
 
-from reco_utils.recommender.deeprec.models.base_model import BaseModel
+from reco_utils.models.deeprec.models.base_model import BaseModel
 
 
 __all__ = ["XDeepFMModel"]
diff --git a/reco_utils/recommender/newsrec/io/mind_all_iterator.py b/reco_utils/recommender/newsrec/io/mind_all_iterator.py
index 2aca258856..0f08a38069 100644
--- a/reco_utils/recommender/newsrec/io/mind_all_iterator.py
+++ b/reco_utils/recommender/newsrec/io/mind_all_iterator.py
@@ -5,8 +5,8 @@
 import numpy as np
 import pickle
 
-from reco_utils.recommender.deeprec.io.iterator import BaseIterator
-from reco_utils.recommender.newsrec.newsrec_utils import word_tokenize, newsample
+from reco_utils.models.deeprec.io.iterator import BaseIterator
+from reco_utils.models.newsrec.newsrec_utils import word_tokenize, newsample
 
 __all__ = ["MINDAllIterator"]
 
diff --git a/reco_utils/recommender/newsrec/io/mind_iterator.py b/reco_utils/recommender/newsrec/io/mind_iterator.py
index 32143dd322..aa521de2d0 100644
--- a/reco_utils/recommender/newsrec/io/mind_iterator.py
+++ b/reco_utils/recommender/newsrec/io/mind_iterator.py
@@ -5,8 +5,8 @@
 import numpy as np
 import pickle
 
-from reco_utils.recommender.deeprec.io.iterator import BaseIterator
-from reco_utils.recommender.newsrec.newsrec_utils import word_tokenize, newsample
+from reco_utils.models.deeprec.io.iterator import BaseIterator
+from reco_utils.models.newsrec.newsrec_utils import word_tokenize, newsample
 
 __all__ = ["MINDIterator"]
 
diff --git a/reco_utils/recommender/newsrec/models/base_model.py b/reco_utils/recommender/newsrec/models/base_model.py
index 91e8e5d1d0..b6710d87ac 100644
--- a/reco_utils/recommender/newsrec/models/base_model.py
+++ b/reco_utils/recommender/newsrec/models/base_model.py
@@ -9,7 +9,7 @@
 import tensorflow as tf
 from tensorflow import keras
 
-from reco_utils.recommender.deeprec.deeprec_utils import cal_metric
+from reco_utils.models.deeprec.deeprec_utils import cal_metric
 
 __all__ = ["BaseModel"]
 
diff --git a/reco_utils/recommender/newsrec/models/lstur.py b/reco_utils/recommender/newsrec/models/lstur.py
index e9c6d8d61b..c655951de6 100644
--- a/reco_utils/recommender/newsrec/models/lstur.py
+++ b/reco_utils/recommender/newsrec/models/lstur.py
@@ -7,8 +7,8 @@
 from tensorflow.keras import layers
 
 
-from reco_utils.recommender.newsrec.models.base_model import BaseModel
-from reco_utils.recommender.newsrec.models.layers import (
+from reco_utils.models.newsrec.models.base_model import BaseModel
+from reco_utils.models.newsrec.models.layers import (
     AttLayer2,
     ComputeMasking,
     OverwriteMasking,
@@ -20,7 +20,7 @@
 class LSTURModel(BaseModel):
     """LSTUR model(Neural News Recommendation with Multi-Head Self-Attention)
 
-    Mingxiao An, Fangzhao Wu, Chuhan Wu, Kun Zhang, Zheng Liu and Xing Xie: 
+    Mingxiao An, Fangzhao Wu, Chuhan Wu, Kun Zhang, Zheng Liu and Xing Xie:
     Neural News Recommendation with Long- and Short-term User Representations, ACL 2019
 
     Attributes:
@@ -32,7 +32,7 @@ def __init__(self, hparams, iterator_creator, seed=None):
         """Initialization steps for LSTUR.
         Compared with the BaseModel, LSTUR need word embedding.
         After creating word embedding matrix, BaseModel's __init__ method will be called.
-        
+
         Args:
             hparams (object): Global hyper-parameters. Some key setttings such as type and gru_unit are there.
             iterator_creator_train (object): LSTUR data loader class for train data.
@@ -74,7 +74,7 @@ def _build_userencoder(self, titleencoder, type="ini"):
         """The main function to create user encoder of LSTUR.
 
         Args:
-            titleencoder (object): the news encoder of LSTUR. 
+            titleencoder (object): the news encoder of LSTUR.
 
         Return:
             object: the user encoder of LSTUR.
@@ -132,7 +132,7 @@ def _build_newsencoder(self, embedding_layer):
 
         Args:
             embedding_layer (object): a word embedding layer.
-        
+
         Return:
             object: the news encoder of LSTUR.
         """
@@ -162,7 +162,7 @@ def _build_newsencoder(self, embedding_layer):
     def _build_lstur(self):
         """The main function to create LSTUR's logic. The core of LSTUR
         is a user encoder and a news encoder.
-        
+
         Returns:
             object: a model used to train.
             object: a model used to evaluate and inference.
@@ -176,7 +176,11 @@ def _build_lstur(self):
             shape=(hparams.npratio + 1, hparams.title_size), dtype="int32"
         )
         pred_input_title_one = keras.Input(
-            shape=(1, hparams.title_size,), dtype="int32"
+            shape=(
+                1,
+                hparams.title_size,
+            ),
+            dtype="int32",
         )
         pred_title_reshape = layers.Reshape((hparams.title_size,))(pred_input_title_one)
         user_indexes = keras.Input(shape=(1,), dtype="int32")
diff --git a/reco_utils/recommender/newsrec/models/naml.py b/reco_utils/recommender/newsrec/models/naml.py
index 9817691c13..9d72bb0912 100644
--- a/reco_utils/recommender/newsrec/models/naml.py
+++ b/reco_utils/recommender/newsrec/models/naml.py
@@ -7,8 +7,8 @@
 from tensorflow.keras import layers
 
 
-from reco_utils.recommender.newsrec.models.base_model import BaseModel
-from reco_utils.recommender.newsrec.models.layers import AttLayer2
+from reco_utils.models.newsrec.models.base_model import BaseModel
+from reco_utils.models.newsrec.models.layers import AttLayer2
 
 __all__ = ["NAMLModel"]
 
@@ -28,7 +28,7 @@ def __init__(self, hparams, iterator_creator, seed=None):
         """Initialization steps for NAML.
         Compared with the BaseModel, NAML need word embedding.
         After creating word embedding matrix, BaseModel's __init__ method will be called.
-        
+
         Args:
             hparams (object): Global hyper-parameters. Some key setttings such as filter_num are there.
             iterator_creator_train (object): NAML data loader class for train data.
@@ -55,10 +55,10 @@ def _get_input_label_from_iter(self, batch_data):
         return input_feat, input_label
 
     def _get_user_feature_from_iter(self, batch_data):
-        """ get input of user encoder 
+        """get input of user encoder
         Args:
             batch_data: input batch data from user iterator
-        
+
         Returns:
             numpy.ndarray: input user feature (clicked title batch)
         """
@@ -72,10 +72,10 @@ def _get_user_feature_from_iter(self, batch_data):
         return input_feature
 
     def _get_news_feature_from_iter(self, batch_data):
-        """ get input of news encoder
+        """get input of news encoder
         Args:
             batch_data: input batch data from news iterator
-        
+
         Returns:
             numpy.ndarray: input news feature (candidate title batch)
         """
@@ -103,7 +103,7 @@ def _build_userencoder(self, newsencoder):
         """The main function to create user encoder of NAML.
 
         Args:
-            newsencoder (object): the news encoder of NAML. 
+            newsencoder (object): the news encoder of NAML.
 
         Return:
             object: the user encoder of NAML.
@@ -132,7 +132,7 @@ def _build_newsencoder(self, embedding_layer):
 
         Args:
             embedding_layer (object): a word embedding layer.
-        
+
         Return:
             object: the news encoder of NAML.
         """
@@ -180,7 +180,7 @@ def _build_titleencoder(self, embedding_layer):
 
         Args:
             embedding_layer (object): a word embedding layer.
-        
+
         Return:
             object: the title encoder of NAML.
         """
@@ -209,7 +209,7 @@ def _build_bodyencoder(self, embedding_layer):
 
         Args:
             embedding_layer (object): a word embedding layer.
-        
+
         Return:
             object: the body encoder of NAML.
         """
@@ -286,7 +286,7 @@ def _build_subvertencoder(self):
     def _build_naml(self):
         """The main function to create NAML's logic. The core of NAML
         is a user encoder and a news encoder.
-        
+
         Returns:
             object: a model used to train.
             object: a model used to evaluate and predict.
@@ -312,9 +312,19 @@ def _build_naml(self):
         pred_input_subvert = keras.Input(shape=(hparams.npratio + 1, 1), dtype="int32")
 
         pred_input_title_one = keras.Input(
-            shape=(1, hparams.title_size,), dtype="int32"
+            shape=(
+                1,
+                hparams.title_size,
+            ),
+            dtype="int32",
+        )
+        pred_input_body_one = keras.Input(
+            shape=(
+                1,
+                hparams.body_size,
+            ),
+            dtype="int32",
         )
-        pred_input_body_one = keras.Input(shape=(1, hparams.body_size,), dtype="int32")
         pred_input_vert_one = keras.Input(shape=(1, 1), dtype="int32")
         pred_input_subvert_one = keras.Input(shape=(1, 1), dtype="int32")
 
diff --git a/reco_utils/recommender/newsrec/models/npa.py b/reco_utils/recommender/newsrec/models/npa.py
index bc952d612e..7bfeafaf31 100644
--- a/reco_utils/recommender/newsrec/models/npa.py
+++ b/reco_utils/recommender/newsrec/models/npa.py
@@ -7,8 +7,8 @@
 from tensorflow.keras import layers
 
 
-from reco_utils.recommender.newsrec.models.base_model import BaseModel
-from reco_utils.recommender.newsrec.models.layers import PersonalizedAttentivePooling
+from reco_utils.models.newsrec.models.base_model import BaseModel
+from reco_utils.models.newsrec.models.layers import PersonalizedAttentivePooling
 
 __all__ = ["NPAModel"]
 
@@ -28,7 +28,7 @@ def __init__(self, hparams, iterator_creator, seed=None):
         """Initialization steps for MANL.
         Compared with the BaseModel, NPA need word embedding.
         After creating word embedding matrix, BaseModel's __init__ method will be called.
-        
+
         Args:
             hparams (object): Global hyper-parameters. Some key setttings such as filter_num are there.
             iterator_creator_train (object): NPA data loader class for train data.
@@ -64,7 +64,7 @@ def _build_userencoder(self, titleencoder, user_embedding_layer):
         """The main function to create user encoder of NPA.
 
         Args:
-            titleencoder (object): the news encoder of NPA. 
+            titleencoder (object): the news encoder of NPA.
 
         Return:
             object: the user encoder of NPA.
@@ -102,7 +102,7 @@ def _build_newsencoder(self, embedding_layer, user_embedding_layer):
 
         Args:
             embedding_layer (object): a word embedding layer.
-        
+
         Return:
             object: the news encoder of NPA.
         """
@@ -148,7 +148,7 @@ def _build_newsencoder(self, embedding_layer, user_embedding_layer):
     def _build_npa(self):
         """The main function to create NPA's logic. The core of NPA
         is a user encoder and a news encoder.
-        
+
         Returns:
             object: a model used to train.
             object: a model used to evaluate and predict.
@@ -162,7 +162,11 @@ def _build_npa(self):
             shape=(hparams.npratio + 1, hparams.title_size), dtype="int32"
         )
         pred_input_title_one = keras.Input(
-            shape=(1, hparams.title_size,), dtype="int32"
+            shape=(
+                1,
+                hparams.title_size,
+            ),
+            dtype="int32",
         )
         pred_title_one_reshape = layers.Reshape((hparams.title_size,))(
             pred_input_title_one
diff --git a/reco_utils/recommender/newsrec/models/nrms.py b/reco_utils/recommender/newsrec/models/nrms.py
index e3c7336d01..e67c3ddc23 100644
--- a/reco_utils/recommender/newsrec/models/nrms.py
+++ b/reco_utils/recommender/newsrec/models/nrms.py
@@ -7,8 +7,8 @@
 from tensorflow.keras import layers
 
 
-from reco_utils.recommender.newsrec.models.base_model import BaseModel
-from reco_utils.recommender.newsrec.models.layers import AttLayer2, SelfAttention
+from reco_utils.models.newsrec.models.base_model import BaseModel
+from reco_utils.models.newsrec.models.layers import AttLayer2, SelfAttention
 
 __all__ = ["NRMSModel"]
 
@@ -17,8 +17,8 @@ class NRMSModel(BaseModel):
     """NRMS model(Neural News Recommendation with Multi-Head Self-Attention)
 
     Chuhan Wu, Fangzhao Wu, Suyu Ge, Tao Qi, Yongfeng Huang,and Xing Xie, "Neural News
-    Recommendation with Multi-Head Self-Attention" in Proceedings of the 2019 Conference 
-    on Empirical Methods in Natural Language Processing and the 9th International Joint Conference 
+    Recommendation with Multi-Head Self-Attention" in Proceedings of the 2019 Conference
+    on Empirical Methods in Natural Language Processing and the 9th International Joint Conference
     on Natural Language Processing (EMNLP-IJCNLP)
 
     Attributes:
@@ -27,12 +27,15 @@ class NRMSModel(BaseModel):
     """
 
     def __init__(
-        self, hparams, iterator_creator, seed=None,
+        self,
+        hparams,
+        iterator_creator,
+        seed=None,
     ):
         """Initialization steps for NRMS.
         Compared with the BaseModel, NRMS need word embedding.
         After creating word embedding matrix, BaseModel's __init__ method will be called.
-        
+
         Args:
             hparams (object): Global hyper-parameters. Some key setttings such as head_num and head_dim are there.
             iterator_creator_train (object): NRMS data loader class for train data.
@@ -41,13 +44,15 @@ def __init__(
         self.word2vec_embedding = self._init_embedding(hparams.wordEmb_file)
 
         super().__init__(
-            hparams, iterator_creator, seed=seed,
+            hparams,
+            iterator_creator,
+            seed=seed,
         )
 
     def _get_input_label_from_iter(self, batch_data):
-        """ get input and labels for trainning from iterator
+        """get input and labels for trainning from iterator
 
-        Args: 
+        Args:
             batch data: input batch data from iterator
 
         Returns:
@@ -62,20 +67,20 @@ def _get_input_label_from_iter(self, batch_data):
         return input_feat, input_label
 
     def _get_user_feature_from_iter(self, batch_data):
-        """ get input of user encoder 
+        """get input of user encoder
         Args:
             batch_data: input batch data from user iterator
-        
+
         Returns:
             numpy.ndarray: input user feature (clicked title batch)
         """
         return batch_data["clicked_title_batch"]
 
     def _get_news_feature_from_iter(self, batch_data):
-        """ get input of news encoder
+        """get input of news encoder
         Args:
             batch_data: input batch data from news iterator
-        
+
         Returns:
             numpy.ndarray: input news feature (candidate title batch)
         """
@@ -96,7 +101,7 @@ def _build_userencoder(self, titleencoder):
         """The main function to create user encoder of NRMS.
 
         Args:
-            titleencoder (object): the news encoder of NRMS. 
+            titleencoder (object): the news encoder of NRMS.
 
         Return:
             object: the user encoder of NRMS.
@@ -120,7 +125,7 @@ def _build_newsencoder(self, embedding_layer):
 
         Args:
             embedding_layer (object): a word embedding layer.
-        
+
         Return:
             object: the news encoder of NRMS.
         """
@@ -140,7 +145,7 @@ def _build_newsencoder(self, embedding_layer):
     def _build_nrms(self):
         """The main function to create NRMS's logic. The core of NRMS
         is a user encoder and a news encoder.
-        
+
         Returns:
             object: a model used to train.
             object: a model used to evaluate and inference.
@@ -154,7 +159,11 @@ def _build_nrms(self):
             shape=(hparams.npratio + 1, hparams.title_size), dtype="int32"
         )
         pred_input_title_one = keras.Input(
-            shape=(1, hparams.title_size,), dtype="int32"
+            shape=(
+                1,
+                hparams.title_size,
+            ),
+            dtype="int32",
         )
         pred_title_one_reshape = layers.Reshape((hparams.title_size,))(
             pred_input_title_one
diff --git a/reco_utils/recommender/newsrec/newsrec_utils.py b/reco_utils/recommender/newsrec/newsrec_utils.py
index b6be84f60c..df14bb5b99 100644
--- a/reco_utils/recommender/newsrec/newsrec_utils.py
+++ b/reco_utils/recommender/newsrec/newsrec_utils.py
@@ -15,7 +15,7 @@
 import yaml
 import zipfile
 from reco_utils.datasets.download_utils import maybe_download
-from reco_utils.recommender.deeprec.deeprec_utils import (
+from reco_utils.models.deeprec.deeprec_utils import (
     flat_config,
     load_yaml,
     load_dict,
diff --git a/reco_utils/recommender/rlrmc/RLRMCalgorithm.py b/reco_utils/recommender/rlrmc/RLRMCalgorithm.py
index e03f6b1d8d..23e0b7a43a 100644
--- a/reco_utils/recommender/rlrmc/RLRMCalgorithm.py
+++ b/reco_utils/recommender/rlrmc/RLRMCalgorithm.py
@@ -5,7 +5,7 @@
 import logging
 
 from pymanopt import Problem
-from reco_utils.recommender.rlrmc.conjugate_gradient_ms import ConjugateGradientMS
+from reco_utils.models.rlrmc.conjugate_gradient_ms import ConjugateGradientMS
 from pymanopt.solvers.linesearch import LineSearchBackTracking
 from pymanopt.manifolds import Stiefel, PositiveDefinite, Product
 from math import sqrt
@@ -35,7 +35,7 @@ def __init__(
         Args:
             rank (int): rank of the final model. Should be a positive integer.
             C (float): regularization parameter. Should be a positive real number.
-            model_param (dict): contains model parameters such as number of rows & columns of the matrix as well as 
+            model_param (dict): contains model parameters such as number of rows & columns of the matrix as well as
                 the mean rating in the training dataset.
             initialize_flag (str): flag to set the initialization step of the algorithm. Current options are 'random'
                 (which is random initilization) and 'svd' (which is a singular value decomposition based initilization).
@@ -67,12 +67,12 @@ def _init_train(self, entries_train_csr):
         return W0
 
     def fit_and_evaluate(self, RLRMCdata, verbosity=0):
-        """Main fit and evalute method for RLRMC. In addition to fitting the model, it also computes the per 
+        """Main fit and evalute method for RLRMC. In addition to fitting the model, it also computes the per
         iteration statistics in train (and validation) datasets.
 
         Args:
             RLRMCdata (RLRMCdataset): the RLRMCdataset object.
-            verbosity (int): verbosity of Pymanopt. Possible values are 0 (least verbose), 1, or 2 (most verbose). 
+            verbosity (int): verbosity of Pymanopt. Possible values are 0 (least verbose), 1, or 2 (most verbose).
         """
         # it calls fit method with appropriate arguments
         self.fit(RLRMCdata, verbosity, True)
@@ -82,7 +82,7 @@ def fit(self, RLRMCdata, verbosity=0, _evaluate=False):
 
         Args:
             RLRMCdata (RLRMCdataset): the RLRMCdataset object.
-            verbosity (int): verbosity of Pymanopt. Possible values are 0 (least verbose), 1, or 2 (most verbose). 
+            verbosity (int): verbosity of Pymanopt. Possible values are 0 (least verbose), 1, or 2 (most verbose).
             _evaluate (bool): flag to compute the per iteration statistics in train (and validation) datasets.
         """
         # initialize the model
@@ -259,13 +259,13 @@ def _egrad(
 
     def predict(self, user_input, item_input, low_memory=False):
         """Predict function of this trained model
-            
+
         Args:
-            user_input ( list or element of list ): userID or userID list 
+            user_input ( list or element of list ): userID or userID list
             item_input ( list or element of list ): itemID or itemID list
-        
+
         Returns:
-            list or float: list of predicted rating or predicted rating score. 
+            list or float: list of predicted rating or predicted rating score.
         """
         # index converting
         user_input = np.array([self.user2id[x] for x in user_input])  # rows
diff --git a/reco_utils/tuning/nni/ncf_training.py b/reco_utils/tuning/nni/ncf_training.py
index f62a0b9a44..2affb76282 100644
--- a/reco_utils/tuning/nni/ncf_training.py
+++ b/reco_utils/tuning/nni/ncf_training.py
@@ -10,8 +10,8 @@
 import nni
 
 import reco_utils.evaluation.python_evaluation as evaluation
-from reco_utils.recommender.ncf.ncf_singlenode import NCF
-from reco_utils.recommender.ncf.dataset import Dataset as NCFDataset
+from reco_utils.models.ncf.ncf_singlenode import NCF
+from reco_utils.models.ncf.dataset import Dataset as NCFDataset
 from reco_utils.utils.constants import SEED as DEFAULT_SEED
 
 logging.basicConfig(level=logging.DEBUG)
diff --git a/reco_utils/tuning/nni/svd_training.py b/reco_utils/tuning/nni/svd_training.py
index 1fda33d540..bd4083633d 100644
--- a/reco_utils/tuning/nni/svd_training.py
+++ b/reco_utils/tuning/nni/svd_training.py
@@ -12,7 +12,7 @@
 
 
 import reco_utils.evaluation.python_evaluation as evaluation
-from reco_utils.recommender.surprise.surprise_utils import (
+from reco_utils.models.surprise.surprise_utils import (
     predict,
     compute_ranking_predictions,
 )
diff --git a/tests/smoke/reco_utils/recommender/test_deeprec_model.py b/tests/smoke/reco_utils/recommender/test_deeprec_model.py
index 9cbc5ee979..6a50f6b96a 100644
--- a/tests/smoke/reco_utils/recommender/test_deeprec_model.py
+++ b/tests/smoke/reco_utils/recommender/test_deeprec_model.py
@@ -7,24 +7,24 @@
 
 try:
     import tensorflow as tf
-    from reco_utils.recommender.deeprec.deeprec_utils import (
+    from reco_utils.models.deeprec.deeprec_utils import (
         download_deeprec_resources,
         prepare_hparams,
     )
-    from reco_utils.recommender.deeprec.models.base_model import BaseModel
-    from reco_utils.recommender.deeprec.models.xDeepFM import XDeepFMModel
-    from reco_utils.recommender.deeprec.models.dkn import DKN
-    from reco_utils.recommender.deeprec.io.iterator import FFMTextIterator
-    from reco_utils.recommender.deeprec.io.dkn_iterator import DKNTextIterator
-    from reco_utils.recommender.deeprec.io.sequential_iterator import SequentialIterator
-    from reco_utils.recommender.deeprec.models.sequential.sli_rec import SLI_RECModel
-    from reco_utils.recommender.deeprec.models.sequential.sum import SUMModel
+    from reco_utils.models.deeprec.models.base_model import BaseModel
+    from reco_utils.models.deeprec.models.xDeepFM import XDeepFMModel
+    from reco_utils.models.deeprec.models.dkn import DKN
+    from reco_utils.models.deeprec.io.iterator import FFMTextIterator
+    from reco_utils.models.deeprec.io.dkn_iterator import DKNTextIterator
+    from reco_utils.models.deeprec.io.sequential_iterator import SequentialIterator
+    from reco_utils.models.deeprec.models.sequential.sli_rec import SLI_RECModel
+    from reco_utils.models.deeprec.models.sequential.sum import SUMModel
     from reco_utils.datasets.amazon_reviews import (
         download_and_extract,
         data_preprocessing,
     )
-    from reco_utils.recommender.deeprec.models.graphrec.lightgcn import LightGCN
-    from reco_utils.recommender.deeprec.DataModel.ImplicitCF import ImplicitCF
+    from reco_utils.models.deeprec.models.graphrec.lightgcn import LightGCN
+    from reco_utils.models.deeprec.DataModel.ImplicitCF import ImplicitCF
     from reco_utils.datasets import movielens
     from reco_utils.datasets.python_splitters import python_stratified_split
 except ImportError:
diff --git a/tests/smoke/reco_utils/recommender/test_deeprec_utils.py b/tests/smoke/reco_utils/recommender/test_deeprec_utils.py
index b297a30327..67f3f38bc1 100644
--- a/tests/smoke/reco_utils/recommender/test_deeprec_utils.py
+++ b/tests/smoke/reco_utils/recommender/test_deeprec_utils.py
@@ -10,18 +10,18 @@
         download_and_extract,
         data_preprocessing,
     )
-    from reco_utils.recommender.deeprec.deeprec_utils import (
+    from reco_utils.models.deeprec.deeprec_utils import (
         prepare_hparams,
         download_deeprec_resources,
         load_yaml,
     )
-    from reco_utils.recommender.deeprec.io.dkn_iterator import DKNTextIterator
-    from reco_utils.recommender.deeprec.io.dkn_item2item_iterator import (
+    from reco_utils.models.deeprec.io.dkn_iterator import DKNTextIterator
+    from reco_utils.models.deeprec.io.dkn_item2item_iterator import (
         DKNItem2itemTextIterator,
     )
-    from reco_utils.recommender.deeprec.io.iterator import FFMTextIterator
-    from reco_utils.recommender.deeprec.io.sequential_iterator import SequentialIterator
-    from reco_utils.recommender.deeprec.models.sequential.sli_rec import SLI_RECModel
+    from reco_utils.models.deeprec.io.iterator import FFMTextIterator
+    from reco_utils.models.deeprec.io.sequential_iterator import SequentialIterator
+    from reco_utils.models.deeprec.models.sequential.sli_rec import SLI_RECModel
 except ImportError:
     pass  # disable error while collecting tests for non-gpu environments
 
diff --git a/tests/smoke/reco_utils/recommender/test_newsrec_model.py b/tests/smoke/reco_utils/recommender/test_newsrec_model.py
index 16d0d1a060..3653c6116c 100644
--- a/tests/smoke/reco_utils/recommender/test_newsrec_model.py
+++ b/tests/smoke/reco_utils/recommender/test_newsrec_model.py
@@ -4,16 +4,17 @@
 import os
 import papermill as pm
 import pytest
+
 try:
-    from reco_utils.recommender.newsrec.newsrec_utils import prepare_hparams
-    from reco_utils.recommender.deeprec.deeprec_utils import download_deeprec_resources
-    from reco_utils.recommender.newsrec.models.base_model import BaseModel
-    from reco_utils.recommender.newsrec.models.nrms import NRMSModel
-    from reco_utils.recommender.newsrec.models.naml import NAMLModel
-    from reco_utils.recommender.newsrec.models.lstur import LSTURModel
-    from reco_utils.recommender.newsrec.models.npa import NPAModel
-    from reco_utils.recommender.newsrec.io.mind_iterator import MINDIterator
-    from reco_utils.recommender.newsrec.io.mind_all_iterator import MINDAllIterator
+    from reco_utils.models.newsrec.newsrec_utils import prepare_hparams
+    from reco_utils.models.deeprec.deeprec_utils import download_deeprec_resources
+    from reco_utils.models.newsrec.models.base_model import BaseModel
+    from reco_utils.models.newsrec.models.nrms import NRMSModel
+    from reco_utils.models.newsrec.models.naml import NAMLModel
+    from reco_utils.models.newsrec.models.lstur import LSTURModel
+    from reco_utils.models.newsrec.models.npa import NPAModel
+    from reco_utils.models.newsrec.io.mind_iterator import MINDIterator
+    from reco_utils.models.newsrec.io.mind_all_iterator import MINDAllIterator
 except ImportError:
     pass  # disable error while collecting tests for non-gpu environments
 
diff --git a/tests/smoke/reco_utils/recommender/test_newsrec_utils.py b/tests/smoke/reco_utils/recommender/test_newsrec_utils.py
index 9292c76549..eb461a2956 100644
--- a/tests/smoke/reco_utils/recommender/test_newsrec_utils.py
+++ b/tests/smoke/reco_utils/recommender/test_newsrec_utils.py
@@ -3,12 +3,13 @@
 
 import os
 import pytest
+
 try:
     import tensorflow as tf
-    from reco_utils.recommender.newsrec.newsrec_utils import prepare_hparams, load_yaml
-    from reco_utils.recommender.deeprec.deeprec_utils import download_deeprec_resources
-    from reco_utils.recommender.newsrec.io.mind_iterator import MINDIterator
-    from reco_utils.recommender.newsrec.io.mind_all_iterator import MINDAllIterator
+    from reco_utils.models.newsrec.newsrec_utils import prepare_hparams, load_yaml
+    from reco_utils.models.deeprec.deeprec_utils import download_deeprec_resources
+    from reco_utils.models.newsrec.io.mind_iterator import MINDIterator
+    from reco_utils.models.newsrec.io.mind_all_iterator import MINDAllIterator
 except ImportError:
     pass  # disable error while collecting tests for non-gpu environments
 
diff --git a/tests/unit/reco_utils/common/test_tf_utils.py b/tests/unit/reco_utils/common/test_tf_utils.py
index 282d24ea81..5559d1b111 100644
--- a/tests/unit/reco_utils/common/test_tf_utils.py
+++ b/tests/unit/reco_utils/common/test_tf_utils.py
@@ -23,7 +23,7 @@
         pandas_input_fn,
         pandas_input_fn_for_saved_model,
     )
-    from reco_utils.recommender.wide_deep.wide_deep_utils import (
+    from reco_utils.models.wide_deep.wide_deep_utils import (
         build_model,
         build_feature_columns,
     )
diff --git a/tests/unit/reco_utils/recommender/test_cornac_utils.py b/tests/unit/reco_utils/recommender/test_cornac_utils.py
index 8d0e2a5091..0d4716cb7a 100644
--- a/tests/unit/reco_utils/recommender/test_cornac_utils.py
+++ b/tests/unit/reco_utils/recommender/test_cornac_utils.py
@@ -11,7 +11,7 @@
     DEFAULT_ITEM_COL,
     DEFAULT_RATING_COL,
 )
-from reco_utils.recommender.cornac.cornac_utils import predict, predict_ranking
+from reco_utils.models.cornac.cornac_utils import predict, predict_ranking
 from reco_utils.evaluation.python_evaluation import mae, rmse, ndcg_at_k, recall_at_k
 
 TOL = 0.001
diff --git a/tests/unit/reco_utils/recommender/test_deeprec_model.py b/tests/unit/reco_utils/recommender/test_deeprec_model.py
index 177faa8463..8c71048baa 100644
--- a/tests/unit/reco_utils/recommender/test_deeprec_model.py
+++ b/tests/unit/reco_utils/recommender/test_deeprec_model.py
@@ -8,27 +8,27 @@
 from reco_utils.datasets.python_splitters import python_stratified_split
 
 try:
-    from reco_utils.recommender.deeprec.DataModel.ImplicitCF import ImplicitCF
-    from reco_utils.recommender.deeprec.deeprec_utils import (
+    from reco_utils.models.deeprec.DataModel.ImplicitCF import ImplicitCF
+    from reco_utils.models.deeprec.deeprec_utils import (
         prepare_hparams,
         download_deeprec_resources,
     )
-    from reco_utils.recommender.deeprec.io.iterator import FFMTextIterator
-    from reco_utils.recommender.deeprec.io.dkn_item2item_iterator import (
+    from reco_utils.models.deeprec.io.iterator import FFMTextIterator
+    from reco_utils.models.deeprec.io.dkn_item2item_iterator import (
         DKNItem2itemTextIterator,
     )
-    from reco_utils.recommender.deeprec.io.dkn_iterator import DKNTextIterator
-    from reco_utils.recommender.deeprec.io.nextitnet_iterator import NextItNetIterator
-    from reco_utils.recommender.deeprec.io.sequential_iterator import SequentialIterator
-    from reco_utils.recommender.deeprec.models.dkn import DKN
-    from reco_utils.recommender.deeprec.models.dkn_item2item import DKNItem2Item
-    from reco_utils.recommender.deeprec.models.graphrec.lightgcn import LightGCN
-    from reco_utils.recommender.deeprec.models.sequential.nextitnet import (
+    from reco_utils.models.deeprec.io.dkn_iterator import DKNTextIterator
+    from reco_utils.models.deeprec.io.nextitnet_iterator import NextItNetIterator
+    from reco_utils.models.deeprec.io.sequential_iterator import SequentialIterator
+    from reco_utils.models.deeprec.models.dkn import DKN
+    from reco_utils.models.deeprec.models.dkn_item2item import DKNItem2Item
+    from reco_utils.models.deeprec.models.graphrec.lightgcn import LightGCN
+    from reco_utils.models.deeprec.models.sequential.nextitnet import (
         NextItNetModel,
     )
-    from reco_utils.recommender.deeprec.models.sequential.sli_rec import SLI_RECModel
-    from reco_utils.recommender.deeprec.models.sequential.sum import SUMModel
-    from reco_utils.recommender.deeprec.models.xDeepFM import XDeepFMModel
+    from reco_utils.models.deeprec.models.sequential.sli_rec import SLI_RECModel
+    from reco_utils.models.deeprec.models.sequential.sum import SUMModel
+    from reco_utils.models.deeprec.models.xDeepFM import XDeepFMModel
 except ImportError:
     pass  # skip this import if we are in cpu environment
 
diff --git a/tests/unit/reco_utils/recommender/test_deeprec_utils.py b/tests/unit/reco_utils/recommender/test_deeprec_utils.py
index 0508c15a3a..6deaed0089 100644
--- a/tests/unit/reco_utils/recommender/test_deeprec_utils.py
+++ b/tests/unit/reco_utils/recommender/test_deeprec_utils.py
@@ -6,18 +6,18 @@
 from reco_utils.datasets.amazon_reviews import download_and_extract, data_preprocessing
 
 try:
-    from reco_utils.recommender.deeprec.deeprec_utils import (
+    from reco_utils.models.deeprec.deeprec_utils import (
         prepare_hparams,
         download_deeprec_resources,
         load_yaml,
     )
-    from reco_utils.recommender.deeprec.io.iterator import FFMTextIterator
-    from reco_utils.recommender.deeprec.io.dkn_item2item_iterator import (
+    from reco_utils.models.deeprec.io.iterator import FFMTextIterator
+    from reco_utils.models.deeprec.io.dkn_item2item_iterator import (
         DKNItem2itemTextIterator,
     )
-    from reco_utils.recommender.deeprec.io.dkn_iterator import DKNTextIterator
-    from reco_utils.recommender.deeprec.io.sequential_iterator import SequentialIterator
-    from reco_utils.recommender.deeprec.models.sequential.sli_rec import SLI_RECModel
+    from reco_utils.models.deeprec.io.dkn_iterator import DKNTextIterator
+    from reco_utils.models.deeprec.io.sequential_iterator import SequentialIterator
+    from reco_utils.models.deeprec.models.sequential.sli_rec import SLI_RECModel
     import tensorflow as tf
 except ImportError:
     pass  # skip this import if we are in cpu environment
diff --git a/tests/unit/reco_utils/recommender/test_geoimc.py b/tests/unit/reco_utils/recommender/test_geoimc.py
index c144a706a3..fdc4560f9b 100644
--- a/tests/unit/reco_utils/recommender/test_geoimc.py
+++ b/tests/unit/reco_utils/recommender/test_geoimc.py
@@ -10,10 +10,10 @@
 from pandas.testing import assert_frame_equal
 
 from reco_utils.utils.python_utils import binarize
-from reco_utils.recommender.geoimc.geoimc_data import DataPtr
-from reco_utils.recommender.geoimc.geoimc_predict import PlainScalarProduct, Inferer
-from reco_utils.recommender.geoimc.geoimc_algorithm import IMCProblem
-from reco_utils.recommender.geoimc.geoimc_utils import (
+from reco_utils.models.geoimc.geoimc_data import DataPtr
+from reco_utils.models.geoimc.geoimc_predict import PlainScalarProduct, Inferer
+from reco_utils.models.geoimc.geoimc_algorithm import IMCProblem
+from reco_utils.models.geoimc.geoimc_utils import (
     length_normalize,
     mean_center,
     reduce_dims,
diff --git a/tests/unit/reco_utils/recommender/test_lightfm_utils.py b/tests/unit/reco_utils/recommender/test_lightfm_utils.py
index ee80c53eaa..71135e08db 100644
--- a/tests/unit/reco_utils/recommender/test_lightfm_utils.py
+++ b/tests/unit/reco_utils/recommender/test_lightfm_utils.py
@@ -8,7 +8,7 @@
 import lightfm
 from lightfm import LightFM, cross_validation
 from lightfm.data import Dataset
-from reco_utils.recommender.lightfm.lightfm_utils import (
+from reco_utils.models.lightfm.lightfm_utils import (
     compare_metric,
     track_model_metrics,
     similar_users,
diff --git a/tests/unit/reco_utils/recommender/test_ncf_dataset.py b/tests/unit/reco_utils/recommender/test_ncf_dataset.py
index b94df47f9c..61597450b2 100644
--- a/tests/unit/reco_utils/recommender/test_ncf_dataset.py
+++ b/tests/unit/reco_utils/recommender/test_ncf_dataset.py
@@ -7,7 +7,7 @@
     DEFAULT_ITEM_COL,
     SEED,
 )
-from reco_utils.recommender.ncf.dataset import Dataset
+from reco_utils.models.ncf.dataset import Dataset
 
 
 N_NEG = 5
diff --git a/tests/unit/reco_utils/recommender/test_ncf_singlenode.py b/tests/unit/reco_utils/recommender/test_ncf_singlenode.py
index b2f635e2ae..8f09980e54 100644
--- a/tests/unit/reco_utils/recommender/test_ncf_singlenode.py
+++ b/tests/unit/reco_utils/recommender/test_ncf_singlenode.py
@@ -7,8 +7,8 @@
 import pytest
 
 try:
-    from reco_utils.recommender.ncf.ncf_singlenode import NCF
-    from reco_utils.recommender.ncf.dataset import Dataset
+    from reco_utils.models.ncf.ncf_singlenode import NCF
+    from reco_utils.models.ncf.dataset import Dataset
     from reco_utils.utils.constants import (
         DEFAULT_USER_COL,
         DEFAULT_ITEM_COL,
diff --git a/tests/unit/reco_utils/recommender/test_newsrec_model.py b/tests/unit/reco_utils/recommender/test_newsrec_model.py
index 47055ed6a9..a047895c0e 100644
--- a/tests/unit/reco_utils/recommender/test_newsrec_model.py
+++ b/tests/unit/reco_utils/recommender/test_newsrec_model.py
@@ -5,14 +5,14 @@
 import pytest
 
 try:
-    from reco_utils.recommender.deeprec.deeprec_utils import download_deeprec_resources
-    from reco_utils.recommender.newsrec.io.mind_all_iterator import MINDAllIterator
-    from reco_utils.recommender.newsrec.io.mind_iterator import MINDIterator
-    from reco_utils.recommender.newsrec.newsrec_utils import prepare_hparams
-    from reco_utils.recommender.newsrec.models.lstur import LSTURModel
-    from reco_utils.recommender.newsrec.models.naml import NAMLModel
-    from reco_utils.recommender.newsrec.models.npa import NPAModel
-    from reco_utils.recommender.newsrec.models.nrms import NRMSModel
+    from reco_utils.models.deeprec.deeprec_utils import download_deeprec_resources
+    from reco_utils.models.newsrec.io.mind_all_iterator import MINDAllIterator
+    from reco_utils.models.newsrec.io.mind_iterator import MINDIterator
+    from reco_utils.models.newsrec.newsrec_utils import prepare_hparams
+    from reco_utils.models.newsrec.models.lstur import LSTURModel
+    from reco_utils.models.newsrec.models.naml import NAMLModel
+    from reco_utils.models.newsrec.models.npa import NPAModel
+    from reco_utils.models.newsrec.models.nrms import NRMSModel
 except ImportError:
     pass  # skip this import if we are in cpu environment
 
diff --git a/tests/unit/reco_utils/recommender/test_newsrec_utils.py b/tests/unit/reco_utils/recommender/test_newsrec_utils.py
index 14a5a99321..c8e3f3b324 100644
--- a/tests/unit/reco_utils/recommender/test_newsrec_utils.py
+++ b/tests/unit/reco_utils/recommender/test_newsrec_utils.py
@@ -5,8 +5,8 @@
 import pytest
 
 try:
-    from reco_utils.recommender.deeprec.deeprec_utils import download_deeprec_resources
-    from reco_utils.recommender.newsrec.newsrec_utils import prepare_hparams, load_yaml
+    from reco_utils.models.deeprec.deeprec_utils import download_deeprec_resources
+    from reco_utils.models.newsrec.newsrec_utils import prepare_hparams, load_yaml
     import tensorflow as tf
 except ImportError:
     pass  # skip this import if we are in cpu environment
diff --git a/tests/unit/reco_utils/recommender/test_rbm.py b/tests/unit/reco_utils/recommender/test_rbm.py
index f30dd82305..48c8fa4ce6 100644
--- a/tests/unit/reco_utils/recommender/test_rbm.py
+++ b/tests/unit/reco_utils/recommender/test_rbm.py
@@ -5,7 +5,7 @@
 import pytest
 
 try:
-    from reco_utils.recommender.rbm.rbm import RBM
+    from reco_utils.models.rbm.rbm import RBM
 except ImportError:
     pass  # skip this import if we are in cpu environment
 
diff --git a/tests/unit/reco_utils/recommender/test_sar_singlenode.py b/tests/unit/reco_utils/recommender/test_sar_singlenode.py
index b16629e9c1..78f30949dd 100644
--- a/tests/unit/reco_utils/recommender/test_sar_singlenode.py
+++ b/tests/unit/reco_utils/recommender/test_sar_singlenode.py
@@ -11,7 +11,7 @@
 import urllib
 
 from reco_utils.utils.constants import DEFAULT_PREDICTION_COL
-from reco_utils.recommender.sar.sar_singlenode import SARSingleNode
+from reco_utils.models.sar.sar_singlenode import SARSingleNode
 
 
 def _csv_reader_url(url, delimiter=",", encoding="utf-8"):
diff --git a/tests/unit/reco_utils/recommender/test_surprise_utils.py b/tests/unit/reco_utils/recommender/test_surprise_utils.py
index dde32f68a5..3212909d19 100644
--- a/tests/unit/reco_utils/recommender/test_surprise_utils.py
+++ b/tests/unit/reco_utils/recommender/test_surprise_utils.py
@@ -11,7 +11,7 @@
     DEFAULT_ITEM_COL,
     DEFAULT_RATING_COL,
 )
-from reco_utils.recommender.surprise.surprise_utils import (
+from reco_utils.models.surprise.surprise_utils import (
     predict,
     compute_ranking_predictions,
 )
diff --git a/tests/unit/reco_utils/recommender/test_tfidf_utils.py b/tests/unit/reco_utils/recommender/test_tfidf_utils.py
index 8a6c3b6347..a41e6f0595 100644
--- a/tests/unit/reco_utils/recommender/test_tfidf_utils.py
+++ b/tests/unit/reco_utils/recommender/test_tfidf_utils.py
@@ -2,7 +2,7 @@
 # Licensed under the MIT License.
 
 import pytest
-from reco_utils.recommender.tfidf.tfidf_utils import TfidfRecommender
+from reco_utils.models.tfidf.tfidf_utils import TfidfRecommender
 import pandas as pd
 import scipy
 
diff --git a/tests/unit/reco_utils/recommender/test_vowpal_wabbit.py b/tests/unit/reco_utils/recommender/test_vowpal_wabbit.py
index e934a714b5..54a9e4d02b 100644
--- a/tests/unit/reco_utils/recommender/test_vowpal_wabbit.py
+++ b/tests/unit/reco_utils/recommender/test_vowpal_wabbit.py
@@ -6,7 +6,7 @@
 from unittest import mock
 import pandas as pd
 
-from reco_utils.recommender.vowpal_wabbit.vw import VW
+from reco_utils.models.vowpal_wabbit.vw import VW
 
 
 @pytest.fixture(scope="module")
@@ -114,7 +114,7 @@ def test_fit_and_predict(model, df):
         f.writelines(["1 0\n", "3 1\n", "5 2\n"])
 
     # patch subprocess call to vw
-    with mock.patch("reco_utils.recommender.vowpal_wabbit.vw.run") as mock_run:
+    with mock.patch("reco_utils.models.vowpal_wabbit.vw.run") as mock_run:
         model.fit(df)
         result = model.predict(df)
 
diff --git a/tests/unit/reco_utils/recommender/test_wide_deep_utils.py b/tests/unit/reco_utils/recommender/test_wide_deep_utils.py
index bd013b175c..413d57e8b7 100644
--- a/tests/unit/reco_utils/recommender/test_wide_deep_utils.py
+++ b/tests/unit/reco_utils/recommender/test_wide_deep_utils.py
@@ -12,7 +12,7 @@
 
 try:
     from reco_utils.utils.tf_utils import pandas_input_fn, MODEL_DIR
-    from reco_utils.recommender.wide_deep.wide_deep_utils import (
+    from reco_utils.models.wide_deep.wide_deep_utils import (
         build_model,
         build_feature_columns,
     )

From caa179b7f6ccdb31ce54600ce22248329b7e4ce1 Mon Sep 17 00:00:00 2001
From: miguelgfierro <miguelgfierro@users.noreply.github.com>
Date: Thu, 15 Jul 2021 16:36:04 +0000
Subject: [PATCH 05/17] recommender to models :boom::boom::boom:

---
 docs/source/{recommender.rst => models.rst} | 0
 1 file changed, 0 insertions(+), 0 deletions(-)
 rename docs/source/{recommender.rst => models.rst} (100%)

diff --git a/docs/source/recommender.rst b/docs/source/models.rst
similarity index 100%
rename from docs/source/recommender.rst
rename to docs/source/models.rst

From 5d4fae0426fa3c9b219a96798012e57772c364cd Mon Sep 17 00:00:00 2001
From: miguelgfierro <miguelgfierro@users.noreply.github.com>
Date: Thu, 15 Jul 2021 16:47:44 +0000
Subject: [PATCH 06/17] rename folders :boom::boom:

---
 docs/source/index.rst   | 4 ++--
 examples/template.ipynb | 2 +-
 2 files changed, 3 insertions(+), 3 deletions(-)

diff --git a/docs/source/index.rst b/docs/source/index.rst
index 62850666f9..d240a24061 100644
--- a/docs/source/index.rst
+++ b/docs/source/index.rst
@@ -12,9 +12,9 @@ evaluating recommender systems.
    :caption: Contents:
 
     Utils <utils>
-    Dataset <dataset>
+    Datasets <datasets>
     Evaluation <evaluation>
-    Recommender algorithms <recommender>
+    Recommender algorithms <models>
     Hyperparameter tuning <tuning>
 
 
diff --git a/examples/template.ipynb b/examples/template.ipynb
index cfa88e3c10..58bb47c0c4 100644
--- a/examples/template.ipynb
+++ b/examples/template.ipynb
@@ -77,7 +77,7 @@
      "name": "stderr",
      "output_type": "stream",
      "text": [
-      "/anaconda/envs/recommender/lib/python3.6/importlib/_bootstrap.py:205: RuntimeWarning: numpy.dtype size changed, may indicate binary incompatibility. Expected 96, got 88\n",
+      "/anaconda/envs/models/lib/python3.6/importlib/_bootstrap.py:205: RuntimeWarning: numpy.dtype size changed, may indicate binary incompatibility. Expected 96, got 88\n",
       "  return f(*args, **kwds)\n"
      ]
     }

From 4fed2ae8fa77cf188b8bf24a0fd703ac9f34a02a Mon Sep 17 00:00:00 2001
From: miguelgfierro <miguelgfierro@users.noreply.github.com>
Date: Thu, 15 Jul 2021 16:48:49 +0000
Subject: [PATCH 07/17] rename folders :boom::boom::boom:

---
 .../00_quick_start/sequential_recsys_amazondataset.ipynb  | 2 +-
 .../lightgcn_deep_dive.ipynb                              | 2 +-
 .../02_model_collaborative_filtering/sar_deep_dive.ipynb  | 2 +-
 examples/02_model_hybrid/fm_deep_dive.ipynb               | 8 ++++----
 examples/02_model_hybrid/ncf_deep_dive.ipynb              | 2 +-
 reco_utils/recommender/rlrmc/RLRMCdataset.py              | 2 +-
 tests/integration/examples/test_notebooks_gpu.py          | 4 ++--
 7 files changed, 11 insertions(+), 11 deletions(-)

diff --git a/examples/00_quick_start/sequential_recsys_amazondataset.ipynb b/examples/00_quick_start/sequential_recsys_amazondataset.ipynb
index 557f4b8c76..3eae48ca3b 100644
--- a/examples/00_quick_start/sequential_recsys_amazondataset.ipynb
+++ b/examples/00_quick_start/sequential_recsys_amazondataset.ipynb
@@ -96,7 +96,7 @@
    "outputs": [],
    "source": [
     "##  ATTENTION: change to the corresponding config file, e.g., caser.yaml for CaserModel, sum.yaml for SUMModel\n",
-    "yaml_file = '../../reco_utils/recommender/deeprec/config/sli_rec.yaml'  "
+    "yaml_file = '../../reco_utils/models/deeprec/config/sli_rec.yaml'  "
    ]
   },
   {
diff --git a/examples/02_model_collaborative_filtering/lightgcn_deep_dive.ipynb b/examples/02_model_collaborative_filtering/lightgcn_deep_dive.ipynb
index e4f6ba2582..56aaa7c73b 100644
--- a/examples/02_model_collaborative_filtering/lightgcn_deep_dive.ipynb
+++ b/examples/02_model_collaborative_filtering/lightgcn_deep_dive.ipynb
@@ -88,7 +88,7 @@
     "\n",
     "SEED = DEFAULT_SEED  # Set None for non-deterministic results\n",
     "\n",
-    "yaml_file = \"../../reco_utils/recommender/deeprec/config/lightgcn.yaml\"\n",
+    "yaml_file = \"../../reco_utils/models/deeprec/config/lightgcn.yaml\"\n",
     "user_file = \"../../tests/resources/deeprec/lightgcn/user_embeddings.csv\"\n",
     "item_file = \"../../tests/resources/deeprec/lightgcn/item_embeddings.csv\""
    ]
diff --git a/examples/02_model_collaborative_filtering/sar_deep_dive.ipynb b/examples/02_model_collaborative_filtering/sar_deep_dive.ipynb
index 737c45aafc..878d2c8348 100644
--- a/examples/02_model_collaborative_filtering/sar_deep_dive.ipynb
+++ b/examples/02_model_collaborative_filtering/sar_deep_dive.ipynb
@@ -93,7 +93,7 @@
    "source": [
     "## 2 SAR single-node implementation\n",
     "\n",
-    "The SAR implementation illustrated in this notebook was developed in Python, primarily with Python packages like `numpy`, `pandas`, and `scipy` which are commonly used in most of the data analytics / machine learning tasks. Details of the implementation can be found in [Recommenders/reco_utils/recommender/sar/sar_singlenode.py](../../reco_utils/recommender/sar/sar_singlenode.py)."
+    "The SAR implementation illustrated in this notebook was developed in Python, primarily with Python packages like `numpy`, `pandas`, and `scipy` which are commonly used in most of the data analytics / machine learning tasks. Details of the implementation can be found in [Recommenders/reco_utils/models/sar/sar_singlenode.py](../../reco_utils/models/sar/sar_singlenode.py)."
    ]
   },
   {
diff --git a/examples/02_model_hybrid/fm_deep_dive.ipynb b/examples/02_model_hybrid/fm_deep_dive.ipynb
index c5c366ecef..be834f9701 100644
--- a/examples/02_model_hybrid/fm_deep_dive.ipynb
+++ b/examples/02_model_hybrid/fm_deep_dive.ipynb
@@ -145,11 +145,11 @@
     "|Algorithm|Notes|References|Example in Microsoft/Recommenders|\n",
     "|---------|-----|----------|---------------------------------|\n",
     "|DeepFM|Combination of FM and DNN where DNN handles high-order interactions|[\\[3\\]](https://arxiv.org/abs/1703.04247)|-|\n",
-    "|xDeepFM|Combination of FM, DNN, and Compressed Interaction Network, for vectorized feature interactions|[\\[4\\]](https://dl.acm.org/citation.cfm?id=3220023)|[notebook](../00_quick_start/xdeepfm_criteo.ipynb) / [utilities](../../reco_utils/recommender/deeprec/models/xDeepFM.py)|\n",
+    "|xDeepFM|Combination of FM, DNN, and Compressed Interaction Network, for vectorized feature interactions|[\\[4\\]](https://dl.acm.org/citation.cfm?id=3220023)|[notebook](../00_quick_start/xdeepfm_criteo.ipynb) / [utilities](../../reco_utils/models/deeprec/models/xDeepFM.py)|\n",
     "|Factorization Machine Supported Neural Network|Use FM user/item weight vectors as input layers for DNN model|[\\[5\\]](https://link.springer.com/chapter/10.1007/978-3-319-30671-1_4)|-|\n",
     "|Product-based Neural Network|An additional product-wise layer between embedding layer and fully connected layer to improve expressiveness of interactions of features across fields|[\\[6\\]](https://ieeexplore.ieee.org/abstract/document/7837964)|-|\n",
     "|Neural Factorization Machines|Improve the factorization part of FM by using stacks of NN layers to improve non-linear expressiveness|[\\[7\\]](https://dl.acm.org/citation.cfm?id=3080777)|-|\n",
-    "|Wide and deep|Combination of linear model (wide part) and deep neural network model (deep part) for memorisation and generalization|[\\[8\\]](https://dl.acm.org/citation.cfm?id=2988454)|[notebook](../00_quick_start/wide_deep_movielens.ipynb) / [utilities](../../reco_utils/recommender/wide_deep)|"
+    "|Wide and deep|Combination of linear model (wide part) and deep neural network model (deep part) for memorisation and generalization|[\\[8\\]](https://dl.acm.org/citation.cfm?id=2988454)|[notebook](../00_quick_start/wide_deep_movielens.ipynb) / [utilities](../../reco_utils/models/wide_deep)|"
    ]
   },
   {
@@ -182,8 +182,8 @@
     "|[libfm](https://github.com/srendle/libfm)|C++|Implementation of FM algorithm|-|\n",
     "|[libffm](https://github.com/ycjuan/libffm)|C++|Original implemenation of FFM algorithm. It is handy in model building, but does not support Python interface|-|\n",
     "|[xlearn](https://github.com/aksnzhy/xlearn)|C++ with Python interface|More computationally efficient compared to libffm without loss of modeling effectiveness|[notebook](fm_deep_dive.ipynb)|\n",
-    "|[Vowpal Wabbit FM](https://github.com/VowpalWabbit/vowpal_wabbit/wiki/Matrix-factorization-example)|Online library with estimator API|Easy to use by calling API|[notebook](../02_model_content_based_filtering/vowpal_wabbit_deep_dive.ipynb) / [utilities](../../reco_utils/recommender/vowpal_wabbit)\n",
-    "|[microsoft/recommenders xDeepFM](../../reco_utils/recommender/deeprec/models/xDeepFM.py)|Python|Support flexible interface with different configurations of FM and FM extensions, i.e., LR, FM, and/or CIN|[notebook](../00_quick_start/xdeepfm_criteo.ipynb) / [utilities](../../reco_utils/recommender/deeprec/models/xDeepFM.py)|"
+    "|[Vowpal Wabbit FM](https://github.com/VowpalWabbit/vowpal_wabbit/wiki/Matrix-factorization-example)|Online library with estimator API|Easy to use by calling API|[notebook](../02_model_content_based_filtering/vowpal_wabbit_deep_dive.ipynb) / [utilities](../../reco_utils/models/vowpal_wabbit)\n",
+    "|[microsoft/recommenders xDeepFM](../../reco_utils/models/deeprec/models/xDeepFM.py)|Python|Support flexible interface with different configurations of FM and FM extensions, i.e., LR, FM, and/or CIN|[notebook](../00_quick_start/xdeepfm_criteo.ipynb) / [utilities](../../reco_utils/models/deeprec/models/xDeepFM.py)|"
    ]
   },
   {
diff --git a/examples/02_model_hybrid/ncf_deep_dive.ipynb b/examples/02_model_hybrid/ncf_deep_dive.ipynb
index 4f920ab605..bf0386254d 100644
--- a/examples/02_model_hybrid/ncf_deep_dive.ipynb
+++ b/examples/02_model_hybrid/ncf_deep_dive.ipynb
@@ -183,7 +183,7 @@
     "\n",
     "We convert MovieLens into implicit feedback, and evaluate under our *leave-one-out* evaluation protocol.\n",
     "\n",
-    "You can check the details of implementation in `reco_utils/recommender/ncf`\n"
+    "You can check the details of implementation in `reco_utils/models/ncf`\n"
    ]
   },
   {
diff --git a/reco_utils/recommender/rlrmc/RLRMCdataset.py b/reco_utils/recommender/rlrmc/RLRMCdataset.py
index 4dcdb9326d..1b2f501de4 100644
--- a/reco_utils/recommender/rlrmc/RLRMCdataset.py
+++ b/reco_utils/recommender/rlrmc/RLRMCdataset.py
@@ -66,7 +66,7 @@ def _data_processing(self, train, validation=None, test=None, mean_center=True):
             list: train and validation pandas.DataFrame Dataset, which have been reindexed.
 
         """
-        # Data processing and reindexing code is adopted from https://github.com/Microsoft/Recommenders/blob/main/reco_utils/recommender/ncf/dataset.py
+        # Data processing and reindexing code is adopted from https://github.com/Microsoft/Recommenders/blob/main/reco_utils/models/ncf/dataset.py
         # If validation dataset is None
         df = train if validation is None else train.append(validation)
         df = df if test is None else df.append(test)
diff --git a/tests/integration/examples/test_notebooks_gpu.py b/tests/integration/examples/test_notebooks_gpu.py
index c663eb98be..a42ccbfe73 100644
--- a/tests/integration/examples/test_notebooks_gpu.py
+++ b/tests/integration/examples/test_notebooks_gpu.py
@@ -260,7 +260,7 @@ def test_wide_deep_integration(
     "yaml_file, data_path, epochs, batch_size, expected_values, seed",
     [
         (
-            "reco_utils/recommender/deeprec/config/sli_rec.yaml",
+            "reco_utils/models/deeprec/config/sli_rec.yaml",
             os.path.join("tests", "resources", "deeprec", "slirec"),
             10,
             400,
@@ -503,7 +503,7 @@ def test_npa_quickstart_integration(
     "yaml_file, data_path, size, epochs, batch_size, expected_values, seed",
     [
         (
-            "reco_utils/recommender/deeprec/config/lightgcn.yaml",
+            "reco_utils/models/deeprec/config/lightgcn.yaml",
             os.path.join("tests", "resources", "deeprec", "lightgcn"),
             "100k",
             5,

From 39d9bde3f2f283b4efae61b87859d09e300262f8 Mon Sep 17 00:00:00 2001
From: miguelgfierro <miguelgfierro@users.noreply.github.com>
Date: Thu, 15 Jul 2021 16:58:08 +0000
Subject: [PATCH 08/17] :bug:

---
 tests/conftest.py | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/tests/conftest.py b/tests/conftest.py
index 2a2fa64db0..0de870188f 100644
--- a/tests/conftest.py
+++ b/tests/conftest.py
@@ -456,5 +456,5 @@ def deeprec_config_path():
         Path(__file__)
         .absolute()
         .parents[1]
-        .joinpath("reco_utils", "recommender", "deeprec", "config")
+        .joinpath("reco_utils", "models", "deeprec", "config")
     )

From ea3f1fdf0f7bb702713649c9395a3be858954692 Mon Sep 17 00:00:00 2001
From: miguelgfierro <miguelgfierro@users.noreply.github.com>
Date: Thu, 15 Jul 2021 20:46:40 +0000
Subject: [PATCH 09/17] folders :boom::boom::boom:

---
 reco_utils/{common => datasets}/__init__.py                       | 0
 reco_utils/{dataset => datasets}/amazon_reviews.py                | 0
 reco_utils/{dataset => datasets}/cosmos_cli.py                    | 0
 reco_utils/{dataset => datasets}/covid_utils.py                   | 0
 reco_utils/{dataset => datasets}/criteo.py                        | 0
 reco_utils/{dataset => datasets}/download_utils.py                | 0
 reco_utils/{dataset => datasets}/mind.py                          | 0
 reco_utils/{dataset => datasets}/movielens.py                     | 0
 reco_utils/{dataset => datasets}/pandas_df_utils.py               | 0
 reco_utils/{dataset => datasets}/python_splitters.py              | 0
 reco_utils/{dataset => datasets}/spark_splitters.py               | 0
 reco_utils/{dataset => datasets}/sparse.py                        | 0
 reco_utils/{dataset => datasets}/split_utils.py                   | 0
 reco_utils/{dataset => datasets}/wikidata.py                      | 0
 reco_utils/{dataset => models}/__init__.py                        | 0
 reco_utils/{recommender => models/cornac}/__init__.py             | 0
 reco_utils/{recommender => models}/cornac/cornac_utils.py         | 0
 .../{recommender => models}/deeprec/DataModel/ImplicitCF.py       | 0
 .../{recommender/cornac => models/deeprec/DataModel}/__init__.py  | 0
 .../{recommender/deeprec/DataModel => models/deeprec}/__init__.py | 0
 reco_utils/{recommender => models}/deeprec/config/asvd.yaml       | 0
 reco_utils/{recommender => models}/deeprec/config/caser.yaml      | 0
 reco_utils/{recommender => models}/deeprec/config/gru4rec.yaml    | 0
 reco_utils/{recommender => models}/deeprec/config/lightgcn.yaml   | 0
 reco_utils/{recommender => models}/deeprec/config/nextitnet.yaml  | 0
 reco_utils/{recommender => models}/deeprec/config/sli_rec.yaml    | 0
 reco_utils/{recommender => models}/deeprec/config/sum.yaml        | 0
 reco_utils/{recommender => models}/deeprec/deeprec_utils.py       | 0
 reco_utils/{recommender/deeprec => models/deeprec/io}/__init__.py | 0
 .../{recommender => models}/deeprec/io/dkn_item2item_iterator.py  | 0
 reco_utils/{recommender => models}/deeprec/io/dkn_iterator.py     | 0
 reco_utils/{recommender => models}/deeprec/io/iterator.py         | 0
 .../{recommender => models}/deeprec/io/nextitnet_iterator.py      | 0
 .../{recommender => models}/deeprec/io/sequential_iterator.py     | 0
 .../{recommender/deeprec/io => models/deeprec/models}/__init__.py | 0
 reco_utils/{recommender => models}/deeprec/models/base_model.py   | 0
 reco_utils/{recommender => models}/deeprec/models/dkn.py          | 0
 .../{recommender => models}/deeprec/models/dkn_item2item.py       | 0
 .../deeprec/models => models/deeprec/models/graphrec}/__init__.py | 0
 .../{recommender => models}/deeprec/models/graphrec/lightgcn.py   | 0
 .../graphrec => models/deeprec/models/sequential}/__init__.py     | 0
 .../{recommender => models}/deeprec/models/sequential/asvd.py     | 0
 .../{recommender => models}/deeprec/models/sequential/caser.py    | 0
 .../{recommender => models}/deeprec/models/sequential/gru4rec.py  | 0
 .../deeprec/models/sequential/nextitnet.py                        | 0
 .../deeprec/models/sequential/rnn_cell_implement.py               | 0
 .../deeprec/models/sequential/sequential_base_model.py            | 0
 .../{recommender => models}/deeprec/models/sequential/sli_rec.py  | 0
 .../{recommender => models}/deeprec/models/sequential/sum.py      | 0
 .../deeprec/models/sequential/sum_cells.py                        | 0
 reco_utils/{recommender => models}/deeprec/models/xDeepFM.py      | 0
 .../deeprec/models/sequential => models/fastai}/__init__.py       | 0
 reco_utils/{recommender => models}/fastai/fastai_utils.py         | 0
 reco_utils/{recommender/fastai => models/geoimc}/__init__.py      | 0
 reco_utils/{recommender => models}/geoimc/geoimc_algorithm.py     | 0
 reco_utils/{recommender => models}/geoimc/geoimc_data.py          | 0
 reco_utils/{recommender => models}/geoimc/geoimc_predict.py       | 0
 reco_utils/{recommender => models}/geoimc/geoimc_utils.py         | 0
 reco_utils/{recommender/geoimc => models/lightfm}/__init__.py     | 0
 reco_utils/{recommender => models}/lightfm/lightfm_utils.py       | 0
 reco_utils/{recommender/lightfm => models/lightgbm}/__init__.py   | 0
 reco_utils/{recommender => models}/lightgbm/lightgbm_utils.py     | 0
 reco_utils/{recommender => models}/ncf/__init__.py                | 0
 reco_utils/{recommender => models}/ncf/dataset.py                 | 0
 reco_utils/{recommender => models}/ncf/ncf_singlenode.py          | 0
 reco_utils/{recommender/lightgbm => models/newsrec}/__init__.py   | 0
 reco_utils/{recommender/newsrec => models/newsrec/io}/__init__.py | 0
 .../{recommender => models}/newsrec/io/mind_all_iterator.py       | 0
 reco_utils/{recommender => models}/newsrec/io/mind_iterator.py    | 0
 .../{recommender/newsrec/io => models/newsrec/models}/__init__.py | 0
 reco_utils/{recommender => models}/newsrec/models/base_model.py   | 0
 reco_utils/{recommender => models}/newsrec/models/layers.py       | 0
 reco_utils/{recommender => models}/newsrec/models/lstur.py        | 0
 reco_utils/{recommender => models}/newsrec/models/naml.py         | 0
 reco_utils/{recommender => models}/newsrec/models/npa.py          | 0
 reco_utils/{recommender => models}/newsrec/models/nrms.py         | 0
 reco_utils/{recommender => models}/newsrec/newsrec_utils.py       | 0
 reco_utils/{recommender/newsrec/models => models/rbm}/__init__.py | 0
 reco_utils/{recommender => models}/rbm/rbm.py                     | 0
 reco_utils/{recommender => models}/rlrmc/RLRMCalgorithm.py        | 0
 reco_utils/{recommender => models}/rlrmc/RLRMCdataset.py          | 0
 reco_utils/{recommender => models}/rlrmc/__init__.py              | 0
 reco_utils/{recommender => models}/rlrmc/conjugate_gradient_ms.py | 0
 reco_utils/{recommender => models}/sar/__init__.py                | 0
 reco_utils/{recommender => models}/sar/sar_singlenode.py          | 0
 reco_utils/{recommender/rbm => models/surprise}/__init__.py       | 0
 reco_utils/{recommender => models}/surprise/surprise_utils.py     | 0
 reco_utils/{recommender/surprise => models/tfidf}/__init__.py     | 0
 reco_utils/{recommender => models}/tfidf/tfidf_utils.py           | 0
 reco_utils/{recommender/tfidf => models/vae}/__init__.py          | 0
 reco_utils/{recommender => models}/vae/multinomial_vae.py         | 0
 reco_utils/{recommender => models}/vae/standard_vae.py            | 0
 reco_utils/{recommender => models}/vowpal_wabbit/__init__.py      | 0
 reco_utils/{recommender => models}/vowpal_wabbit/vw.py            | 0
 reco_utils/{recommender/vae => models/wide_deep}/__init__.py      | 0
 reco_utils/{recommender => models}/wide_deep/wide_deep_utils.py   | 0
 reco_utils/{recommender/wide_deep => utils}/__init__.py           | 0
 reco_utils/{common => utils}/constants.py                         | 0
 reco_utils/{common => utils}/general_utils.py                     | 0
 reco_utils/{common => utils}/gpu_utils.py                         | 0
 reco_utils/{common => utils}/k8s_utils.py                         | 0
 reco_utils/{common => utils}/notebook_memory_management.py        | 0
 reco_utils/{common => utils}/notebook_utils.py                    | 0
 reco_utils/{common => utils}/plot.py                              | 0
 reco_utils/{common => utils}/python_utils.py                      | 0
 reco_utils/{common => utils}/spark_utils.py                       | 0
 reco_utils/{common => utils}/tf_utils.py                          | 0
 reco_utils/{common => utils}/timer.py                             | 0
 108 files changed, 0 insertions(+), 0 deletions(-)
 rename reco_utils/{common => datasets}/__init__.py (100%)
 rename reco_utils/{dataset => datasets}/amazon_reviews.py (100%)
 rename reco_utils/{dataset => datasets}/cosmos_cli.py (100%)
 rename reco_utils/{dataset => datasets}/covid_utils.py (100%)
 rename reco_utils/{dataset => datasets}/criteo.py (100%)
 rename reco_utils/{dataset => datasets}/download_utils.py (100%)
 rename reco_utils/{dataset => datasets}/mind.py (100%)
 rename reco_utils/{dataset => datasets}/movielens.py (100%)
 rename reco_utils/{dataset => datasets}/pandas_df_utils.py (100%)
 rename reco_utils/{dataset => datasets}/python_splitters.py (100%)
 rename reco_utils/{dataset => datasets}/spark_splitters.py (100%)
 rename reco_utils/{dataset => datasets}/sparse.py (100%)
 rename reco_utils/{dataset => datasets}/split_utils.py (100%)
 rename reco_utils/{dataset => datasets}/wikidata.py (100%)
 rename reco_utils/{dataset => models}/__init__.py (100%)
 rename reco_utils/{recommender => models/cornac}/__init__.py (100%)
 rename reco_utils/{recommender => models}/cornac/cornac_utils.py (100%)
 rename reco_utils/{recommender => models}/deeprec/DataModel/ImplicitCF.py (100%)
 rename reco_utils/{recommender/cornac => models/deeprec/DataModel}/__init__.py (100%)
 rename reco_utils/{recommender/deeprec/DataModel => models/deeprec}/__init__.py (100%)
 rename reco_utils/{recommender => models}/deeprec/config/asvd.yaml (100%)
 rename reco_utils/{recommender => models}/deeprec/config/caser.yaml (100%)
 rename reco_utils/{recommender => models}/deeprec/config/gru4rec.yaml (100%)
 rename reco_utils/{recommender => models}/deeprec/config/lightgcn.yaml (100%)
 rename reco_utils/{recommender => models}/deeprec/config/nextitnet.yaml (100%)
 rename reco_utils/{recommender => models}/deeprec/config/sli_rec.yaml (100%)
 rename reco_utils/{recommender => models}/deeprec/config/sum.yaml (100%)
 rename reco_utils/{recommender => models}/deeprec/deeprec_utils.py (100%)
 rename reco_utils/{recommender/deeprec => models/deeprec/io}/__init__.py (100%)
 rename reco_utils/{recommender => models}/deeprec/io/dkn_item2item_iterator.py (100%)
 rename reco_utils/{recommender => models}/deeprec/io/dkn_iterator.py (100%)
 rename reco_utils/{recommender => models}/deeprec/io/iterator.py (100%)
 rename reco_utils/{recommender => models}/deeprec/io/nextitnet_iterator.py (100%)
 rename reco_utils/{recommender => models}/deeprec/io/sequential_iterator.py (100%)
 rename reco_utils/{recommender/deeprec/io => models/deeprec/models}/__init__.py (100%)
 rename reco_utils/{recommender => models}/deeprec/models/base_model.py (100%)
 rename reco_utils/{recommender => models}/deeprec/models/dkn.py (100%)
 rename reco_utils/{recommender => models}/deeprec/models/dkn_item2item.py (100%)
 rename reco_utils/{recommender/deeprec/models => models/deeprec/models/graphrec}/__init__.py (100%)
 rename reco_utils/{recommender => models}/deeprec/models/graphrec/lightgcn.py (100%)
 rename reco_utils/{recommender/deeprec/models/graphrec => models/deeprec/models/sequential}/__init__.py (100%)
 rename reco_utils/{recommender => models}/deeprec/models/sequential/asvd.py (100%)
 rename reco_utils/{recommender => models}/deeprec/models/sequential/caser.py (100%)
 rename reco_utils/{recommender => models}/deeprec/models/sequential/gru4rec.py (100%)
 rename reco_utils/{recommender => models}/deeprec/models/sequential/nextitnet.py (100%)
 rename reco_utils/{recommender => models}/deeprec/models/sequential/rnn_cell_implement.py (100%)
 rename reco_utils/{recommender => models}/deeprec/models/sequential/sequential_base_model.py (100%)
 rename reco_utils/{recommender => models}/deeprec/models/sequential/sli_rec.py (100%)
 rename reco_utils/{recommender => models}/deeprec/models/sequential/sum.py (100%)
 rename reco_utils/{recommender => models}/deeprec/models/sequential/sum_cells.py (100%)
 rename reco_utils/{recommender => models}/deeprec/models/xDeepFM.py (100%)
 rename reco_utils/{recommender/deeprec/models/sequential => models/fastai}/__init__.py (100%)
 rename reco_utils/{recommender => models}/fastai/fastai_utils.py (100%)
 rename reco_utils/{recommender/fastai => models/geoimc}/__init__.py (100%)
 rename reco_utils/{recommender => models}/geoimc/geoimc_algorithm.py (100%)
 rename reco_utils/{recommender => models}/geoimc/geoimc_data.py (100%)
 rename reco_utils/{recommender => models}/geoimc/geoimc_predict.py (100%)
 rename reco_utils/{recommender => models}/geoimc/geoimc_utils.py (100%)
 rename reco_utils/{recommender/geoimc => models/lightfm}/__init__.py (100%)
 rename reco_utils/{recommender => models}/lightfm/lightfm_utils.py (100%)
 rename reco_utils/{recommender/lightfm => models/lightgbm}/__init__.py (100%)
 rename reco_utils/{recommender => models}/lightgbm/lightgbm_utils.py (100%)
 rename reco_utils/{recommender => models}/ncf/__init__.py (100%)
 rename reco_utils/{recommender => models}/ncf/dataset.py (100%)
 rename reco_utils/{recommender => models}/ncf/ncf_singlenode.py (100%)
 rename reco_utils/{recommender/lightgbm => models/newsrec}/__init__.py (100%)
 rename reco_utils/{recommender/newsrec => models/newsrec/io}/__init__.py (100%)
 rename reco_utils/{recommender => models}/newsrec/io/mind_all_iterator.py (100%)
 rename reco_utils/{recommender => models}/newsrec/io/mind_iterator.py (100%)
 rename reco_utils/{recommender/newsrec/io => models/newsrec/models}/__init__.py (100%)
 rename reco_utils/{recommender => models}/newsrec/models/base_model.py (100%)
 rename reco_utils/{recommender => models}/newsrec/models/layers.py (100%)
 rename reco_utils/{recommender => models}/newsrec/models/lstur.py (100%)
 rename reco_utils/{recommender => models}/newsrec/models/naml.py (100%)
 rename reco_utils/{recommender => models}/newsrec/models/npa.py (100%)
 rename reco_utils/{recommender => models}/newsrec/models/nrms.py (100%)
 rename reco_utils/{recommender => models}/newsrec/newsrec_utils.py (100%)
 rename reco_utils/{recommender/newsrec/models => models/rbm}/__init__.py (100%)
 rename reco_utils/{recommender => models}/rbm/rbm.py (100%)
 rename reco_utils/{recommender => models}/rlrmc/RLRMCalgorithm.py (100%)
 rename reco_utils/{recommender => models}/rlrmc/RLRMCdataset.py (100%)
 rename reco_utils/{recommender => models}/rlrmc/__init__.py (100%)
 rename reco_utils/{recommender => models}/rlrmc/conjugate_gradient_ms.py (100%)
 rename reco_utils/{recommender => models}/sar/__init__.py (100%)
 rename reco_utils/{recommender => models}/sar/sar_singlenode.py (100%)
 rename reco_utils/{recommender/rbm => models/surprise}/__init__.py (100%)
 rename reco_utils/{recommender => models}/surprise/surprise_utils.py (100%)
 rename reco_utils/{recommender/surprise => models/tfidf}/__init__.py (100%)
 rename reco_utils/{recommender => models}/tfidf/tfidf_utils.py (100%)
 rename reco_utils/{recommender/tfidf => models/vae}/__init__.py (100%)
 rename reco_utils/{recommender => models}/vae/multinomial_vae.py (100%)
 rename reco_utils/{recommender => models}/vae/standard_vae.py (100%)
 rename reco_utils/{recommender => models}/vowpal_wabbit/__init__.py (100%)
 rename reco_utils/{recommender => models}/vowpal_wabbit/vw.py (100%)
 rename reco_utils/{recommender/vae => models/wide_deep}/__init__.py (100%)
 rename reco_utils/{recommender => models}/wide_deep/wide_deep_utils.py (100%)
 rename reco_utils/{recommender/wide_deep => utils}/__init__.py (100%)
 rename reco_utils/{common => utils}/constants.py (100%)
 rename reco_utils/{common => utils}/general_utils.py (100%)
 rename reco_utils/{common => utils}/gpu_utils.py (100%)
 rename reco_utils/{common => utils}/k8s_utils.py (100%)
 rename reco_utils/{common => utils}/notebook_memory_management.py (100%)
 rename reco_utils/{common => utils}/notebook_utils.py (100%)
 rename reco_utils/{common => utils}/plot.py (100%)
 rename reco_utils/{common => utils}/python_utils.py (100%)
 rename reco_utils/{common => utils}/spark_utils.py (100%)
 rename reco_utils/{common => utils}/tf_utils.py (100%)
 rename reco_utils/{common => utils}/timer.py (100%)

diff --git a/reco_utils/common/__init__.py b/reco_utils/datasets/__init__.py
similarity index 100%
rename from reco_utils/common/__init__.py
rename to reco_utils/datasets/__init__.py
diff --git a/reco_utils/dataset/amazon_reviews.py b/reco_utils/datasets/amazon_reviews.py
similarity index 100%
rename from reco_utils/dataset/amazon_reviews.py
rename to reco_utils/datasets/amazon_reviews.py
diff --git a/reco_utils/dataset/cosmos_cli.py b/reco_utils/datasets/cosmos_cli.py
similarity index 100%
rename from reco_utils/dataset/cosmos_cli.py
rename to reco_utils/datasets/cosmos_cli.py
diff --git a/reco_utils/dataset/covid_utils.py b/reco_utils/datasets/covid_utils.py
similarity index 100%
rename from reco_utils/dataset/covid_utils.py
rename to reco_utils/datasets/covid_utils.py
diff --git a/reco_utils/dataset/criteo.py b/reco_utils/datasets/criteo.py
similarity index 100%
rename from reco_utils/dataset/criteo.py
rename to reco_utils/datasets/criteo.py
diff --git a/reco_utils/dataset/download_utils.py b/reco_utils/datasets/download_utils.py
similarity index 100%
rename from reco_utils/dataset/download_utils.py
rename to reco_utils/datasets/download_utils.py
diff --git a/reco_utils/dataset/mind.py b/reco_utils/datasets/mind.py
similarity index 100%
rename from reco_utils/dataset/mind.py
rename to reco_utils/datasets/mind.py
diff --git a/reco_utils/dataset/movielens.py b/reco_utils/datasets/movielens.py
similarity index 100%
rename from reco_utils/dataset/movielens.py
rename to reco_utils/datasets/movielens.py
diff --git a/reco_utils/dataset/pandas_df_utils.py b/reco_utils/datasets/pandas_df_utils.py
similarity index 100%
rename from reco_utils/dataset/pandas_df_utils.py
rename to reco_utils/datasets/pandas_df_utils.py
diff --git a/reco_utils/dataset/python_splitters.py b/reco_utils/datasets/python_splitters.py
similarity index 100%
rename from reco_utils/dataset/python_splitters.py
rename to reco_utils/datasets/python_splitters.py
diff --git a/reco_utils/dataset/spark_splitters.py b/reco_utils/datasets/spark_splitters.py
similarity index 100%
rename from reco_utils/dataset/spark_splitters.py
rename to reco_utils/datasets/spark_splitters.py
diff --git a/reco_utils/dataset/sparse.py b/reco_utils/datasets/sparse.py
similarity index 100%
rename from reco_utils/dataset/sparse.py
rename to reco_utils/datasets/sparse.py
diff --git a/reco_utils/dataset/split_utils.py b/reco_utils/datasets/split_utils.py
similarity index 100%
rename from reco_utils/dataset/split_utils.py
rename to reco_utils/datasets/split_utils.py
diff --git a/reco_utils/dataset/wikidata.py b/reco_utils/datasets/wikidata.py
similarity index 100%
rename from reco_utils/dataset/wikidata.py
rename to reco_utils/datasets/wikidata.py
diff --git a/reco_utils/dataset/__init__.py b/reco_utils/models/__init__.py
similarity index 100%
rename from reco_utils/dataset/__init__.py
rename to reco_utils/models/__init__.py
diff --git a/reco_utils/recommender/__init__.py b/reco_utils/models/cornac/__init__.py
similarity index 100%
rename from reco_utils/recommender/__init__.py
rename to reco_utils/models/cornac/__init__.py
diff --git a/reco_utils/recommender/cornac/cornac_utils.py b/reco_utils/models/cornac/cornac_utils.py
similarity index 100%
rename from reco_utils/recommender/cornac/cornac_utils.py
rename to reco_utils/models/cornac/cornac_utils.py
diff --git a/reco_utils/recommender/deeprec/DataModel/ImplicitCF.py b/reco_utils/models/deeprec/DataModel/ImplicitCF.py
similarity index 100%
rename from reco_utils/recommender/deeprec/DataModel/ImplicitCF.py
rename to reco_utils/models/deeprec/DataModel/ImplicitCF.py
diff --git a/reco_utils/recommender/cornac/__init__.py b/reco_utils/models/deeprec/DataModel/__init__.py
similarity index 100%
rename from reco_utils/recommender/cornac/__init__.py
rename to reco_utils/models/deeprec/DataModel/__init__.py
diff --git a/reco_utils/recommender/deeprec/DataModel/__init__.py b/reco_utils/models/deeprec/__init__.py
similarity index 100%
rename from reco_utils/recommender/deeprec/DataModel/__init__.py
rename to reco_utils/models/deeprec/__init__.py
diff --git a/reco_utils/recommender/deeprec/config/asvd.yaml b/reco_utils/models/deeprec/config/asvd.yaml
similarity index 100%
rename from reco_utils/recommender/deeprec/config/asvd.yaml
rename to reco_utils/models/deeprec/config/asvd.yaml
diff --git a/reco_utils/recommender/deeprec/config/caser.yaml b/reco_utils/models/deeprec/config/caser.yaml
similarity index 100%
rename from reco_utils/recommender/deeprec/config/caser.yaml
rename to reco_utils/models/deeprec/config/caser.yaml
diff --git a/reco_utils/recommender/deeprec/config/gru4rec.yaml b/reco_utils/models/deeprec/config/gru4rec.yaml
similarity index 100%
rename from reco_utils/recommender/deeprec/config/gru4rec.yaml
rename to reco_utils/models/deeprec/config/gru4rec.yaml
diff --git a/reco_utils/recommender/deeprec/config/lightgcn.yaml b/reco_utils/models/deeprec/config/lightgcn.yaml
similarity index 100%
rename from reco_utils/recommender/deeprec/config/lightgcn.yaml
rename to reco_utils/models/deeprec/config/lightgcn.yaml
diff --git a/reco_utils/recommender/deeprec/config/nextitnet.yaml b/reco_utils/models/deeprec/config/nextitnet.yaml
similarity index 100%
rename from reco_utils/recommender/deeprec/config/nextitnet.yaml
rename to reco_utils/models/deeprec/config/nextitnet.yaml
diff --git a/reco_utils/recommender/deeprec/config/sli_rec.yaml b/reco_utils/models/deeprec/config/sli_rec.yaml
similarity index 100%
rename from reco_utils/recommender/deeprec/config/sli_rec.yaml
rename to reco_utils/models/deeprec/config/sli_rec.yaml
diff --git a/reco_utils/recommender/deeprec/config/sum.yaml b/reco_utils/models/deeprec/config/sum.yaml
similarity index 100%
rename from reco_utils/recommender/deeprec/config/sum.yaml
rename to reco_utils/models/deeprec/config/sum.yaml
diff --git a/reco_utils/recommender/deeprec/deeprec_utils.py b/reco_utils/models/deeprec/deeprec_utils.py
similarity index 100%
rename from reco_utils/recommender/deeprec/deeprec_utils.py
rename to reco_utils/models/deeprec/deeprec_utils.py
diff --git a/reco_utils/recommender/deeprec/__init__.py b/reco_utils/models/deeprec/io/__init__.py
similarity index 100%
rename from reco_utils/recommender/deeprec/__init__.py
rename to reco_utils/models/deeprec/io/__init__.py
diff --git a/reco_utils/recommender/deeprec/io/dkn_item2item_iterator.py b/reco_utils/models/deeprec/io/dkn_item2item_iterator.py
similarity index 100%
rename from reco_utils/recommender/deeprec/io/dkn_item2item_iterator.py
rename to reco_utils/models/deeprec/io/dkn_item2item_iterator.py
diff --git a/reco_utils/recommender/deeprec/io/dkn_iterator.py b/reco_utils/models/deeprec/io/dkn_iterator.py
similarity index 100%
rename from reco_utils/recommender/deeprec/io/dkn_iterator.py
rename to reco_utils/models/deeprec/io/dkn_iterator.py
diff --git a/reco_utils/recommender/deeprec/io/iterator.py b/reco_utils/models/deeprec/io/iterator.py
similarity index 100%
rename from reco_utils/recommender/deeprec/io/iterator.py
rename to reco_utils/models/deeprec/io/iterator.py
diff --git a/reco_utils/recommender/deeprec/io/nextitnet_iterator.py b/reco_utils/models/deeprec/io/nextitnet_iterator.py
similarity index 100%
rename from reco_utils/recommender/deeprec/io/nextitnet_iterator.py
rename to reco_utils/models/deeprec/io/nextitnet_iterator.py
diff --git a/reco_utils/recommender/deeprec/io/sequential_iterator.py b/reco_utils/models/deeprec/io/sequential_iterator.py
similarity index 100%
rename from reco_utils/recommender/deeprec/io/sequential_iterator.py
rename to reco_utils/models/deeprec/io/sequential_iterator.py
diff --git a/reco_utils/recommender/deeprec/io/__init__.py b/reco_utils/models/deeprec/models/__init__.py
similarity index 100%
rename from reco_utils/recommender/deeprec/io/__init__.py
rename to reco_utils/models/deeprec/models/__init__.py
diff --git a/reco_utils/recommender/deeprec/models/base_model.py b/reco_utils/models/deeprec/models/base_model.py
similarity index 100%
rename from reco_utils/recommender/deeprec/models/base_model.py
rename to reco_utils/models/deeprec/models/base_model.py
diff --git a/reco_utils/recommender/deeprec/models/dkn.py b/reco_utils/models/deeprec/models/dkn.py
similarity index 100%
rename from reco_utils/recommender/deeprec/models/dkn.py
rename to reco_utils/models/deeprec/models/dkn.py
diff --git a/reco_utils/recommender/deeprec/models/dkn_item2item.py b/reco_utils/models/deeprec/models/dkn_item2item.py
similarity index 100%
rename from reco_utils/recommender/deeprec/models/dkn_item2item.py
rename to reco_utils/models/deeprec/models/dkn_item2item.py
diff --git a/reco_utils/recommender/deeprec/models/__init__.py b/reco_utils/models/deeprec/models/graphrec/__init__.py
similarity index 100%
rename from reco_utils/recommender/deeprec/models/__init__.py
rename to reco_utils/models/deeprec/models/graphrec/__init__.py
diff --git a/reco_utils/recommender/deeprec/models/graphrec/lightgcn.py b/reco_utils/models/deeprec/models/graphrec/lightgcn.py
similarity index 100%
rename from reco_utils/recommender/deeprec/models/graphrec/lightgcn.py
rename to reco_utils/models/deeprec/models/graphrec/lightgcn.py
diff --git a/reco_utils/recommender/deeprec/models/graphrec/__init__.py b/reco_utils/models/deeprec/models/sequential/__init__.py
similarity index 100%
rename from reco_utils/recommender/deeprec/models/graphrec/__init__.py
rename to reco_utils/models/deeprec/models/sequential/__init__.py
diff --git a/reco_utils/recommender/deeprec/models/sequential/asvd.py b/reco_utils/models/deeprec/models/sequential/asvd.py
similarity index 100%
rename from reco_utils/recommender/deeprec/models/sequential/asvd.py
rename to reco_utils/models/deeprec/models/sequential/asvd.py
diff --git a/reco_utils/recommender/deeprec/models/sequential/caser.py b/reco_utils/models/deeprec/models/sequential/caser.py
similarity index 100%
rename from reco_utils/recommender/deeprec/models/sequential/caser.py
rename to reco_utils/models/deeprec/models/sequential/caser.py
diff --git a/reco_utils/recommender/deeprec/models/sequential/gru4rec.py b/reco_utils/models/deeprec/models/sequential/gru4rec.py
similarity index 100%
rename from reco_utils/recommender/deeprec/models/sequential/gru4rec.py
rename to reco_utils/models/deeprec/models/sequential/gru4rec.py
diff --git a/reco_utils/recommender/deeprec/models/sequential/nextitnet.py b/reco_utils/models/deeprec/models/sequential/nextitnet.py
similarity index 100%
rename from reco_utils/recommender/deeprec/models/sequential/nextitnet.py
rename to reco_utils/models/deeprec/models/sequential/nextitnet.py
diff --git a/reco_utils/recommender/deeprec/models/sequential/rnn_cell_implement.py b/reco_utils/models/deeprec/models/sequential/rnn_cell_implement.py
similarity index 100%
rename from reco_utils/recommender/deeprec/models/sequential/rnn_cell_implement.py
rename to reco_utils/models/deeprec/models/sequential/rnn_cell_implement.py
diff --git a/reco_utils/recommender/deeprec/models/sequential/sequential_base_model.py b/reco_utils/models/deeprec/models/sequential/sequential_base_model.py
similarity index 100%
rename from reco_utils/recommender/deeprec/models/sequential/sequential_base_model.py
rename to reco_utils/models/deeprec/models/sequential/sequential_base_model.py
diff --git a/reco_utils/recommender/deeprec/models/sequential/sli_rec.py b/reco_utils/models/deeprec/models/sequential/sli_rec.py
similarity index 100%
rename from reco_utils/recommender/deeprec/models/sequential/sli_rec.py
rename to reco_utils/models/deeprec/models/sequential/sli_rec.py
diff --git a/reco_utils/recommender/deeprec/models/sequential/sum.py b/reco_utils/models/deeprec/models/sequential/sum.py
similarity index 100%
rename from reco_utils/recommender/deeprec/models/sequential/sum.py
rename to reco_utils/models/deeprec/models/sequential/sum.py
diff --git a/reco_utils/recommender/deeprec/models/sequential/sum_cells.py b/reco_utils/models/deeprec/models/sequential/sum_cells.py
similarity index 100%
rename from reco_utils/recommender/deeprec/models/sequential/sum_cells.py
rename to reco_utils/models/deeprec/models/sequential/sum_cells.py
diff --git a/reco_utils/recommender/deeprec/models/xDeepFM.py b/reco_utils/models/deeprec/models/xDeepFM.py
similarity index 100%
rename from reco_utils/recommender/deeprec/models/xDeepFM.py
rename to reco_utils/models/deeprec/models/xDeepFM.py
diff --git a/reco_utils/recommender/deeprec/models/sequential/__init__.py b/reco_utils/models/fastai/__init__.py
similarity index 100%
rename from reco_utils/recommender/deeprec/models/sequential/__init__.py
rename to reco_utils/models/fastai/__init__.py
diff --git a/reco_utils/recommender/fastai/fastai_utils.py b/reco_utils/models/fastai/fastai_utils.py
similarity index 100%
rename from reco_utils/recommender/fastai/fastai_utils.py
rename to reco_utils/models/fastai/fastai_utils.py
diff --git a/reco_utils/recommender/fastai/__init__.py b/reco_utils/models/geoimc/__init__.py
similarity index 100%
rename from reco_utils/recommender/fastai/__init__.py
rename to reco_utils/models/geoimc/__init__.py
diff --git a/reco_utils/recommender/geoimc/geoimc_algorithm.py b/reco_utils/models/geoimc/geoimc_algorithm.py
similarity index 100%
rename from reco_utils/recommender/geoimc/geoimc_algorithm.py
rename to reco_utils/models/geoimc/geoimc_algorithm.py
diff --git a/reco_utils/recommender/geoimc/geoimc_data.py b/reco_utils/models/geoimc/geoimc_data.py
similarity index 100%
rename from reco_utils/recommender/geoimc/geoimc_data.py
rename to reco_utils/models/geoimc/geoimc_data.py
diff --git a/reco_utils/recommender/geoimc/geoimc_predict.py b/reco_utils/models/geoimc/geoimc_predict.py
similarity index 100%
rename from reco_utils/recommender/geoimc/geoimc_predict.py
rename to reco_utils/models/geoimc/geoimc_predict.py
diff --git a/reco_utils/recommender/geoimc/geoimc_utils.py b/reco_utils/models/geoimc/geoimc_utils.py
similarity index 100%
rename from reco_utils/recommender/geoimc/geoimc_utils.py
rename to reco_utils/models/geoimc/geoimc_utils.py
diff --git a/reco_utils/recommender/geoimc/__init__.py b/reco_utils/models/lightfm/__init__.py
similarity index 100%
rename from reco_utils/recommender/geoimc/__init__.py
rename to reco_utils/models/lightfm/__init__.py
diff --git a/reco_utils/recommender/lightfm/lightfm_utils.py b/reco_utils/models/lightfm/lightfm_utils.py
similarity index 100%
rename from reco_utils/recommender/lightfm/lightfm_utils.py
rename to reco_utils/models/lightfm/lightfm_utils.py
diff --git a/reco_utils/recommender/lightfm/__init__.py b/reco_utils/models/lightgbm/__init__.py
similarity index 100%
rename from reco_utils/recommender/lightfm/__init__.py
rename to reco_utils/models/lightgbm/__init__.py
diff --git a/reco_utils/recommender/lightgbm/lightgbm_utils.py b/reco_utils/models/lightgbm/lightgbm_utils.py
similarity index 100%
rename from reco_utils/recommender/lightgbm/lightgbm_utils.py
rename to reco_utils/models/lightgbm/lightgbm_utils.py
diff --git a/reco_utils/recommender/ncf/__init__.py b/reco_utils/models/ncf/__init__.py
similarity index 100%
rename from reco_utils/recommender/ncf/__init__.py
rename to reco_utils/models/ncf/__init__.py
diff --git a/reco_utils/recommender/ncf/dataset.py b/reco_utils/models/ncf/dataset.py
similarity index 100%
rename from reco_utils/recommender/ncf/dataset.py
rename to reco_utils/models/ncf/dataset.py
diff --git a/reco_utils/recommender/ncf/ncf_singlenode.py b/reco_utils/models/ncf/ncf_singlenode.py
similarity index 100%
rename from reco_utils/recommender/ncf/ncf_singlenode.py
rename to reco_utils/models/ncf/ncf_singlenode.py
diff --git a/reco_utils/recommender/lightgbm/__init__.py b/reco_utils/models/newsrec/__init__.py
similarity index 100%
rename from reco_utils/recommender/lightgbm/__init__.py
rename to reco_utils/models/newsrec/__init__.py
diff --git a/reco_utils/recommender/newsrec/__init__.py b/reco_utils/models/newsrec/io/__init__.py
similarity index 100%
rename from reco_utils/recommender/newsrec/__init__.py
rename to reco_utils/models/newsrec/io/__init__.py
diff --git a/reco_utils/recommender/newsrec/io/mind_all_iterator.py b/reco_utils/models/newsrec/io/mind_all_iterator.py
similarity index 100%
rename from reco_utils/recommender/newsrec/io/mind_all_iterator.py
rename to reco_utils/models/newsrec/io/mind_all_iterator.py
diff --git a/reco_utils/recommender/newsrec/io/mind_iterator.py b/reco_utils/models/newsrec/io/mind_iterator.py
similarity index 100%
rename from reco_utils/recommender/newsrec/io/mind_iterator.py
rename to reco_utils/models/newsrec/io/mind_iterator.py
diff --git a/reco_utils/recommender/newsrec/io/__init__.py b/reco_utils/models/newsrec/models/__init__.py
similarity index 100%
rename from reco_utils/recommender/newsrec/io/__init__.py
rename to reco_utils/models/newsrec/models/__init__.py
diff --git a/reco_utils/recommender/newsrec/models/base_model.py b/reco_utils/models/newsrec/models/base_model.py
similarity index 100%
rename from reco_utils/recommender/newsrec/models/base_model.py
rename to reco_utils/models/newsrec/models/base_model.py
diff --git a/reco_utils/recommender/newsrec/models/layers.py b/reco_utils/models/newsrec/models/layers.py
similarity index 100%
rename from reco_utils/recommender/newsrec/models/layers.py
rename to reco_utils/models/newsrec/models/layers.py
diff --git a/reco_utils/recommender/newsrec/models/lstur.py b/reco_utils/models/newsrec/models/lstur.py
similarity index 100%
rename from reco_utils/recommender/newsrec/models/lstur.py
rename to reco_utils/models/newsrec/models/lstur.py
diff --git a/reco_utils/recommender/newsrec/models/naml.py b/reco_utils/models/newsrec/models/naml.py
similarity index 100%
rename from reco_utils/recommender/newsrec/models/naml.py
rename to reco_utils/models/newsrec/models/naml.py
diff --git a/reco_utils/recommender/newsrec/models/npa.py b/reco_utils/models/newsrec/models/npa.py
similarity index 100%
rename from reco_utils/recommender/newsrec/models/npa.py
rename to reco_utils/models/newsrec/models/npa.py
diff --git a/reco_utils/recommender/newsrec/models/nrms.py b/reco_utils/models/newsrec/models/nrms.py
similarity index 100%
rename from reco_utils/recommender/newsrec/models/nrms.py
rename to reco_utils/models/newsrec/models/nrms.py
diff --git a/reco_utils/recommender/newsrec/newsrec_utils.py b/reco_utils/models/newsrec/newsrec_utils.py
similarity index 100%
rename from reco_utils/recommender/newsrec/newsrec_utils.py
rename to reco_utils/models/newsrec/newsrec_utils.py
diff --git a/reco_utils/recommender/newsrec/models/__init__.py b/reco_utils/models/rbm/__init__.py
similarity index 100%
rename from reco_utils/recommender/newsrec/models/__init__.py
rename to reco_utils/models/rbm/__init__.py
diff --git a/reco_utils/recommender/rbm/rbm.py b/reco_utils/models/rbm/rbm.py
similarity index 100%
rename from reco_utils/recommender/rbm/rbm.py
rename to reco_utils/models/rbm/rbm.py
diff --git a/reco_utils/recommender/rlrmc/RLRMCalgorithm.py b/reco_utils/models/rlrmc/RLRMCalgorithm.py
similarity index 100%
rename from reco_utils/recommender/rlrmc/RLRMCalgorithm.py
rename to reco_utils/models/rlrmc/RLRMCalgorithm.py
diff --git a/reco_utils/recommender/rlrmc/RLRMCdataset.py b/reco_utils/models/rlrmc/RLRMCdataset.py
similarity index 100%
rename from reco_utils/recommender/rlrmc/RLRMCdataset.py
rename to reco_utils/models/rlrmc/RLRMCdataset.py
diff --git a/reco_utils/recommender/rlrmc/__init__.py b/reco_utils/models/rlrmc/__init__.py
similarity index 100%
rename from reco_utils/recommender/rlrmc/__init__.py
rename to reco_utils/models/rlrmc/__init__.py
diff --git a/reco_utils/recommender/rlrmc/conjugate_gradient_ms.py b/reco_utils/models/rlrmc/conjugate_gradient_ms.py
similarity index 100%
rename from reco_utils/recommender/rlrmc/conjugate_gradient_ms.py
rename to reco_utils/models/rlrmc/conjugate_gradient_ms.py
diff --git a/reco_utils/recommender/sar/__init__.py b/reco_utils/models/sar/__init__.py
similarity index 100%
rename from reco_utils/recommender/sar/__init__.py
rename to reco_utils/models/sar/__init__.py
diff --git a/reco_utils/recommender/sar/sar_singlenode.py b/reco_utils/models/sar/sar_singlenode.py
similarity index 100%
rename from reco_utils/recommender/sar/sar_singlenode.py
rename to reco_utils/models/sar/sar_singlenode.py
diff --git a/reco_utils/recommender/rbm/__init__.py b/reco_utils/models/surprise/__init__.py
similarity index 100%
rename from reco_utils/recommender/rbm/__init__.py
rename to reco_utils/models/surprise/__init__.py
diff --git a/reco_utils/recommender/surprise/surprise_utils.py b/reco_utils/models/surprise/surprise_utils.py
similarity index 100%
rename from reco_utils/recommender/surprise/surprise_utils.py
rename to reco_utils/models/surprise/surprise_utils.py
diff --git a/reco_utils/recommender/surprise/__init__.py b/reco_utils/models/tfidf/__init__.py
similarity index 100%
rename from reco_utils/recommender/surprise/__init__.py
rename to reco_utils/models/tfidf/__init__.py
diff --git a/reco_utils/recommender/tfidf/tfidf_utils.py b/reco_utils/models/tfidf/tfidf_utils.py
similarity index 100%
rename from reco_utils/recommender/tfidf/tfidf_utils.py
rename to reco_utils/models/tfidf/tfidf_utils.py
diff --git a/reco_utils/recommender/tfidf/__init__.py b/reco_utils/models/vae/__init__.py
similarity index 100%
rename from reco_utils/recommender/tfidf/__init__.py
rename to reco_utils/models/vae/__init__.py
diff --git a/reco_utils/recommender/vae/multinomial_vae.py b/reco_utils/models/vae/multinomial_vae.py
similarity index 100%
rename from reco_utils/recommender/vae/multinomial_vae.py
rename to reco_utils/models/vae/multinomial_vae.py
diff --git a/reco_utils/recommender/vae/standard_vae.py b/reco_utils/models/vae/standard_vae.py
similarity index 100%
rename from reco_utils/recommender/vae/standard_vae.py
rename to reco_utils/models/vae/standard_vae.py
diff --git a/reco_utils/recommender/vowpal_wabbit/__init__.py b/reco_utils/models/vowpal_wabbit/__init__.py
similarity index 100%
rename from reco_utils/recommender/vowpal_wabbit/__init__.py
rename to reco_utils/models/vowpal_wabbit/__init__.py
diff --git a/reco_utils/recommender/vowpal_wabbit/vw.py b/reco_utils/models/vowpal_wabbit/vw.py
similarity index 100%
rename from reco_utils/recommender/vowpal_wabbit/vw.py
rename to reco_utils/models/vowpal_wabbit/vw.py
diff --git a/reco_utils/recommender/vae/__init__.py b/reco_utils/models/wide_deep/__init__.py
similarity index 100%
rename from reco_utils/recommender/vae/__init__.py
rename to reco_utils/models/wide_deep/__init__.py
diff --git a/reco_utils/recommender/wide_deep/wide_deep_utils.py b/reco_utils/models/wide_deep/wide_deep_utils.py
similarity index 100%
rename from reco_utils/recommender/wide_deep/wide_deep_utils.py
rename to reco_utils/models/wide_deep/wide_deep_utils.py
diff --git a/reco_utils/recommender/wide_deep/__init__.py b/reco_utils/utils/__init__.py
similarity index 100%
rename from reco_utils/recommender/wide_deep/__init__.py
rename to reco_utils/utils/__init__.py
diff --git a/reco_utils/common/constants.py b/reco_utils/utils/constants.py
similarity index 100%
rename from reco_utils/common/constants.py
rename to reco_utils/utils/constants.py
diff --git a/reco_utils/common/general_utils.py b/reco_utils/utils/general_utils.py
similarity index 100%
rename from reco_utils/common/general_utils.py
rename to reco_utils/utils/general_utils.py
diff --git a/reco_utils/common/gpu_utils.py b/reco_utils/utils/gpu_utils.py
similarity index 100%
rename from reco_utils/common/gpu_utils.py
rename to reco_utils/utils/gpu_utils.py
diff --git a/reco_utils/common/k8s_utils.py b/reco_utils/utils/k8s_utils.py
similarity index 100%
rename from reco_utils/common/k8s_utils.py
rename to reco_utils/utils/k8s_utils.py
diff --git a/reco_utils/common/notebook_memory_management.py b/reco_utils/utils/notebook_memory_management.py
similarity index 100%
rename from reco_utils/common/notebook_memory_management.py
rename to reco_utils/utils/notebook_memory_management.py
diff --git a/reco_utils/common/notebook_utils.py b/reco_utils/utils/notebook_utils.py
similarity index 100%
rename from reco_utils/common/notebook_utils.py
rename to reco_utils/utils/notebook_utils.py
diff --git a/reco_utils/common/plot.py b/reco_utils/utils/plot.py
similarity index 100%
rename from reco_utils/common/plot.py
rename to reco_utils/utils/plot.py
diff --git a/reco_utils/common/python_utils.py b/reco_utils/utils/python_utils.py
similarity index 100%
rename from reco_utils/common/python_utils.py
rename to reco_utils/utils/python_utils.py
diff --git a/reco_utils/common/spark_utils.py b/reco_utils/utils/spark_utils.py
similarity index 100%
rename from reco_utils/common/spark_utils.py
rename to reco_utils/utils/spark_utils.py
diff --git a/reco_utils/common/tf_utils.py b/reco_utils/utils/tf_utils.py
similarity index 100%
rename from reco_utils/common/tf_utils.py
rename to reco_utils/utils/tf_utils.py
diff --git a/reco_utils/common/timer.py b/reco_utils/utils/timer.py
similarity index 100%
rename from reco_utils/common/timer.py
rename to reco_utils/utils/timer.py

From 762775b53d15ff4c7bb208cedbdb30bbcbca8981 Mon Sep 17 00:00:00 2001
From: miguelgfierro <miguelgfierro@users.noreply.github.com>
Date: Fri, 16 Jul 2021 08:18:17 +0000
Subject: [PATCH 10/17] :bug:

---
 examples/02_model_collaborative_filtering/als_deep_dive.ipynb | 2 +-
 examples/02_model_hybrid/lightfm_deep_dive.ipynb              | 2 +-
 2 files changed, 2 insertions(+), 2 deletions(-)

diff --git a/examples/02_model_collaborative_filtering/als_deep_dive.ipynb b/examples/02_model_collaborative_filtering/als_deep_dive.ipynb
index 605933977b..9209260a89 100644
--- a/examples/02_model_collaborative_filtering/als_deep_dive.ipynb
+++ b/examples/02_model_collaborative_filtering/als_deep_dive.ipynb
@@ -121,7 +121,7 @@
     "from pyspark.sql.types import FloatType, IntegerType, LongType\n",
     "\n",
     "from reco_utils.datasets import movielens\n",
-    "from reco_utils.common.spark_utils import start_or_get_spark\n",
+    "from reco_utils.utils.spark_utils import start_or_get_spark\n",
     "from reco_utils.evaluation.spark_evaluation import SparkRankingEvaluation, SparkRatingEvaluation\n",
     "from reco_utils.tuning.parameter_sweep import generate_param_grid\n",
     "from reco_utils.datasets.spark_splitters import spark_random_split\n",
diff --git a/examples/02_model_hybrid/lightfm_deep_dive.ipynb b/examples/02_model_hybrid/lightfm_deep_dive.ipynb
index 4a132efbb9..c01cacf5e4 100755
--- a/examples/02_model_hybrid/lightfm_deep_dive.ipynb
+++ b/examples/02_model_hybrid/lightfm_deep_dive.ipynb
@@ -154,7 +154,7 @@
     "from reco_utils.evaluation.python_evaluation import (\n",
     "    precision_at_k, recall_at_k)\n",
     "\n",
-    "from reco_utils.common.timer import Timer\n",
+    "from reco_utils.utils.timer import Timer\n",
     "from reco_utils.datasets import movielens\n",
     "from reco_utils.models.lightfm.lightfm_utils import (\n",
     "    track_model_metrics, prepare_test_df, prepare_all_predictions,\n",

From e0e60b5c0561f00af72d026a6d33181a3e3e36d5 Mon Sep 17 00:00:00 2001
From: miguelgfierro <miguelgfierro@users.noreply.github.com>
Date: Fri, 16 Jul 2021 08:33:26 +0000
Subject: [PATCH 11/17] skip wikidata

---
 tests/unit/examples/test_notebooks_python.py   | 2 ++
 tests/unit/reco_utils/dataset/test_wikidata.py | 3 +++
 2 files changed, 5 insertions(+)

diff --git a/tests/unit/examples/test_notebooks_python.py b/tests/unit/examples/test_notebooks_python.py
index c81430ad33..214ab6a06c 100644
--- a/tests/unit/examples/test_notebooks_python.py
+++ b/tests/unit/examples/test_notebooks_python.py
@@ -3,6 +3,7 @@
 
 import sys
 import pytest
+
 try:
     import papermill as pm
     import scrapbook as sb
@@ -80,6 +81,7 @@ def test_lightgbm(notebooks, output_notebook, kernel_name):
 
 
 @pytest.mark.notebooks
+@pytest.skip(reason="Wikidata API is unstable")
 def test_wikidata_runs(notebooks, output_notebook, kernel_name, tmp):
     notebook_path = notebooks["wikidata_knowledge_graph"]
     MOVIELENS_SAMPLE_SIZE = 5
diff --git a/tests/unit/reco_utils/dataset/test_wikidata.py b/tests/unit/reco_utils/dataset/test_wikidata.py
index bf7b1cbd6a..f4ba8c2fc4 100644
--- a/tests/unit/reco_utils/dataset/test_wikidata.py
+++ b/tests/unit/reco_utils/dataset/test_wikidata.py
@@ -27,18 +27,21 @@ def test_find_wikidata_id(q):
     assert find_wikidata_id(q["not_correct"]) == "entityNotFound"
 
 
+@pytest.skip(reason="Wikidata API is unstable")
 def test_query_entity_links(q):
     resp = query_entity_links(q["entity_id"])
     assert "head" in resp
     assert "results" in resp
 
 
+@pytest.skip(reason="Wikidata API is unstable")
 def test_read_linked_entities(q):
     resp = query_entity_links(q["entity_id"])
     related_links = read_linked_entities(resp)
     assert len(related_links) > 5
 
 
+@pytest.skip(reason="Wikidata API is unstable")
 def test_query_entity_description(q):
     desc = query_entity_description(q["entity_id"])
     assert desc == "1954–1955 fantasy novel by J. R. R. Tolkien"

From 318583a834b93d14141ffea3529f0ac0be806f95 Mon Sep 17 00:00:00 2001
From: miguelgfierro <miguelgfierro@users.noreply.github.com>
Date: Fri, 16 Jul 2021 08:34:37 +0000
Subject: [PATCH 12/17] rename tests folders :boom:

---
 tests/unit/reco_utils/{dataset => datasets}/test_covid_utils.py   | 0
 tests/unit/reco_utils/{dataset => datasets}/test_dataset.py       | 0
 .../unit/reco_utils/{dataset => datasets}/test_pandas_df_utils.py | 0
 .../unit/reco_utils/{dataset => datasets}/test_python_splitter.py | 0
 .../unit/reco_utils/{dataset => datasets}/test_spark_splitter.py  | 0
 tests/unit/reco_utils/{dataset => datasets}/test_sparse.py        | 0
 tests/unit/reco_utils/{dataset => datasets}/test_wikidata.py      | 0
 .../unit/reco_utils/{recommender => models}/test_cornac_utils.py  | 0
 .../unit/reco_utils/{recommender => models}/test_deeprec_model.py | 0
 .../unit/reco_utils/{recommender => models}/test_deeprec_utils.py | 0
 tests/unit/reco_utils/{recommender => models}/test_geoimc.py      | 0
 .../unit/reco_utils/{recommender => models}/test_lightfm_utils.py | 0
 tests/unit/reco_utils/{recommender => models}/test_ncf_dataset.py | 0
 .../reco_utils/{recommender => models}/test_ncf_singlenode.py     | 0
 .../unit/reco_utils/{recommender => models}/test_newsrec_model.py | 0
 .../unit/reco_utils/{recommender => models}/test_newsrec_utils.py | 0
 tests/unit/reco_utils/{recommender => models}/test_rbm.py         | 0
 .../reco_utils/{recommender => models}/test_sar_singlenode.py     | 0
 .../reco_utils/{recommender => models}/test_surprise_utils.py     | 0
 tests/unit/reco_utils/{recommender => models}/test_tfidf_utils.py | 0
 .../unit/reco_utils/{recommender => models}/test_vowpal_wabbit.py | 0
 .../reco_utils/{recommender => models}/test_wide_deep_utils.py    | 0
 tests/unit/reco_utils/{common => utils}/test_general_utils.py     | 0
 tests/unit/reco_utils/{common => utils}/test_gpu_utils.py         | 0
 tests/unit/reco_utils/{common => utils}/test_k8s_utils.py         | 0
 tests/unit/reco_utils/{common => utils}/test_notebook_utils.ipynb | 0
 tests/unit/reco_utils/{common => utils}/test_notebook_utils.py    | 0
 tests/unit/reco_utils/{common => utils}/test_plot.py              | 0
 tests/unit/reco_utils/{common => utils}/test_python_utils.py      | 0
 tests/unit/reco_utils/{common => utils}/test_tf_utils.py          | 0
 tests/unit/reco_utils/{common => utils}/test_timer.py             | 0
 31 files changed, 0 insertions(+), 0 deletions(-)
 rename tests/unit/reco_utils/{dataset => datasets}/test_covid_utils.py (100%)
 rename tests/unit/reco_utils/{dataset => datasets}/test_dataset.py (100%)
 rename tests/unit/reco_utils/{dataset => datasets}/test_pandas_df_utils.py (100%)
 rename tests/unit/reco_utils/{dataset => datasets}/test_python_splitter.py (100%)
 rename tests/unit/reco_utils/{dataset => datasets}/test_spark_splitter.py (100%)
 rename tests/unit/reco_utils/{dataset => datasets}/test_sparse.py (100%)
 rename tests/unit/reco_utils/{dataset => datasets}/test_wikidata.py (100%)
 rename tests/unit/reco_utils/{recommender => models}/test_cornac_utils.py (100%)
 rename tests/unit/reco_utils/{recommender => models}/test_deeprec_model.py (100%)
 rename tests/unit/reco_utils/{recommender => models}/test_deeprec_utils.py (100%)
 rename tests/unit/reco_utils/{recommender => models}/test_geoimc.py (100%)
 rename tests/unit/reco_utils/{recommender => models}/test_lightfm_utils.py (100%)
 rename tests/unit/reco_utils/{recommender => models}/test_ncf_dataset.py (100%)
 rename tests/unit/reco_utils/{recommender => models}/test_ncf_singlenode.py (100%)
 rename tests/unit/reco_utils/{recommender => models}/test_newsrec_model.py (100%)
 rename tests/unit/reco_utils/{recommender => models}/test_newsrec_utils.py (100%)
 rename tests/unit/reco_utils/{recommender => models}/test_rbm.py (100%)
 rename tests/unit/reco_utils/{recommender => models}/test_sar_singlenode.py (100%)
 rename tests/unit/reco_utils/{recommender => models}/test_surprise_utils.py (100%)
 rename tests/unit/reco_utils/{recommender => models}/test_tfidf_utils.py (100%)
 rename tests/unit/reco_utils/{recommender => models}/test_vowpal_wabbit.py (100%)
 rename tests/unit/reco_utils/{recommender => models}/test_wide_deep_utils.py (100%)
 rename tests/unit/reco_utils/{common => utils}/test_general_utils.py (100%)
 rename tests/unit/reco_utils/{common => utils}/test_gpu_utils.py (100%)
 rename tests/unit/reco_utils/{common => utils}/test_k8s_utils.py (100%)
 rename tests/unit/reco_utils/{common => utils}/test_notebook_utils.ipynb (100%)
 rename tests/unit/reco_utils/{common => utils}/test_notebook_utils.py (100%)
 rename tests/unit/reco_utils/{common => utils}/test_plot.py (100%)
 rename tests/unit/reco_utils/{common => utils}/test_python_utils.py (100%)
 rename tests/unit/reco_utils/{common => utils}/test_tf_utils.py (100%)
 rename tests/unit/reco_utils/{common => utils}/test_timer.py (100%)

diff --git a/tests/unit/reco_utils/dataset/test_covid_utils.py b/tests/unit/reco_utils/datasets/test_covid_utils.py
similarity index 100%
rename from tests/unit/reco_utils/dataset/test_covid_utils.py
rename to tests/unit/reco_utils/datasets/test_covid_utils.py
diff --git a/tests/unit/reco_utils/dataset/test_dataset.py b/tests/unit/reco_utils/datasets/test_dataset.py
similarity index 100%
rename from tests/unit/reco_utils/dataset/test_dataset.py
rename to tests/unit/reco_utils/datasets/test_dataset.py
diff --git a/tests/unit/reco_utils/dataset/test_pandas_df_utils.py b/tests/unit/reco_utils/datasets/test_pandas_df_utils.py
similarity index 100%
rename from tests/unit/reco_utils/dataset/test_pandas_df_utils.py
rename to tests/unit/reco_utils/datasets/test_pandas_df_utils.py
diff --git a/tests/unit/reco_utils/dataset/test_python_splitter.py b/tests/unit/reco_utils/datasets/test_python_splitter.py
similarity index 100%
rename from tests/unit/reco_utils/dataset/test_python_splitter.py
rename to tests/unit/reco_utils/datasets/test_python_splitter.py
diff --git a/tests/unit/reco_utils/dataset/test_spark_splitter.py b/tests/unit/reco_utils/datasets/test_spark_splitter.py
similarity index 100%
rename from tests/unit/reco_utils/dataset/test_spark_splitter.py
rename to tests/unit/reco_utils/datasets/test_spark_splitter.py
diff --git a/tests/unit/reco_utils/dataset/test_sparse.py b/tests/unit/reco_utils/datasets/test_sparse.py
similarity index 100%
rename from tests/unit/reco_utils/dataset/test_sparse.py
rename to tests/unit/reco_utils/datasets/test_sparse.py
diff --git a/tests/unit/reco_utils/dataset/test_wikidata.py b/tests/unit/reco_utils/datasets/test_wikidata.py
similarity index 100%
rename from tests/unit/reco_utils/dataset/test_wikidata.py
rename to tests/unit/reco_utils/datasets/test_wikidata.py
diff --git a/tests/unit/reco_utils/recommender/test_cornac_utils.py b/tests/unit/reco_utils/models/test_cornac_utils.py
similarity index 100%
rename from tests/unit/reco_utils/recommender/test_cornac_utils.py
rename to tests/unit/reco_utils/models/test_cornac_utils.py
diff --git a/tests/unit/reco_utils/recommender/test_deeprec_model.py b/tests/unit/reco_utils/models/test_deeprec_model.py
similarity index 100%
rename from tests/unit/reco_utils/recommender/test_deeprec_model.py
rename to tests/unit/reco_utils/models/test_deeprec_model.py
diff --git a/tests/unit/reco_utils/recommender/test_deeprec_utils.py b/tests/unit/reco_utils/models/test_deeprec_utils.py
similarity index 100%
rename from tests/unit/reco_utils/recommender/test_deeprec_utils.py
rename to tests/unit/reco_utils/models/test_deeprec_utils.py
diff --git a/tests/unit/reco_utils/recommender/test_geoimc.py b/tests/unit/reco_utils/models/test_geoimc.py
similarity index 100%
rename from tests/unit/reco_utils/recommender/test_geoimc.py
rename to tests/unit/reco_utils/models/test_geoimc.py
diff --git a/tests/unit/reco_utils/recommender/test_lightfm_utils.py b/tests/unit/reco_utils/models/test_lightfm_utils.py
similarity index 100%
rename from tests/unit/reco_utils/recommender/test_lightfm_utils.py
rename to tests/unit/reco_utils/models/test_lightfm_utils.py
diff --git a/tests/unit/reco_utils/recommender/test_ncf_dataset.py b/tests/unit/reco_utils/models/test_ncf_dataset.py
similarity index 100%
rename from tests/unit/reco_utils/recommender/test_ncf_dataset.py
rename to tests/unit/reco_utils/models/test_ncf_dataset.py
diff --git a/tests/unit/reco_utils/recommender/test_ncf_singlenode.py b/tests/unit/reco_utils/models/test_ncf_singlenode.py
similarity index 100%
rename from tests/unit/reco_utils/recommender/test_ncf_singlenode.py
rename to tests/unit/reco_utils/models/test_ncf_singlenode.py
diff --git a/tests/unit/reco_utils/recommender/test_newsrec_model.py b/tests/unit/reco_utils/models/test_newsrec_model.py
similarity index 100%
rename from tests/unit/reco_utils/recommender/test_newsrec_model.py
rename to tests/unit/reco_utils/models/test_newsrec_model.py
diff --git a/tests/unit/reco_utils/recommender/test_newsrec_utils.py b/tests/unit/reco_utils/models/test_newsrec_utils.py
similarity index 100%
rename from tests/unit/reco_utils/recommender/test_newsrec_utils.py
rename to tests/unit/reco_utils/models/test_newsrec_utils.py
diff --git a/tests/unit/reco_utils/recommender/test_rbm.py b/tests/unit/reco_utils/models/test_rbm.py
similarity index 100%
rename from tests/unit/reco_utils/recommender/test_rbm.py
rename to tests/unit/reco_utils/models/test_rbm.py
diff --git a/tests/unit/reco_utils/recommender/test_sar_singlenode.py b/tests/unit/reco_utils/models/test_sar_singlenode.py
similarity index 100%
rename from tests/unit/reco_utils/recommender/test_sar_singlenode.py
rename to tests/unit/reco_utils/models/test_sar_singlenode.py
diff --git a/tests/unit/reco_utils/recommender/test_surprise_utils.py b/tests/unit/reco_utils/models/test_surprise_utils.py
similarity index 100%
rename from tests/unit/reco_utils/recommender/test_surprise_utils.py
rename to tests/unit/reco_utils/models/test_surprise_utils.py
diff --git a/tests/unit/reco_utils/recommender/test_tfidf_utils.py b/tests/unit/reco_utils/models/test_tfidf_utils.py
similarity index 100%
rename from tests/unit/reco_utils/recommender/test_tfidf_utils.py
rename to tests/unit/reco_utils/models/test_tfidf_utils.py
diff --git a/tests/unit/reco_utils/recommender/test_vowpal_wabbit.py b/tests/unit/reco_utils/models/test_vowpal_wabbit.py
similarity index 100%
rename from tests/unit/reco_utils/recommender/test_vowpal_wabbit.py
rename to tests/unit/reco_utils/models/test_vowpal_wabbit.py
diff --git a/tests/unit/reco_utils/recommender/test_wide_deep_utils.py b/tests/unit/reco_utils/models/test_wide_deep_utils.py
similarity index 100%
rename from tests/unit/reco_utils/recommender/test_wide_deep_utils.py
rename to tests/unit/reco_utils/models/test_wide_deep_utils.py
diff --git a/tests/unit/reco_utils/common/test_general_utils.py b/tests/unit/reco_utils/utils/test_general_utils.py
similarity index 100%
rename from tests/unit/reco_utils/common/test_general_utils.py
rename to tests/unit/reco_utils/utils/test_general_utils.py
diff --git a/tests/unit/reco_utils/common/test_gpu_utils.py b/tests/unit/reco_utils/utils/test_gpu_utils.py
similarity index 100%
rename from tests/unit/reco_utils/common/test_gpu_utils.py
rename to tests/unit/reco_utils/utils/test_gpu_utils.py
diff --git a/tests/unit/reco_utils/common/test_k8s_utils.py b/tests/unit/reco_utils/utils/test_k8s_utils.py
similarity index 100%
rename from tests/unit/reco_utils/common/test_k8s_utils.py
rename to tests/unit/reco_utils/utils/test_k8s_utils.py
diff --git a/tests/unit/reco_utils/common/test_notebook_utils.ipynb b/tests/unit/reco_utils/utils/test_notebook_utils.ipynb
similarity index 100%
rename from tests/unit/reco_utils/common/test_notebook_utils.ipynb
rename to tests/unit/reco_utils/utils/test_notebook_utils.ipynb
diff --git a/tests/unit/reco_utils/common/test_notebook_utils.py b/tests/unit/reco_utils/utils/test_notebook_utils.py
similarity index 100%
rename from tests/unit/reco_utils/common/test_notebook_utils.py
rename to tests/unit/reco_utils/utils/test_notebook_utils.py
diff --git a/tests/unit/reco_utils/common/test_plot.py b/tests/unit/reco_utils/utils/test_plot.py
similarity index 100%
rename from tests/unit/reco_utils/common/test_plot.py
rename to tests/unit/reco_utils/utils/test_plot.py
diff --git a/tests/unit/reco_utils/common/test_python_utils.py b/tests/unit/reco_utils/utils/test_python_utils.py
similarity index 100%
rename from tests/unit/reco_utils/common/test_python_utils.py
rename to tests/unit/reco_utils/utils/test_python_utils.py
diff --git a/tests/unit/reco_utils/common/test_tf_utils.py b/tests/unit/reco_utils/utils/test_tf_utils.py
similarity index 100%
rename from tests/unit/reco_utils/common/test_tf_utils.py
rename to tests/unit/reco_utils/utils/test_tf_utils.py
diff --git a/tests/unit/reco_utils/common/test_timer.py b/tests/unit/reco_utils/utils/test_timer.py
similarity index 100%
rename from tests/unit/reco_utils/common/test_timer.py
rename to tests/unit/reco_utils/utils/test_timer.py

From 2c3e45ea818addfaa6af34b1351ba7ee06c0a7ce Mon Sep 17 00:00:00 2001
From: miguelgfierro <miguelgfierro@users.noreply.github.com>
Date: Fri, 16 Jul 2021 08:40:16 +0000
Subject: [PATCH 13/17] :bug:

---
 tests/unit/examples/test_notebooks_python.py    | 2 +-
 tests/unit/reco_utils/datasets/test_wikidata.py | 6 +++---
 2 files changed, 4 insertions(+), 4 deletions(-)

diff --git a/tests/unit/examples/test_notebooks_python.py b/tests/unit/examples/test_notebooks_python.py
index 214ab6a06c..361db887a1 100644
--- a/tests/unit/examples/test_notebooks_python.py
+++ b/tests/unit/examples/test_notebooks_python.py
@@ -81,7 +81,7 @@ def test_lightgbm(notebooks, output_notebook, kernel_name):
 
 
 @pytest.mark.notebooks
-@pytest.skip(reason="Wikidata API is unstable")
+@pytest.mark.skip(reason="Wikidata API is unstable")
 def test_wikidata_runs(notebooks, output_notebook, kernel_name, tmp):
     notebook_path = notebooks["wikidata_knowledge_graph"]
     MOVIELENS_SAMPLE_SIZE = 5
diff --git a/tests/unit/reco_utils/datasets/test_wikidata.py b/tests/unit/reco_utils/datasets/test_wikidata.py
index f4ba8c2fc4..973c34875a 100644
--- a/tests/unit/reco_utils/datasets/test_wikidata.py
+++ b/tests/unit/reco_utils/datasets/test_wikidata.py
@@ -27,21 +27,21 @@ def test_find_wikidata_id(q):
     assert find_wikidata_id(q["not_correct"]) == "entityNotFound"
 
 
-@pytest.skip(reason="Wikidata API is unstable")
+@pytest.mark.skip(reason="Wikidata API is unstable")
 def test_query_entity_links(q):
     resp = query_entity_links(q["entity_id"])
     assert "head" in resp
     assert "results" in resp
 
 
-@pytest.skip(reason="Wikidata API is unstable")
+@pytest.mark.skip(reason="Wikidata API is unstable")
 def test_read_linked_entities(q):
     resp = query_entity_links(q["entity_id"])
     related_links = read_linked_entities(resp)
     assert len(related_links) > 5
 
 
-@pytest.skip(reason="Wikidata API is unstable")
+@pytest.mark.skip(reason="Wikidata API is unstable")
 def test_query_entity_description(q):
     desc = query_entity_description(q["entity_id"])
     assert desc == "1954–1955 fantasy novel by J. R. R. Tolkien"

From 83e6f3d05eca6c4ccbd831c6551eb40820bf2a72 Mon Sep 17 00:00:00 2001
From: miguelgfierro <miguelgfierro@users.noreply.github.com>
Date: Fri, 16 Jul 2021 13:54:33 +0100
Subject: [PATCH 14/17] typo errors

---
 examples/00_quick_start/sar_movielens.ipynb                | 4 ++--
 .../cornac_bpr_deep_dive.ipynb                             | 5 ++---
 .../lightgcn_deep_dive.ipynb                               | 5 ++---
 examples/02_model_hybrid/ncf_deep_dive.ipynb               | 5 ++---
 examples/05_operationalize/als_movie_o16n.ipynb            | 7 +++----
 reco_utils/evaluation/python_evaluation.py                 | 2 +-
 6 files changed, 12 insertions(+), 16 deletions(-)

diff --git a/examples/00_quick_start/sar_movielens.ipynb b/examples/00_quick_start/sar_movielens.ipynb
index ae3e859aa2..335339d55c 100644
--- a/examples/00_quick_start/sar_movielens.ipynb
+++ b/examples/00_quick_start/sar_movielens.ipynb
@@ -497,7 +497,7 @@
    "source": [
     "### 2.3. Evaluate how well SAR performs\n",
     "\n",
-    "We evaluate how well SAR performs for a few utils ranking metrics provided in the `python_evaluation` module in reco_utils. We will consider the Mean Average Precision (MAP), Normalized Discounted Cumalative Gain (NDCG), Precision, and Recall for the top-k items per user we computed with SAR. User, item and rating column names are specified in each evaluation method."
+    "We evaluate how well SAR performs for a few common ranking metrics provided in the `python_evaluation` module. We will consider the Mean Average Precision (MAP), Normalized Discounted Cumalative Gain (NDCG), Precision, and Recall for the top-k items per user we computed with SAR. User, item and rating column names are specified in each evaluation method."
    ]
   },
   {
@@ -923,4 +923,4 @@
  },
  "nbformat": 4,
  "nbformat_minor": 4
-}
+}
\ No newline at end of file
diff --git a/examples/02_model_collaborative_filtering/cornac_bpr_deep_dive.ipynb b/examples/02_model_collaborative_filtering/cornac_bpr_deep_dive.ipynb
index 5bfbb580e6..f421a4fa25 100644
--- a/examples/02_model_collaborative_filtering/cornac_bpr_deep_dive.ipynb
+++ b/examples/02_model_collaborative_filtering/cornac_bpr_deep_dive.ipynb
@@ -43,7 +43,6 @@
    ],
    "source": [
     "import sys\n",
-    
     "import os\n",
     "import cornac\n",
     "import papermill as pm\n",
@@ -89,7 +88,7 @@
     "\n",
     "### 1.1 Personalized Ranking from Implicit Feedback\n",
     "\n",
-    "The task of personalized ranking aims at providing each user a ranked list of items (recommendations).  This is very utils in scenarios where recommender systems are based on implicit user behavior (e.g. purchases, clicks).  The available observations are only positive feedback where the non-observed ones are a mixture of real negative feedback and missing values.\n",
+    "The task of personalized ranking aims at providing each user a ranked list of items (recommendations).  This is very common in scenarios where recommender systems are based on implicit user behavior (e.g. purchases, clicks).  The available observations are only positive feedback where the non-observed ones are a mixture of real negative feedback and missing values.\n",
     "\n",
     "One usual approach for item recommendation is directly predicting a preference score $\\hat{x}_{u,i}$ given to item $i$ by user $u$.  BPR uses a different approach by using item pairs $(i, j)$ and optimizing for the correct ranking given preference of user $u$, thus, there are notions of *positive* and *negative* items.  The training data $D_S : U \\times I \\times I$ is defined as:\n",
     "\n",
@@ -118,7 +117,7 @@
     "\n",
     "The preference scoring function $\\hat{x}_{uij}(\\Theta)$ could be an arbitrary real-valued function of the model parameter $\\Theta$.  Thus, it makes BPR a general framework for modeling the relationship between triplets $(u, i, j)$ where different model classes like matrix factorization could be used for estimating $\\hat{x}_{uij}(\\Theta)$.\n",
     "\n",
-    "For the prior, one of the utils pratices is to choose $p(\\Theta)$ following a normal distribution, which results in a nice form of L2 regularization in the final log-form of the objective function.\n",
+    "For the prior, one of the common pratices is to choose $p(\\Theta)$ following a normal distribution, which results in a nice form of L2 regularization in the final log-form of the objective function.\n",
     "\n",
     "$$ p(\\Theta) \\sim N(0, \\Sigma_{\\Theta}) $$\n",
     "\n",
diff --git a/examples/02_model_collaborative_filtering/lightgcn_deep_dive.ipynb b/examples/02_model_collaborative_filtering/lightgcn_deep_dive.ipynb
index 56aaa7c73b..b7a58c0a52 100644
--- a/examples/02_model_collaborative_filtering/lightgcn_deep_dive.ipynb
+++ b/examples/02_model_collaborative_filtering/lightgcn_deep_dive.ipynb
@@ -43,7 +43,6 @@
    ],
    "source": [
     "import sys\n",
-    
     "import os\n",
     "import papermill as pm\n",
     "import scrapbook as sb\n",
@@ -728,7 +727,7 @@
     "\n",
     "Here there are the performances of LightGCN compared to [SAR](../00_quick_start/sar_movielens.ipynb) and [NCF](../00_quick_start/ncf_movielens.ipynb) on MovieLens dataset of 100k and 1m. The method of data loading and splitting is the same as that described above and the GPU used was a GeForce GTX 1080Ti.\n",
     "\n",
-    "Settings utils to the three models: `epochs=15, seed=42`.\n",
+    "Settings common to the three models: `epochs=15, seed=42`.\n",
     "\n",
     "Settings for LightGCN: `embed_size=64, n_layers=3, batch_size=1024, decay=0.0001, learning_rate=0.015 `.\n",
     "\n",
@@ -788,4 +787,4 @@
  },
  "nbformat": 4,
  "nbformat_minor": 2
-}
+}
\ No newline at end of file
diff --git a/examples/02_model_hybrid/ncf_deep_dive.ipynb b/examples/02_model_hybrid/ncf_deep_dive.ipynb
index bf0386254d..d5bc01d424 100644
--- a/examples/02_model_hybrid/ncf_deep_dive.ipynb
+++ b/examples/02_model_hybrid/ncf_deep_dive.ipynb
@@ -43,7 +43,6 @@
    ],
    "source": [
     "import sys\n",
-    
     "import os\n",
     "import shutil\n",
     "import papermill as pm\n",
@@ -196,7 +195,7 @@
     "\n",
     "To evaluate the performance of item recommendation, we adopted the leave-one-out evaluation.\n",
     "\n",
-    "For each user, we held out his/her latest interaction as the test set and utilized the remaining data for training. We use `python_chrono_split` to achieve this. And since it is too time-consuming to rank all items for every user during evaluation, we followed the utils strategy that randomly samples 100 items that are not interacted by the user, ranking the test item among the 100 items. Our test samples will be constructed by `NCFDataset`."
+    "For each user, we held out his/her latest interaction as the test set and utilized the remaining data for training. We use `python_chrono_split` to achieve this. And since it is too time-consuming to rank all items for every user during evaluation, we followed the common strategy that randomly samples 100 items that are not interacted by the user, ranking the test item among the 100 items. Our test samples will be constructed by `NCFDataset`."
    ]
   },
   {
@@ -940,4 +939,4 @@
  },
  "nbformat": 4,
  "nbformat_minor": 2
-}
+}
\ No newline at end of file
diff --git a/examples/05_operationalize/als_movie_o16n.ipynb b/examples/05_operationalize/als_movie_o16n.ipynb
index d70e3c2724..36072dcfef 100644
--- a/examples/05_operationalize/als_movie_o16n.ipynb
+++ b/examples/05_operationalize/als_movie_o16n.ipynb
@@ -75,10 +75,9 @@
    "source": [
     "import os\n",
     "import sys\n",
-    
     "import urllib\n",
     "\n",
-    "from azure.utils.client_factory import get_client_from_cli_profile\n",
+    "from azure.common.client_factory import get_client_from_cli_profile\n",
     "import azure.mgmt.cosmosdb\n",
     "import azureml.core\n",
     "from azureml.core import Workspace\n",
@@ -165,7 +164,7 @@
     "1. [Azure ML Service](https://azure.microsoft.com/en-us/services/machine-learning-service/)\n",
     "    1. [Azure ML Workspace](https://docs.microsoft.com/en-us/azure/machine-learning/concept-workspace)\n",
     "    1. [Azure Application Insights](https://azure.microsoft.com/en-us/services/monitor/)\n",
-    "    1. [Azure Storage](https://docs.microsoft.com/en-us/azure/storage/utils/storage-account-overview)\n",
+    "    1. [Azure Storage](https://docs.microsoft.com/en-us/azure/storage/common/storage-account-overview)\n",
     "    1. [Azure Key Vault](https://azure.microsoft.com/en-us/services/key-vault/)    \n",
     "\n",
     "1. [Azure Cosmos DB](https://azure.microsoft.com/en-us/services/cosmos-db/)\n",
@@ -1236,4 +1235,4 @@
  },
  "nbformat": 4,
  "nbformat_minor": 1
-}
+}
\ No newline at end of file
diff --git a/reco_utils/evaluation/python_evaluation.py b/reco_utils/evaluation/python_evaluation.py
index 5ed9552bb6..9277e6e19e 100644
--- a/reco_utils/evaluation/python_evaluation.py
+++ b/reco_utils/evaluation/python_evaluation.py
@@ -352,7 +352,7 @@ def merge_ranking_true_pred(
     k=DEFAULT_K,
     threshold=DEFAULT_THRESHOLD,
 ):
-    """Filter truth and prediction data frames on utils users
+    """Filter truth and prediction data frames on common users
 
     Args:
         rating_true (pandas.DataFrame): True DataFrame

From 34c208c1175e8f0c3592c0eb0564a6f21d5903e0 Mon Sep 17 00:00:00 2001
From: miguelgfierro <miguelgfierro@users.noreply.github.com>
Date: Fri, 16 Jul 2021 13:28:44 +0000
Subject: [PATCH 15/17] update skip test list

---
 tests/README.md                               | 59 +++++++++++--------
 .../examples/test_notebooks_python.py         |  7 ++-
 tests/smoke/examples/test_notebooks_python.py |  3 +-
 tests/unit/examples/test_notebooks_python.py  |  2 +-
 4 files changed, 40 insertions(+), 31 deletions(-)

diff --git a/tests/README.md b/tests/README.md
index 0f5da751be..f3fd6969b9 100644
--- a/tests/README.md
+++ b/tests/README.md
@@ -107,37 +107,44 @@ For executing the PySpark integration tests:
 
 Several of the tests are skipped for various reasons which are noted below.
 
-<table><tr>
+<table>
+<tr>
 <td>Test Module</td>
 <td>Test</td>
 <td>Test Environment</td>
 <td>Reason</td>
-</tr><tr>
-<td>unit/test_nni</td>
+</tr>
+<tr>
+<td>unit/reco_utils/datasets/test_wikidata</td>
 <td>*</td>
-<td>Windows</td>
-<td>NNI is not currently supported on Windows</td>
-</tr><tr>
-<td>integration/test_notebooks_python</td>
-<td>test_nni_tuning_svd</td>
-<td>Windows</td>
-<td>NNI is not currently supported on Windows</td>
-</tr><tr>
-<td>*/test_notebook_pyspark</td>
-<td>test_mmlspark_lightgbm_criteo_runs</td>
-<td>Windows</td>
-<td>MML Spark and LightGBM issue: https://github.com/Azure/mmlspark/issues/483</td>
-</tr><tr>
-<td>unit/test_gpu_utils</td>
-<td>test_get_cuda_version</td>
-<td>Windows</td>
-<td>Current method for retrieval of CUDA info on Windows is install specific</td>
-</tr><tr>
-<td>nightly*, *notebooks*</td>
-<td>vowpalwabbit: test_surprise_svd_integration  test_vw_deep_dive_integration test_vw_deep_dive_smoke test_vw_deep_dive_runs/vowpal_wabbit_deep_dive test_vowpal_wabbit.py</td>
-<td>AzureML</td>
-<td>To optimize our efforts, we decided to wait until a pip installable version of vowpalwabbit is again available and then it can be added back into the AzureML test suite.</td>
-</tr></table>
+<td>Linux</td>
+<td>Wikidata API is unstable</td>
+</tr>
+<tr>
+<td>integration/reco_utils/datasets/test_notebooks_python</td>
+<td>test_wikidata</td>
+<td>Linux</td>
+<td>Wikidata API is unstable</td>
+</tr>
+<tr>
+<td>*/test_notebooks_python</td>
+<td>test_vw*</td>
+<td>Linux</td>
+<td>VW pip package has installation incompatibilities</td>
+</tr>
+<tr>
+<td>*/test_notebooks_python</td>
+<td>test_nni*</td>
+<td>Linux</td>
+<td>NNI pip package has installation incompatibilities</td>
+</tr>
+<tr>
+<td>integration/examples/test_notebooks_python</td>
+<td>test_xlearn*</td>
+<td>Linux</td>
+<td>xLearn pip package has installation incompatibilities</td>
+</tr>
+</table>
 
 In order to skip a test because there is an OS or upstream issue which cannot be resolved you can use pytest [annotations](https://docs.pytest.org/en/latest/skipping.html).
 
diff --git a/tests/integration/examples/test_notebooks_python.py b/tests/integration/examples/test_notebooks_python.py
index f35b599077..671aa241fb 100644
--- a/tests/integration/examples/test_notebooks_python.py
+++ b/tests/integration/examples/test_notebooks_python.py
@@ -148,7 +148,7 @@ def test_surprise_svd_integration(
         )
     ],
 )
-@pytest.mark.skip(reason="Tests removed due to installation incompatibilities")
+@pytest.mark.skip(reason="VW pip package has installation incompatibilities")
 def test_vw_deep_dive_integration(
     notebooks, output_notebook, kernel_name, size, expected_values
 ):
@@ -169,7 +169,7 @@ def test_vw_deep_dive_integration(
 
 # @pytest.mark.skipif(sys.platform == "win32", reason="nni not installable on windows")
 @pytest.mark.integration
-@pytest.mark.skip(reason="Tests removed due to installation incompatibilities")
+@pytest.mark.skip(reason="NNI pip package has installation incompatibilities")
 def test_nni_tuning_svd(notebooks, output_notebook, kernel_name, tmp):
     notebook_path = notebooks["nni_tuning_svd"]
     pm.execute_notebook(
@@ -189,6 +189,7 @@ def test_nni_tuning_svd(notebooks, output_notebook, kernel_name, tmp):
 
 
 @pytest.mark.integration
+@pytest.mark.skip(reason="Wikidata API is unstable")
 def test_wikidata_integration(notebooks, output_notebook, kernel_name, tmp):
     notebook_path = notebooks["wikidata_knowledge_graph"]
     pm.execute_notebook(
@@ -250,7 +251,7 @@ def test_geoimc_integration(notebooks, output_notebook, kernel_name, expected_va
 
 
 @pytest.mark.integration
-@pytest.mark.skip(reason="Tests removed due to installation incompatibilities")
+@pytest.mark.skip(reason="xLearn pip package has installation incompatibilities")
 def test_xlearn_fm_integration(notebooks, output_notebook, kernel_name):
     notebook_path = notebooks["xlearn_fm_deep_dive"]
     pm.execute_notebook(
diff --git a/tests/smoke/examples/test_notebooks_python.py b/tests/smoke/examples/test_notebooks_python.py
index 049dc730f4..1ca1b51bba 100644
--- a/tests/smoke/examples/test_notebooks_python.py
+++ b/tests/smoke/examples/test_notebooks_python.py
@@ -2,6 +2,7 @@
 # Licensed under the MIT License.
 
 import pytest
+
 try:
     import papermill as pm
     import scrapbook as sb
@@ -79,7 +80,7 @@ def test_surprise_svd_smoke(notebooks, output_notebook, kernel_name):
 
 
 @pytest.mark.smoke
-@pytest.mark.skip(reason="Tests removed due to installation incompatibilities")
+@pytest.mark.skip(reason="VW pip package has installation incompatibilities")
 def test_vw_deep_dive_smoke(notebooks, output_notebook, kernel_name):
     notebook_path = notebooks["vowpal_wabbit_deep_dive"]
     pm.execute_notebook(
diff --git a/tests/unit/examples/test_notebooks_python.py b/tests/unit/examples/test_notebooks_python.py
index 361db887a1..76cd854d28 100644
--- a/tests/unit/examples/test_notebooks_python.py
+++ b/tests/unit/examples/test_notebooks_python.py
@@ -56,7 +56,7 @@ def test_surprise_deep_dive_runs(notebooks, output_notebook, kernel_name):
 
 
 @pytest.mark.notebooks
-@pytest.mark.skip(reason="Tests removed due to installation incompatibilities")
+@pytest.mark.skip(reason="VW pip package has installation incompatibilities")
 def test_vw_deep_dive_runs(notebooks, output_notebook, kernel_name):
     notebook_path = notebooks["vowpal_wabbit_deep_dive"]
     pm.execute_notebook(notebook_path, output_notebook, kernel_name=kernel_name)

From 3d0b50404cfccf9720a2a282ca239a6d7e73d855 Mon Sep 17 00:00:00 2001
From: =?UTF-8?q?Miguel=20Gonz=C3=A1lez-Fierro?=
 <3491412+miguelgfierro@users.noreply.github.com>
Date: Fri, 16 Jul 2021 21:33:50 +0100
Subject: [PATCH 16/17] Update als_movielens_diversity_metrics.ipynb

---
 examples/03_evaluate/als_movielens_diversity_metrics.ipynb | 4 ++--
 1 file changed, 2 insertions(+), 2 deletions(-)

diff --git a/examples/03_evaluate/als_movielens_diversity_metrics.ipynb b/examples/03_evaluate/als_movielens_diversity_metrics.ipynb
index 087ce6631e..0310acb678 100644
--- a/examples/03_evaluate/als_movielens_diversity_metrics.ipynb
+++ b/examples/03_evaluate/als_movielens_diversity_metrics.ipynb
@@ -169,7 +169,7 @@
     "from reco_utils.datasets import movielens\n",
     "from reco_utils.utils.notebook_utils import is_jupyter\n",
     "from reco_utils.datasets.spark_splitters import spark_random_split\n",
-    "from reco_utils.evaluation.spark_evaluation import SparkRatingEvaluation, SparkRankingEvaluation\n",
+    "from reco_utils.evaluation.spark_evaluation import SparkRatingEvaluation, SparkRankingEvaluation, SparkDiversityEvaluation\n",
     "from reco_utils.utils.spark_utils import start_or_get_spark\n",
     "\n",
     "from pyspark.sql.window import Window\n",
@@ -817,4 +817,4 @@
  },
  "nbformat": 4,
  "nbformat_minor": 1
-}
\ No newline at end of file
+}

From d4a568a0fd7ba6221aef2e7f0c61af985152cfba Mon Sep 17 00:00:00 2001
From: =?UTF-8?q?Miguel=20Gonz=C3=A1lez-Fierro?=
 <3491412+miguelgfierro@users.noreply.github.com>
Date: Fri, 16 Jul 2021 21:34:07 +0100
Subject: [PATCH 17/17] Delete spark_diversity_evaluation.py

---
 .../evaluation/spark_diversity_evaluation.py  | 385 ------------------
 1 file changed, 385 deletions(-)
 delete mode 100644 reco_utils/evaluation/spark_diversity_evaluation.py

diff --git a/reco_utils/evaluation/spark_diversity_evaluation.py b/reco_utils/evaluation/spark_diversity_evaluation.py
deleted file mode 100644
index 0736561ed0..0000000000
--- a/reco_utils/evaluation/spark_diversity_evaluation.py
+++ /dev/null
@@ -1,385 +0,0 @@
-# Copyright (c) Microsoft Corporation. All rights reserved.
-# Licensed under the MIT License.
-
-from pyspark.sql.types import *
-from pyspark.sql import functions as F
-
-from reco_utils.utils.constants import (
-    DEFAULT_USER_COL,
-    DEFAULT_ITEM_COL,
-)
-
-
-class DiversityEvaluation:
-    """Spark Diversity Evaluator"""
-
-    def __init__(
-        self,
-        train_df,
-        reco_df,
-        col_user=DEFAULT_USER_COL,
-        col_item=DEFAULT_ITEM_COL,
-        col_relevance=None,
-    ):
-        """Initializer.
-
-        This is the Spark version of diversity metrics evaluator.
-        The methods of this class calculate following diversity metrics:
-            Coverage - The proportion of items that can be recommended. It includes two metrics: (1) catalog_coverage, which measures the proportion of items that get recommended from the item catalog; (2) distributional_coverage, which measures how unequally different items are recommended in the recommendations to all users.
-            Novelty - A more novel item indicates it is less popular, i.e., it gets recommended less frequently.
-            Diversity - The dissimilarity of items being recommended.
-            Serendipity - The "unusualness" or "surprise" of recommendations to a user. When 'col_relevance' is used, it indicates how "pleasant surprise" of recommendations is to a user.
-
-        Info:
-            The metric definitions/formulations are based on following reference with modification:
-            - G. Shani and A. Gunawardana, Evaluating Recommendation Systems, Recommender Systems Handbook pp. 257-297, 2010.
-
-            - Y.C. Zhang, D.Ó. Séaghdha, D. Quercia and T. Jambor, Auralist: introducing serendipity into music recommendation, WSDM 2012
-
-            - P. Castells, S. Vargas, and J. Wang, Novelty and diversity metrics for recommender systems: choice, discovery and relevance, ECIR 2011
-
-            - Eugene Yan, Serendipity: Accuracy’s unpopular best friend in Recommender Systems, eugeneyan.com, April 2020
-
-         Args:
-            train_df (pySpark DataFrame): Training set used for the recommender,
-                containing col_user, col_item.
-            reco_df (pySpark DataFrame): Recommender's prediction output,
-                containing col_user, col_item, col_relevance (optional).
-            col_user (str): User id column name.
-            col_item (str): Item id column name.
-            col_relevance (str): This column indicates whether the recommended item is actually relevant to the user or not.
-        """
-
-        self.train_df = train_df.select(col_user, col_item)
-        self.col_user = col_user
-        self.col_item = col_item
-        self.sim_col = "sim"
-        self.df_cosine_similariy = None
-        self.df_user_item_serendipity = None
-        self.df_user_serendipity = None
-        self.df_serendipity = None
-        self.df_item_novelty = None
-        self.df_user_novelty = None
-        self.df_novelty = None
-        self.df_intralist_similarity = None
-        self.df_user_diversity = None
-        self.df_diversity = None
-
-        if col_relevance is None:
-            self.col_relevance = "relevance"
-            # relevance term, default is 1 (relevent) for all
-            self.reco_df = reco_df.select(
-                col_user, col_item, F.lit(1.0).alias(self.col_relevance)
-            )
-        else:
-            self.col_relevance = col_relevance
-            self.reco_df = reco_df.select(
-                col_user, col_item, F.col(self.col_relevance).cast(DoubleType())
-            )
-
-        # check if reco_df contain any user_item pairs that are already shown train_df
-        count_intersection = (
-            self.train_df.select(self.col_user, self.col_item)
-            .intersect(self.reco_df.select(self.col_user, self.col_item))
-            .count()
-        )
-
-        if count_intersection != 0:
-            raise Exception(
-                "reco_df should not contain any user_item pairs that are already shown train_df"
-            )
-
-    def _get_all_user_item_pairs(self, df):
-        return (
-            df.select(self.col_user)
-            .distinct()
-            .join(df.select(self.col_item).distinct())
-        )
-
-    def _get_pairwise_items(self, df):
-        return (
-            df.select(self.col_user, F.col(self.col_item).alias("i1"))
-            # get pairwise combinations of items per user (ignoring duplicate pairs [1,2] == [2,1])
-            .join(
-                df.select(
-                    F.col(self.col_user).alias("_user"),
-                    F.col(self.col_item).alias("i2"),
-                ),
-                (F.col(self.col_user) == F.col("_user")) & (F.col("i1") <= F.col("i2")),
-            ).select(self.col_user, "i1", "i2")
-        )
-
-    def _get_cosine_similarity(self, n_partitions=200):
-        if self.df_cosine_similariy is None:
-            pairs = self._get_pairwise_items(df=self.train_df)
-            item_count = self.train_df.groupBy(self.col_item).count()
-
-            self.df_cosine_similariy = (
-                pairs.groupBy("i1", "i2")
-                .count()
-                .join(
-                    item_count.select(
-                        F.col(self.col_item).alias("i1"),
-                        F.pow(F.col("count"), 0.5).alias("i1_sqrt_count"),
-                    ),
-                    on="i1",
-                )
-                .join(
-                    item_count.select(
-                        F.col(self.col_item).alias("i2"),
-                        F.pow(F.col("count"), 0.5).alias("i2_sqrt_count"),
-                    ),
-                    on="i2",
-                )
-                .select(
-                    "i1",
-                    "i2",
-                    (
-                        F.col("count")
-                        / (F.col("i1_sqrt_count") * F.col("i2_sqrt_count"))
-                    ).alias("sim"),
-                )
-                .repartition(n_partitions, "i1", "i2")
-                .sortWithinPartitions("i1", "i2")
-            )
-        return self.df_cosine_similariy
-
-    # diversity metrics
-    def _get_intralist_similarity(self, df):
-        if self.df_intralist_similarity is None:
-            pairs = self._get_pairwise_items(df=df)
-            similarity_df = self._get_cosine_similarity().orderBy("i1", "i2")
-            self.df_intralist_similarity = (
-                pairs.join(similarity_df, on=["i1", "i2"], how="left")
-                .fillna(
-                    0
-                )  # Fillna(0) is needed in the cases where similarity_df does not have an entry for a pair of items. e.g. i1 and i2 have never occurred together.
-                .filter(F.col("i1") != F.col("i2"))
-                .groupBy(self.col_user)
-                .agg(F.mean(self.sim_col).alias("avg_il_sim"))
-                .select(self.col_user, "avg_il_sim")
-            )
-        return self.df_intralist_similarity
-
-    def user_diversity(self):
-        """Calculate average diversity for recommendations for each user.
-
-        The metric definition is based on formula (3) in the following reference:
-            - Y.C. Zhang, D.Ó. Séaghdha, D. Quercia and T. Jambor, Auralist: introducing serendipity into music recommendation, WSDM 2012
-
-        Returns:
-            pyspark.sql.dataframe.DataFrame: A dataframe with following columns: col_user, user_diversity.
-        """
-        if self.df_user_diversity is None:
-            self.df_intralist_similarity = self._get_intralist_similarity(self.reco_df)
-            self.df_user_diversity = (
-                self.df_intralist_similarity.withColumn(
-                    "user_diversity", 1 - F.col("avg_il_sim")
-                )
-                .select(self.col_user, "user_diversity")
-                .orderBy(self.col_user)
-            )
-        return self.df_user_diversity
-
-    def diversity(self):
-        """Calculate average diversity for recommendations across all users.
-
-        Returns:
-            pyspark.sql.dataframe.DataFrame: A dataframe with following columns: diversity.
-        """
-        if self.df_diversity is None:
-            self.df_user_diversity = self.user_diversity()
-            self.df_diversity = self.df_user_diversity.select(
-                F.mean("user_diversity").alias("diversity")
-            )
-        return self.df_diversity
-
-    # novelty metrics
-    def item_novelty(self):
-        """Calculate novelty for each item in the recommendations.
-
-        The metric definition is based on following reference:
-              - P. Castells, S. Vargas, and J. Wang, Novelty and diversity metrics for recommender systems: choice, discovery and relevance, ECIR 2011
-              - Eugene Yan, Serendipity: Accuracy’s unpopular best friend in Recommender Systems, eugeneyan.com, April 2020
-
-        Returns:
-            pyspark.sql.dataframe.DataFrame: A dataframe with following columns: col_item, item_novelty.
-        """
-        if self.df_item_novelty is None:
-            train_pairs = self._get_all_user_item_pairs(df=self.train_df)
-            self.df_item_novelty = (
-                train_pairs.join(
-                    self.train_df.withColumn("seen", F.lit(1)),
-                    on=[self.col_user, self.col_item],
-                    how="left",
-                )
-                .filter(F.col("seen").isNull())
-                .groupBy(self.col_item)
-                .count()
-                .join(
-                    self.reco_df.groupBy(self.col_item).agg(
-                        F.count(self.col_user).alias("reco_count")
-                    ),
-                    on=self.col_item,
-                )
-                .withColumn(
-                    "item_novelty", -F.log2(F.col("reco_count") / F.col("count"))
-                )
-                .select(self.col_item, "item_novelty")
-                .orderBy(self.col_item)
-            )
-        return self.df_item_novelty
-
-    def user_novelty(self):
-        """Calculate average item novelty for each user's recommendations.
-
-        Returns:
-            pyspark.sql.dataframe.DataFrame: A dataframe with following columns: col_user, user_novelty.
-        """
-        if self.df_user_novelty is None:
-            self.df_item_novelty = self.item_novelty()
-            self.df_user_novelty = (
-                self.reco_df.join(self.df_item_novelty, on=self.col_item)
-                .groupBy(self.col_user)
-                .agg(F.mean("item_novelty").alias("user_novelty"))
-                .orderBy(self.col_user)
-            )
-        return self.df_user_novelty
-
-    def novelty(self):
-        """Calculate average novelty for recommendations across all users.
-
-        Returns:
-            pyspark.sql.dataframe.DataFrame: A dataframe with following columns: novelty.
-        """
-        if self.df_novelty is None:
-            self.df_user_novelty = self.user_novelty()
-            self.df_novelty = self.df_user_novelty.agg(
-                F.mean("user_novelty").alias("novelty")
-            )
-        return self.df_novelty
-
-    # serendipity metrics
-    def user_item_serendipity(self):
-        """Calculate serendipity of each item in the recommendations for each user.
-
-        The metric definition is based on following reference:
-            - Y.C. Zhang, D.Ó. Séaghdha, D. Quercia and T. Jambor, Auralist: introducing serendipity into music recommendation, WSDM 2012
-            - Eugene Yan, Serendipity: Accuracy’s unpopular best friend in Recommender Systems, eugeneyan.com, April 2020
-
-        Returns:
-            pyspark.sql.dataframe.DataFrame: A dataframe with following columns: col_user, col_item, user_item_serendipity.
-        """
-        # for every col_user, col_item in reco_df, join all interacted items from train_df.
-        # These interacted items are repeated for each item in reco_df for a specific user.
-        if self.df_user_item_serendipity is None:
-            self.df_cosine_similariy = self._get_cosine_similarity().orderBy("i1", "i2")
-            self.df_user_item_serendipity = (
-                self.reco_df.select(
-                    self.col_user,
-                    self.col_item,
-                    F.col(self.col_item).alias(
-                        "reco_item_tmp"
-                    ),  # duplicate col_item to keep
-                )
-                .join(
-                    self.train_df.select(
-                        self.col_user, F.col(self.col_item).alias("train_item_tmp")
-                    ),
-                    on=[self.col_user],
-                )
-                .select(
-                    self.col_user,
-                    self.col_item,
-                    F.least(F.col("reco_item_tmp"), F.col("train_item_tmp")).alias(
-                        "i1"
-                    ),
-                    F.greatest(F.col("reco_item_tmp"), F.col("train_item_tmp")).alias(
-                        "i2"
-                    ),
-                )
-                .join(self.df_cosine_similariy, on=["i1", "i2"], how="left")
-                .fillna(0)
-                .groupBy(self.col_user, self.col_item)
-                .agg(F.mean(self.sim_col).alias("avg_item2interactedHistory_sim"))
-                .join(self.reco_df, on=[self.col_user, self.col_item])
-                .withColumn(
-                    "user_item_serendipity",
-                    (1 - F.col("avg_item2interactedHistory_sim"))
-                    * F.col(self.col_relevance),
-                )
-                .select(self.col_user, self.col_item, "user_item_serendipity")
-                .orderBy(self.col_user, self.col_item)
-            )
-        return self.df_user_item_serendipity
-
-    def user_serendipity(self):
-        """Calculate average serendipity for each user's recommendations.
-
-        Returns:
-            pyspark.sql.dataframe.DataFrame: A dataframe with following columns: col_user, user_serendipity.
-        """
-        if self.df_user_serendipity is None:
-            self.df_user_item_serendipity = self.user_item_serendipity()
-            self.df_user_serendipity = (
-                self.df_user_item_serendipity.groupBy(self.col_user)
-                .agg(F.mean("user_item_serendipity").alias("user_serendipity"))
-                .orderBy(self.col_user)
-            )
-        return self.df_user_serendipity
-
-    def serendipity(self):
-        """Calculate average serentipity for recommendations across all users.
-
-        Returns:
-            pyspark.sql.dataframe.DataFrame: A dataframe with following columns: serendipity.
-        """
-        if self.df_serendipity is None:
-            self.df_user_serendipity = self.user_serendipity()
-            self.df_serendipity = self.df_user_serendipity.agg(
-                F.mean("user_serendipity").alias("serendipity")
-            )
-        return self.df_serendipity
-
-    # coverage metrics
-    def catalog_coverage(self):
-        """Calculate catalog coverage for recommendations across all users.
-
-        The metric definition is based on the "catalog coverage" definition in the following reference:
-            - G. Shani and A. Gunawardana, Evaluating Recommendation Systems, Recommender Systems Handbook pp. 257-297, 2010.
-
-        Returns:
-            float: catalog coverage
-        """
-        # distinct item count in reco_df
-        count_distinct_item_reco = self.reco_df.select(self.col_item).distinct().count()
-        # distinct item count in train_df
-        count_distinct_item_train = (
-            self.train_df.select(self.col_item).distinct().count()
-        )
-
-        # cagalog coverage
-        c_coverage = count_distinct_item_reco / count_distinct_item_train
-        return c_coverage
-
-    def distributional_coverage(self):
-        """Calculate distributional coverage for recommendations across all users.
-
-        The metric definition is based on formula (21) in the following reference:
-            - G. Shani and A. Gunawardana, Evaluating Recommendation Systems, Recommender Systems Handbook pp. 257-297, 2010.
-
-        Returns:
-            float: distributional coverage
-        """
-        # In reco_df, how  many times each col_item is being recommended
-        df_itemcnt_reco = self.reco_df.groupBy(self.col_item).count()
-
-        # the number of total recommendations
-        count_row_reco = self.reco_df.count()
-        df_entropy = df_itemcnt_reco.withColumn(
-            "p(i)", F.col("count") / count_row_reco
-        ).withColumn("entropy(i)", F.col("p(i)") * F.log2(F.col("p(i)")))
-        # distributional coverage
-        d_coverage = -df_entropy.agg(F.sum("entropy(i)")).collect()[0][0]
-
-        return d_coverage