Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Meta-rules implementation #1033

Closed
nicl-nno opened this issue Jan 31, 2023 · 2 comments · Fixed by #1057
Closed

Meta-rules implementation #1033

nicl-nno opened this issue Jan 31, 2023 · 2 comments · Fixed by #1057
Assignees
Labels
architecture (re)design of existing or new framework subsystem enhancement New feature or request

Comments

@nicl-nno
Copy link
Collaborator

Some meta-rules should be implemented to make FEDOT more smart:

Case 1: make number of CV folds dependent from the dataset size (e.g. only one fold for the less than X rows)

In the architesture, the adding of new meta-rules should be implemented.

@nicl-nno nicl-nno added enhancement New feature or request architecture (re)design of existing or new framework subsystem labels Jan 31, 2023
@gkirgizov
Copy link
Collaborator

Тут важно определить,, от чего в принципе могут зависить адаптивные параметры. InputData и все?
Можно определить такую сигнатуру правила: ParameterRule = [GraphRequirements, InputData] -> GraphRequirements. То есть правила меняют параметры в соответствии с их заданным значением и какими-то характеристикам переданных данных. Кажется, этого достаточно.
Далее:

  • где-то будет статично задаваться список таких функций-правил для адаптивных параметров
  • они будут прогоняться по GraphRequirements перед запуском опимизатора и менять их

Предлагаю также накидать еще парочку правил-кандидатов, наверняка о чем-то таком еще думали или где-то есть уже сущестующая полу-адаптивная логика изменения параметров перед началом. Что-о с таймаутами мб.

@MorrisNein
Copy link
Collaborator

MorrisNein commented Feb 7, 2023

Схожая идея реализована в autosklearn 2.0. Там на основании размера датасета и кол-ва признаков выбирается кол-во фолдов (и ещё один параметр, который для нас сейчас не актуален).

В общем случае полезно бы учитывать:

  • мета-признаки InputData;

  • входные параметры оптимизатора;

  • доступные вычислительные ресурсы (обсуждаемо).

Идеи возможных мета-правил:

  • выбор числа фолдов в одном месте, не просто правило 1-много;

  • на пухлых датасетах ИЛИ с заведомо малым числом вычислительных ресурсов: 1) использовать только лёгкие модели, 2) уменьшать размер поколения (спорно), 3) сообщать пользователю о нехватке ресурсов.

@maypink maypink self-assigned this Feb 21, 2023
@maypink maypink linked a pull request Feb 26, 2023 that will close this issue
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
architecture (re)design of existing or new framework subsystem enhancement New feature or request
Projects
None yet
Development

Successfully merging a pull request may close this issue.

4 participants