Guaranteed scheduling of critical pods #29023

davidopp · 2016-07-15T18:51:43Z

We want to ensure that pods deemed "critical" (this is not official terminology -- I am just using it in the colloquial English sense) are guaranteed to schedule if there are sufficient resources for them in an "empty" cluster, even if the cluster is non-empty and non-critical pods are currently occupying node resources that the critical pods would need in order to schedule.

Examples of critical pods are infrastructure pods like heapster and DNS.

cc/ @piosz @fgrzadkowski

bhujangr · 2016-07-17T15:23:20Z

Yes this would be a very useful feature i.e. am assuming this is some sort of priorities for pods..

wojtek-t · 2016-07-17T17:23:17Z

We are not going to do the "full pod priority" feature at least for 1.4. The plan is just to have a group of "high priority pods" (probably defined as those with some special label) that would be "critical pods" as defined by @davidopp above.

therc · 2016-07-17T17:33:35Z

For our use case (DaemonSets + heapster + DNS + dashboard + GPU pods), a special label is a good start. We'd be happy to provide early testing and feedback.

krmayankk · 2016-07-18T07:17:45Z

sufficient resources for them in an "empty" cluster, even if the cluster is non-empty
i am confused by this line, it would help to provide a slightly better description of this issue .

@davidopp

Automatic merge from submit-queue [rescheduler] Implemented main control loop ref kubernetes/kubernetes#29023 cc @davidopp @wojtek-t  --- This change is [<img src="https://reviewable.kubernetes.io/review_button.svg" height="34" align="absmiddle" alt="Reviewable"/>](https://reviewable.kubernetes.io/reviews/kubernetes/contrib/1526)

Automatic merge from submit-queue Salt configuration for Rescheduler ref kubernetes#29023

Automatic merge from submit-queue Make DNS and Heapster critical pods ref #29023 ```release-note DNS, Heapster and UI are critical addons ```

Automatic merge from submit-queue e2e test for rescheduling critical pods ref #29023 The test is disabled by default.

Automatic merge from submit-queue [rescheduler] actually wait for pod to be scheduled kubernetes/kubernetes#29023

Automatic merge from submit-queue [rescheduler] added exporting events ref #kubernetes/kubernetes#29023

Automatic merge from submit-queue Enable Rescheduler by default Rescheduler is stable - e2e test is passing constantly for >1week. ref #29023 ```release-note Rescheduler which ensures that critical pods are always scheduled enabled by default in GCE. ```

goltermann · 2016-09-06T20:09:31Z

This is only awaiting docs PR merge.

pwittrock · 2016-09-08T01:23:20Z

@davidopp @piosz

I am moving this out of the blocking issues we are tracking for the 1.4 release because the unfinished pieces are non-blockers for the release and do not need to be tracked in the burndown meetings. If there are components besides docs & tests that need to be completed, please move it back to the 1.4 milestone and provide daily status updates.

piosz · 2016-10-07T11:31:48Z

This is fixed right now.

Automatic merge from submit-queue Rescheduling for critical pods proposal ref #29023

davidopp added priority/important-soon Must be staffed and worked on either currently, or very soon, ideally in time for the next release. sig/scheduling Categorizes an issue or PR as relevant to SIG Scheduling. team/control-plane labels Jul 15, 2016

davidopp added this to the v1.4 milestone Jul 15, 2016

davidopp assigned piosz Jul 15, 2016

This was referenced Jul 19, 2016

Rescheduling for critical pods proposal #29195

Merged

Initial implementation of rescheduler kubernetes-retired/contrib#1419

Merged

This was referenced Aug 9, 2016

Horizontal Scaling RC to scale another controller based on number of cores and nodes kubernetes-sigs/cluster-proportional-autoscaler#2

Closed

[rescheduler] Implemented main control loop kubernetes-retired/contrib#1526

Merged

piosz mentioned this issue Aug 18, 2016

Salt configuration for Rescheduler #30870

Merged

mcluseau pushed a commit to mcluseau/kubernetes that referenced this issue Aug 19, 2016

Merge pull request kubernetes#30870 from piosz/rescheduler-setup

a24df66

Automatic merge from submit-queue Salt configuration for Rescheduler ref kubernetes#29023

piosz mentioned this issue Aug 19, 2016

Make DNS and Heapster critical pods #30995

Merged

k8s-github-robot pushed a commit that referenced this issue Aug 22, 2016

Merge pull request #30995 from piosz/critical-pods

878e06a

Automatic merge from submit-queue Make DNS and Heapster critical pods ref #29023 ```release-note DNS, Heapster and UI are critical addons ```

piosz mentioned this issue Aug 22, 2016

e2e test for rescheduling critical pods #31113

Merged

k8s-github-robot pushed a commit that referenced this issue Aug 22, 2016

Merge pull request #31113 from piosz/rescheduler-e2e

51a9fdb

Automatic merge from submit-queue e2e test for rescheduling critical pods ref #29023 The test is disabled by default.

This was referenced Aug 26, 2016

[rescheduler] actually wait for pod to be scheduled kubernetes-retired/contrib#1630

Merged

[rescheduler] added exporting events kubernetes-retired/contrib#1631

Merged

k8s-github-robot pushed a commit to kubernetes-retired/contrib that referenced this issue Aug 26, 2016

Merge pull request #1630 from piosz/events

3bdca8e

Automatic merge from submit-queue [rescheduler] actually wait for pod to be scheduled kubernetes/kubernetes#29023

k8s-github-robot pushed a commit to kubernetes-retired/contrib that referenced this issue Aug 26, 2016

Merge pull request #1631 from piosz/events2

ba17f80

Automatic merge from submit-queue [rescheduler] added exporting events ref #kubernetes/kubernetes#29023

This was referenced Sep 1, 2016

Add Heapster liveness probe #31878

Merged

Enable Rescheduler by default #31974

Merged

piosz mentioned this issue Sep 6, 2016

Added Rescheduler documentation kubernetes/website#1170

Merged

pwittrock added this to the v1.4-nonblocking milestone Sep 8, 2016

pwittrock removed this from the v1.4 milestone Sep 8, 2016

piosz closed this as completed Oct 7, 2016

k8s-github-robot pushed a commit that referenced this issue Oct 10, 2016

Merge pull request #29195 from piosz/rescheduler-proposal

4bf35b6

Automatic merge from submit-queue Rescheduling for critical pods proposal ref #29023

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Guaranteed scheduling of critical pods #29023

Guaranteed scheduling of critical pods #29023

davidopp commented Jul 15, 2016

bhujangr commented Jul 17, 2016 •

edited

Loading

wojtek-t commented Jul 17, 2016

therc commented Jul 17, 2016

krmayankk commented Jul 18, 2016

goltermann commented Sep 6, 2016

pwittrock commented Sep 8, 2016

piosz commented Oct 7, 2016

Guaranteed scheduling of critical pods #29023

Guaranteed scheduling of critical pods #29023

Comments

davidopp commented Jul 15, 2016

bhujangr commented Jul 17, 2016 • edited Loading

wojtek-t commented Jul 17, 2016

therc commented Jul 17, 2016

krmayankk commented Jul 18, 2016

goltermann commented Sep 6, 2016

pwittrock commented Sep 8, 2016

piosz commented Oct 7, 2016

bhujangr commented Jul 17, 2016 •

edited

Loading