-
Notifications
You must be signed in to change notification settings - Fork 0
/
Copy pathalg_flags.py
49 lines (46 loc) · 1.94 KB
/
alg_flags.py
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
import importlib
from args import add_argument, add_derivation, FLAGS, PARSER, apply_derivations
add_argument('--restore', False, type=bool)
add_argument('--grad_summary', False, type=bool)
add_argument('--print_discounted', True, type=bool)
add_argument('--use_avg', False, type=bool)
add_argument('--print_avg', False, type=bool)
add_argument('--render', False, type=bool)
add_argument('--episode_len', 800, type=int)
add_argument('--save_rate', 1000, type=int)
add_argument('--logdir', 'summaries')
add_argument('--gamma', 0.8, type=float)
add_argument('--learning_rate', 0.00025, type=float)
add_argument('--summary_rate', 10, type=int)
add_argument('--validate_rate', 20, type=int)
add_argument('--trainer', "qlearn")
add_argument('--exploration', "e_greedy")
add_argument('--batch_size', 30, type=int)
add_argument('--vis_size', 200, type=int)
add_argument('--mode', 'train')
add_argument('--spacing', 3, type=int)
add_argument('--start_eps', 0.8, type=float)
add_argument('--end_eps', 0.08, type=float)
add_argument('--start_temp', 500.0, type=float)
add_argument('--end_temp', 1.0, type=float)
add_argument('--annealing_episodes', 20000, type=float)
add_argument('--history', 1, type=int)
add_argument('--target_update_rate', 10, type=int)
add_argument('--buffer_size', 10000, type=int)
add_argument('--trace_size', 8, type=int)
add_argument('--threads', 4, type=int)
add_argument('--lam', 1, type=float)
add_argument('--debug', False, type=bool)
add_argument('--train_rate', 1, type=int)
add_argument('--total_episodes', None, type=int)
add_argument('--best_threshold', 30.0, type=float)
add_argument('--interactive', False, type=bool)
add_argument('--single_agent', False, type=bool)
def std_derivations():
if FLAGS.render: FLAGS.mode = 'validate'
if FLAGS.use_avg: FLAGS.print_avg = True
add_derivation(std_derivations)
def run_alg(env_f):
mod = importlib.import_module("gym_traffic.algorithms."+FLAGS.trainer)
apply_derivations(PARSER)
return mod.run(env_f)