python -m pobax.algos.ppo_no_jit_env --env hopper --action_concat --lr 0.0025 --lambda0 0.1 --lambda1 0.95 --alpha 1 --ld_weight 0 --hidden_size 128 --entropy_coeff 0.01 --steps_log_freq 8 --update_log_freq 10 --total_steps 5000000 --seed 2024 --platform gpu --debug --study_name hopper_ppo
python -m pobax.algos.ppo_no_jit_env --env hopper --action_concat --lr 0.0025 --lambda0 0.1 --lambda1 0.95 --alpha 1 --ld_weight 0 --hidden_size 128 --entropy_coeff 0.01 --steps_log_freq 8 --update_log_freq 10 --total_steps 5000000 --seed 2025 --platform gpu --debug --study_name hopper_ppo
python -m pobax.algos.ppo_no_jit_env --env hopper --action_concat --lr 0.0025 --lambda0 0.1 --lambda1 0.95 --alpha 1 --ld_weight 0 --hidden_size 128 --entropy_coeff 0.01 --steps_log_freq 8 --update_log_freq 10 --total_steps 5000000 --seed 2026 --platform gpu --debug --study_name hopper_ppo
python -m pobax.algos.ppo_no_jit_env --env hopper --action_concat --lr 0.0025 --lambda0 0.5 --lambda1 0.95 --alpha 1 --ld_weight 0 --hidden_size 128 --entropy_coeff 0.01 --steps_log_freq 8 --update_log_freq 10 --total_steps 5000000 --seed 2024 --platform gpu --debug --study_name hopper_ppo
python -m pobax.algos.ppo_no_jit_env --env hopper --action_concat --lr 0.0025 --lambda0 0.5 --lambda1 0.95 --alpha 1 --ld_weight 0 --hidden_size 128 --entropy_coeff 0.01 --steps_log_freq 8 --update_log_freq 10 --total_steps 5000000 --seed 2025 --platform gpu --debug --study_name hopper_ppo
python -m pobax.algos.ppo_no_jit_env --env hopper --action_concat --lr 0.0025 --lambda0 0.5 --lambda1 0.95 --alpha 1 --ld_weight 0 --hidden_size 128 --entropy_coeff 0.01 --steps_log_freq 8 --update_log_freq 10 --total_steps 5000000 --seed 2026 --platform gpu --debug --study_name hopper_ppo
python -m pobax.algos.ppo_no_jit_env --env hopper --action_concat --lr 0.0025 --lambda0 0.7 --lambda1 0.95 --alpha 1 --ld_weight 0 --hidden_size 128 --entropy_coeff 0.01 --steps_log_freq 8 --update_log_freq 10 --total_steps 5000000 --seed 2024 --platform gpu --debug --study_name hopper_ppo
python -m pobax.algos.ppo_no_jit_env --env hopper --action_concat --lr 0.0025 --lambda0 0.7 --lambda1 0.95 --alpha 1 --ld_weight 0 --hidden_size 128 --entropy_coeff 0.01 --steps_log_freq 8 --update_log_freq 10 --total_steps 5000000 --seed 2025 --platform gpu --debug --study_name hopper_ppo
python -m pobax.algos.ppo_no_jit_env --env hopper --action_concat --lr 0.0025 --lambda0 0.7 --lambda1 0.95 --alpha 1 --ld_weight 0 --hidden_size 128 --entropy_coeff 0.01 --steps_log_freq 8 --update_log_freq 10 --total_steps 5000000 --seed 2026 --platform gpu --debug --study_name hopper_ppo
python -m pobax.algos.ppo_no_jit_env --env hopper --action_concat --lr 0.0025 --lambda0 0.9 --lambda1 0.95 --alpha 1 --ld_weight 0 --hidden_size 128 --entropy_coeff 0.01 --steps_log_freq 8 --update_log_freq 10 --total_steps 5000000 --seed 2024 --platform gpu --debug --study_name hopper_ppo
python -m pobax.algos.ppo_no_jit_env --env hopper --action_concat --lr 0.0025 --lambda0 0.9 --lambda1 0.95 --alpha 1 --ld_weight 0 --hidden_size 128 --entropy_coeff 0.01 --steps_log_freq 8 --update_log_freq 10 --total_steps 5000000 --seed 2025 --platform gpu --debug --study_name hopper_ppo
python -m pobax.algos.ppo_no_jit_env --env hopper --action_concat --lr 0.0025 --lambda0 0.9 --lambda1 0.95 --alpha 1 --ld_weight 0 --hidden_size 128 --entropy_coeff 0.01 --steps_log_freq 8 --update_log_freq 10 --total_steps 5000000 --seed 2026 --platform gpu --debug --study_name hopper_ppo
python -m pobax.algos.ppo_no_jit_env --env hopper --action_concat --lr 0.0025 --lambda0 0.95 --lambda1 0.95 --alpha 1 --ld_weight 0 --hidden_size 128 --entropy_coeff 0.01 --steps_log_freq 8 --update_log_freq 10 --total_steps 5000000 --seed 2024 --platform gpu --debug --study_name hopper_ppo
python -m pobax.algos.ppo_no_jit_env --env hopper --action_concat --lr 0.0025 --lambda0 0.95 --lambda1 0.95 --alpha 1 --ld_weight 0 --hidden_size 128 --entropy_coeff 0.01 --steps_log_freq 8 --update_log_freq 10 --total_steps 5000000 --seed 2025 --platform gpu --debug --study_name hopper_ppo
python -m pobax.algos.ppo_no_jit_env --env hopper --action_concat --lr 0.0025 --lambda0 0.95 --lambda1 0.95 --alpha 1 --ld_weight 0 --hidden_size 128 --entropy_coeff 0.01 --steps_log_freq 8 --update_log_freq 10 --total_steps 5000000 --seed 2026 --platform gpu --debug --study_name hopper_ppo
python -m pobax.algos.ppo_no_jit_env --env hopper --action_concat --lr 0.00025 --lambda0 0.1 --lambda1 0.95 --alpha 1 --ld_weight 0 --hidden_size 128 --entropy_coeff 0.01 --steps_log_freq 8 --update_log_freq 10 --total_steps 5000000 --seed 2024 --platform gpu --debug --study_name hopper_ppo
python -m pobax.algos.ppo_no_jit_env --env hopper --action_concat --lr 0.00025 --lambda0 0.1 --lambda1 0.95 --alpha 1 --ld_weight 0 --hidden_size 128 --entropy_coeff 0.01 --steps_log_freq 8 --update_log_freq 10 --total_steps 5000000 --seed 2025 --platform gpu --debug --study_name hopper_ppo
python -m pobax.algos.ppo_no_jit_env --env hopper --action_concat --lr 0.00025 --lambda0 0.1 --lambda1 0.95 --alpha 1 --ld_weight 0 --hidden_size 128 --entropy_coeff 0.01 --steps_log_freq 8 --update_log_freq 10 --total_steps 5000000 --seed 2026 --platform gpu --debug --study_name hopper_ppo
python -m pobax.algos.ppo_no_jit_env --env hopper --action_concat --lr 0.00025 --lambda0 0.5 --lambda1 0.95 --alpha 1 --ld_weight 0 --hidden_size 128 --entropy_coeff 0.01 --steps_log_freq 8 --update_log_freq 10 --total_steps 5000000 --seed 2024 --platform gpu --debug --study_name hopper_ppo
python -m pobax.algos.ppo_no_jit_env --env hopper --action_concat --lr 0.00025 --lambda0 0.5 --lambda1 0.95 --alpha 1 --ld_weight 0 --hidden_size 128 --entropy_coeff 0.01 --steps_log_freq 8 --update_log_freq 10 --total_steps 5000000 --seed 2025 --platform gpu --debug --study_name hopper_ppo
python -m pobax.algos.ppo_no_jit_env --env hopper --action_concat --lr 0.00025 --lambda0 0.5 --lambda1 0.95 --alpha 1 --ld_weight 0 --hidden_size 128 --entropy_coeff 0.01 --steps_log_freq 8 --update_log_freq 10 --total_steps 5000000 --seed 2026 --platform gpu --debug --study_name hopper_ppo
python -m pobax.algos.ppo_no_jit_env --env hopper --action_concat --lr 0.00025 --lambda0 0.7 --lambda1 0.95 --alpha 1 --ld_weight 0 --hidden_size 128 --entropy_coeff 0.01 --steps_log_freq 8 --update_log_freq 10 --total_steps 5000000 --seed 2024 --platform gpu --debug --study_name hopper_ppo
python -m pobax.algos.ppo_no_jit_env --env hopper --action_concat --lr 0.00025 --lambda0 0.7 --lambda1 0.95 --alpha 1 --ld_weight 0 --hidden_size 128 --entropy_coeff 0.01 --steps_log_freq 8 --update_log_freq 10 --total_steps 5000000 --seed 2025 --platform gpu --debug --study_name hopper_ppo
python -m pobax.algos.ppo_no_jit_env --env hopper --action_concat --lr 0.00025 --lambda0 0.7 --lambda1 0.95 --alpha 1 --ld_weight 0 --hidden_size 128 --entropy_coeff 0.01 --steps_log_freq 8 --update_log_freq 10 --total_steps 5000000 --seed 2026 --platform gpu --debug --study_name hopper_ppo
python -m pobax.algos.ppo_no_jit_env --env hopper --action_concat --lr 0.00025 --lambda0 0.9 --lambda1 0.95 --alpha 1 --ld_weight 0 --hidden_size 128 --entropy_coeff 0.01 --steps_log_freq 8 --update_log_freq 10 --total_steps 5000000 --seed 2024 --platform gpu --debug --study_name hopper_ppo
python -m pobax.algos.ppo_no_jit_env --env hopper --action_concat --lr 0.00025 --lambda0 0.9 --lambda1 0.95 --alpha 1 --ld_weight 0 --hidden_size 128 --entropy_coeff 0.01 --steps_log_freq 8 --update_log_freq 10 --total_steps 5000000 --seed 2025 --platform gpu --debug --study_name hopper_ppo
python -m pobax.algos.ppo_no_jit_env --env hopper --action_concat --lr 0.00025 --lambda0 0.9 --lambda1 0.95 --alpha 1 --ld_weight 0 --hidden_size 128 --entropy_coeff 0.01 --steps_log_freq 8 --update_log_freq 10 --total_steps 5000000 --seed 2026 --platform gpu --debug --study_name hopper_ppo
python -m pobax.algos.ppo_no_jit_env --env hopper --action_concat --lr 0.00025 --lambda0 0.95 --lambda1 0.95 --alpha 1 --ld_weight 0 --hidden_size 128 --entropy_coeff 0.01 --steps_log_freq 8 --update_log_freq 10 --total_steps 5000000 --seed 2024 --platform gpu --debug --study_name hopper_ppo
python -m pobax.algos.ppo_no_jit_env --env hopper --action_concat --lr 0.00025 --lambda0 0.95 --lambda1 0.95 --alpha 1 --ld_weight 0 --hidden_size 128 --entropy_coeff 0.01 --steps_log_freq 8 --update_log_freq 10 --total_steps 5000000 --seed 2025 --platform gpu --debug --study_name hopper_ppo
python -m pobax.algos.ppo_no_jit_env --env hopper --action_concat --lr 0.00025 --lambda0 0.95 --lambda1 0.95 --alpha 1 --ld_weight 0 --hidden_size 128 --entropy_coeff 0.01 --steps_log_freq 8 --update_log_freq 10 --total_steps 5000000 --seed 2026 --platform gpu --debug --study_name hopper_ppo
python -m pobax.algos.ppo_no_jit_env --env hopper --action_concat --lr 2.5e-05 --lambda0 0.1 --lambda1 0.95 --alpha 1 --ld_weight 0 --hidden_size 128 --entropy_coeff 0.01 --steps_log_freq 8 --update_log_freq 10 --total_steps 5000000 --seed 2024 --platform gpu --debug --study_name hopper_ppo
python -m pobax.algos.ppo_no_jit_env --env hopper --action_concat --lr 2.5e-05 --lambda0 0.1 --lambda1 0.95 --alpha 1 --ld_weight 0 --hidden_size 128 --entropy_coeff 0.01 --steps_log_freq 8 --update_log_freq 10 --total_steps 5000000 --seed 2025 --platform gpu --debug --study_name hopper_ppo
python -m pobax.algos.ppo_no_jit_env --env hopper --action_concat --lr 2.5e-05 --lambda0 0.1 --lambda1 0.95 --alpha 1 --ld_weight 0 --hidden_size 128 --entropy_coeff 0.01 --steps_log_freq 8 --update_log_freq 10 --total_steps 5000000 --seed 2026 --platform gpu --debug --study_name hopper_ppo
python -m pobax.algos.ppo_no_jit_env --env hopper --action_concat --lr 2.5e-05 --lambda0 0.5 --lambda1 0.95 --alpha 1 --ld_weight 0 --hidden_size 128 --entropy_coeff 0.01 --steps_log_freq 8 --update_log_freq 10 --total_steps 5000000 --seed 2024 --platform gpu --debug --study_name hopper_ppo
python -m pobax.algos.ppo_no_jit_env --env hopper --action_concat --lr 2.5e-05 --lambda0 0.5 --lambda1 0.95 --alpha 1 --ld_weight 0 --hidden_size 128 --entropy_coeff 0.01 --steps_log_freq 8 --update_log_freq 10 --total_steps 5000000 --seed 2025 --platform gpu --debug --study_name hopper_ppo
python -m pobax.algos.ppo_no_jit_env --env hopper --action_concat --lr 2.5e-05 --lambda0 0.5 --lambda1 0.95 --alpha 1 --ld_weight 0 --hidden_size 128 --entropy_coeff 0.01 --steps_log_freq 8 --update_log_freq 10 --total_steps 5000000 --seed 2026 --platform gpu --debug --study_name hopper_ppo
python -m pobax.algos.ppo_no_jit_env --env hopper --action_concat --lr 2.5e-05 --lambda0 0.7 --lambda1 0.95 --alpha 1 --ld_weight 0 --hidden_size 128 --entropy_coeff 0.01 --steps_log_freq 8 --update_log_freq 10 --total_steps 5000000 --seed 2024 --platform gpu --debug --study_name hopper_ppo
python -m pobax.algos.ppo_no_jit_env --env hopper --action_concat --lr 2.5e-05 --lambda0 0.7 --lambda1 0.95 --alpha 1 --ld_weight 0 --hidden_size 128 --entropy_coeff 0.01 --steps_log_freq 8 --update_log_freq 10 --total_steps 5000000 --seed 2025 --platform gpu --debug --study_name hopper_ppo
python -m pobax.algos.ppo_no_jit_env --env hopper --action_concat --lr 2.5e-05 --lambda0 0.7 --lambda1 0.95 --alpha 1 --ld_weight 0 --hidden_size 128 --entropy_coeff 0.01 --steps_log_freq 8 --update_log_freq 10 --total_steps 5000000 --seed 2026 --platform gpu --debug --study_name hopper_ppo
python -m pobax.algos.ppo_no_jit_env --env hopper --action_concat --lr 2.5e-05 --lambda0 0.9 --lambda1 0.95 --alpha 1 --ld_weight 0 --hidden_size 128 --entropy_coeff 0.01 --steps_log_freq 8 --update_log_freq 10 --total_steps 5000000 --seed 2024 --platform gpu --debug --study_name hopper_ppo
python -m pobax.algos.ppo_no_jit_env --env hopper --action_concat --lr 2.5e-05 --lambda0 0.9 --lambda1 0.95 --alpha 1 --ld_weight 0 --hidden_size 128 --entropy_coeff 0.01 --steps_log_freq 8 --update_log_freq 10 --total_steps 5000000 --seed 2025 --platform gpu --debug --study_name hopper_ppo
python -m pobax.algos.ppo_no_jit_env --env hopper --action_concat --lr 2.5e-05 --lambda0 0.9 --lambda1 0.95 --alpha 1 --ld_weight 0 --hidden_size 128 --entropy_coeff 0.01 --steps_log_freq 8 --update_log_freq 10 --total_steps 5000000 --seed 2026 --platform gpu --debug --study_name hopper_ppo
python -m pobax.algos.ppo_no_jit_env --env hopper --action_concat --lr 2.5e-05 --lambda0 0.95 --lambda1 0.95 --alpha 1 --ld_weight 0 --hidden_size 128 --entropy_coeff 0.01 --steps_log_freq 8 --update_log_freq 10 --total_steps 5000000 --seed 2024 --platform gpu --debug --study_name hopper_ppo
python -m pobax.algos.ppo_no_jit_env --env hopper --action_concat --lr 2.5e-05 --lambda0 0.95 --lambda1 0.95 --alpha 1 --ld_weight 0 --hidden_size 128 --entropy_coeff 0.01 --steps_log_freq 8 --update_log_freq 10 --total_steps 5000000 --seed 2025 --platform gpu --debug --study_name hopper_ppo
python -m pobax.algos.ppo_no_jit_env --env hopper --action_concat --lr 2.5e-05 --lambda0 0.95 --lambda1 0.95 --alpha 1 --ld_weight 0 --hidden_size 128 --entropy_coeff 0.01 --steps_log_freq 8 --update_log_freq 10 --total_steps 5000000 --seed 2026 --platform gpu --debug --study_name hopper_ppo
python -m pobax.algos.ppo_no_jit_env --env hopper --action_concat --lr 2.5e-06 --lambda0 0.1 --lambda1 0.95 --alpha 1 --ld_weight 0 --hidden_size 128 --entropy_coeff 0.01 --steps_log_freq 8 --update_log_freq 10 --total_steps 5000000 --seed 2024 --platform gpu --debug --study_name hopper_ppo
python -m pobax.algos.ppo_no_jit_env --env hopper --action_concat --lr 2.5e-06 --lambda0 0.1 --lambda1 0.95 --alpha 1 --ld_weight 0 --hidden_size 128 --entropy_coeff 0.01 --steps_log_freq 8 --update_log_freq 10 --total_steps 5000000 --seed 2025 --platform gpu --debug --study_name hopper_ppo
python -m pobax.algos.ppo_no_jit_env --env hopper --action_concat --lr 2.5e-06 --lambda0 0.1 --lambda1 0.95 --alpha 1 --ld_weight 0 --hidden_size 128 --entropy_coeff 0.01 --steps_log_freq 8 --update_log_freq 10 --total_steps 5000000 --seed 2026 --platform gpu --debug --study_name hopper_ppo
python -m pobax.algos.ppo_no_jit_env --env hopper --action_concat --lr 2.5e-06 --lambda0 0.5 --lambda1 0.95 --alpha 1 --ld_weight 0 --hidden_size 128 --entropy_coeff 0.01 --steps_log_freq 8 --update_log_freq 10 --total_steps 5000000 --seed 2024 --platform gpu --debug --study_name hopper_ppo
python -m pobax.algos.ppo_no_jit_env --env hopper --action_concat --lr 2.5e-06 --lambda0 0.5 --lambda1 0.95 --alpha 1 --ld_weight 0 --hidden_size 128 --entropy_coeff 0.01 --steps_log_freq 8 --update_log_freq 10 --total_steps 5000000 --seed 2025 --platform gpu --debug --study_name hopper_ppo
python -m pobax.algos.ppo_no_jit_env --env hopper --action_concat --lr 2.5e-06 --lambda0 0.5 --lambda1 0.95 --alpha 1 --ld_weight 0 --hidden_size 128 --entropy_coeff 0.01 --steps_log_freq 8 --update_log_freq 10 --total_steps 5000000 --seed 2026 --platform gpu --debug --study_name hopper_ppo
python -m pobax.algos.ppo_no_jit_env --env hopper --action_concat --lr 2.5e-06 --lambda0 0.7 --lambda1 0.95 --alpha 1 --ld_weight 0 --hidden_size 128 --entropy_coeff 0.01 --steps_log_freq 8 --update_log_freq 10 --total_steps 5000000 --seed 2024 --platform gpu --debug --study_name hopper_ppo
python -m pobax.algos.ppo_no_jit_env --env hopper --action_concat --lr 2.5e-06 --lambda0 0.7 --lambda1 0.95 --alpha 1 --ld_weight 0 --hidden_size 128 --entropy_coeff 0.01 --steps_log_freq 8 --update_log_freq 10 --total_steps 5000000 --seed 2025 --platform gpu --debug --study_name hopper_ppo
python -m pobax.algos.ppo_no_jit_env --env hopper --action_concat --lr 2.5e-06 --lambda0 0.7 --lambda1 0.95 --alpha 1 --ld_weight 0 --hidden_size 128 --entropy_coeff 0.01 --steps_log_freq 8 --update_log_freq 10 --total_steps 5000000 --seed 2026 --platform gpu --debug --study_name hopper_ppo
python -m pobax.algos.ppo_no_jit_env --env hopper --action_concat --lr 2.5e-06 --lambda0 0.9 --lambda1 0.95 --alpha 1 --ld_weight 0 --hidden_size 128 --entropy_coeff 0.01 --steps_log_freq 8 --update_log_freq 10 --total_steps 5000000 --seed 2024 --platform gpu --debug --study_name hopper_ppo
python -m pobax.algos.ppo_no_jit_env --env hopper --action_concat --lr 2.5e-06 --lambda0 0.9 --lambda1 0.95 --alpha 1 --ld_weight 0 --hidden_size 128 --entropy_coeff 0.01 --steps_log_freq 8 --update_log_freq 10 --total_steps 5000000 --seed 2025 --platform gpu --debug --study_name hopper_ppo
python -m pobax.algos.ppo_no_jit_env --env hopper --action_concat --lr 2.5e-06 --lambda0 0.9 --lambda1 0.95 --alpha 1 --ld_weight 0 --hidden_size 128 --entropy_coeff 0.01 --steps_log_freq 8 --update_log_freq 10 --total_steps 5000000 --seed 2026 --platform gpu --debug --study_name hopper_ppo
python -m pobax.algos.ppo_no_jit_env --env hopper --action_concat --lr 2.5e-06 --lambda0 0.95 --lambda1 0.95 --alpha 1 --ld_weight 0 --hidden_size 128 --entropy_coeff 0.01 --steps_log_freq 8 --update_log_freq 10 --total_steps 5000000 --seed 2024 --platform gpu --debug --study_name hopper_ppo
python -m pobax.algos.ppo_no_jit_env --env hopper --action_concat --lr 2.5e-06 --lambda0 0.95 --lambda1 0.95 --alpha 1 --ld_weight 0 --hidden_size 128 --entropy_coeff 0.01 --steps_log_freq 8 --update_log_freq 10 --total_steps 5000000 --seed 2025 --platform gpu --debug --study_name hopper_ppo
python -m pobax.algos.ppo_no_jit_env --env hopper --action_concat --lr 2.5e-06 --lambda0 0.95 --lambda1 0.95 --alpha 1 --ld_weight 0 --hidden_size 128 --entropy_coeff 0.01 --steps_log_freq 8 --update_log_freq 10 --total_steps 5000000 --seed 2026 --platform gpu --debug --study_name hopper_ppo
