python -m pobax.algos.ppo_no_jit_env --env halfcheetah --double_critic --action_concat --lr 0.0025 --lambda0 0.1 --lambda1 0.1 --alpha 1 --ld_weight 0.125 --hidden_size 512 --entropy_coeff 0.01 --steps_log_freq 8 --update_log_freq 10 --total_steps 5000000 --seed 2024 --platform gpu --debug --study_name halfcheetah_ppo_LD
python -m pobax.algos.ppo_no_jit_env --env halfcheetah --double_critic --action_concat --lr 0.0025 --lambda0 0.1 --lambda1 0.1 --alpha 1 --ld_weight 0.125 --hidden_size 512 --entropy_coeff 0.01 --steps_log_freq 8 --update_log_freq 10 --total_steps 5000000 --seed 2025 --platform gpu --debug --study_name halfcheetah_ppo_LD
python -m pobax.algos.ppo_no_jit_env --env halfcheetah --double_critic --action_concat --lr 0.0025 --lambda0 0.1 --lambda1 0.1 --alpha 1 --ld_weight 0.125 --hidden_size 512 --entropy_coeff 0.01 --steps_log_freq 8 --update_log_freq 10 --total_steps 5000000 --seed 2026 --platform gpu --debug --study_name halfcheetah_ppo_LD
python -m pobax.algos.ppo_no_jit_env --env halfcheetah --double_critic --action_concat --lr 0.0025 --lambda0 0.1 --lambda1 0.1 --alpha 1 --ld_weight 0.5 --hidden_size 512 --entropy_coeff 0.01 --steps_log_freq 8 --update_log_freq 10 --total_steps 5000000 --seed 2024 --platform gpu --debug --study_name halfcheetah_ppo_LD
python -m pobax.algos.ppo_no_jit_env --env halfcheetah --double_critic --action_concat --lr 0.0025 --lambda0 0.1 --lambda1 0.1 --alpha 1 --ld_weight 0.5 --hidden_size 512 --entropy_coeff 0.01 --steps_log_freq 8 --update_log_freq 10 --total_steps 5000000 --seed 2025 --platform gpu --debug --study_name halfcheetah_ppo_LD
python -m pobax.algos.ppo_no_jit_env --env halfcheetah --double_critic --action_concat --lr 0.0025 --lambda0 0.1 --lambda1 0.1 --alpha 1 --ld_weight 0.5 --hidden_size 512 --entropy_coeff 0.01 --steps_log_freq 8 --update_log_freq 10 --total_steps 5000000 --seed 2026 --platform gpu --debug --study_name halfcheetah_ppo_LD
python -m pobax.algos.ppo_no_jit_env --env halfcheetah --double_critic --action_concat --lr 0.0025 --lambda0 0.1 --lambda1 0.95 --alpha 1 --ld_weight 0.125 --hidden_size 512 --entropy_coeff 0.01 --steps_log_freq 8 --update_log_freq 10 --total_steps 5000000 --seed 2024 --platform gpu --debug --study_name halfcheetah_ppo_LD
python -m pobax.algos.ppo_no_jit_env --env halfcheetah --double_critic --action_concat --lr 0.0025 --lambda0 0.1 --lambda1 0.95 --alpha 1 --ld_weight 0.125 --hidden_size 512 --entropy_coeff 0.01 --steps_log_freq 8 --update_log_freq 10 --total_steps 5000000 --seed 2025 --platform gpu --debug --study_name halfcheetah_ppo_LD
python -m pobax.algos.ppo_no_jit_env --env halfcheetah --double_critic --action_concat --lr 0.0025 --lambda0 0.1 --lambda1 0.95 --alpha 1 --ld_weight 0.125 --hidden_size 512 --entropy_coeff 0.01 --steps_log_freq 8 --update_log_freq 10 --total_steps 5000000 --seed 2026 --platform gpu --debug --study_name halfcheetah_ppo_LD
python -m pobax.algos.ppo_no_jit_env --env halfcheetah --double_critic --action_concat --lr 0.0025 --lambda0 0.1 --lambda1 0.95 --alpha 1 --ld_weight 0.5 --hidden_size 512 --entropy_coeff 0.01 --steps_log_freq 8 --update_log_freq 10 --total_steps 5000000 --seed 2024 --platform gpu --debug --study_name halfcheetah_ppo_LD
python -m pobax.algos.ppo_no_jit_env --env halfcheetah --double_critic --action_concat --lr 0.0025 --lambda0 0.1 --lambda1 0.95 --alpha 1 --ld_weight 0.5 --hidden_size 512 --entropy_coeff 0.01 --steps_log_freq 8 --update_log_freq 10 --total_steps 5000000 --seed 2025 --platform gpu --debug --study_name halfcheetah_ppo_LD
python -m pobax.algos.ppo_no_jit_env --env halfcheetah --double_critic --action_concat --lr 0.0025 --lambda0 0.1 --lambda1 0.95 --alpha 1 --ld_weight 0.5 --hidden_size 512 --entropy_coeff 0.01 --steps_log_freq 8 --update_log_freq 10 --total_steps 5000000 --seed 2026 --platform gpu --debug --study_name halfcheetah_ppo_LD
python -m pobax.algos.ppo_no_jit_env --env halfcheetah --double_critic --action_concat --lr 0.0025 --lambda0 0.95 --lambda1 0.1 --alpha 1 --ld_weight 0.125 --hidden_size 512 --entropy_coeff 0.01 --steps_log_freq 8 --update_log_freq 10 --total_steps 5000000 --seed 2024 --platform gpu --debug --study_name halfcheetah_ppo_LD
python -m pobax.algos.ppo_no_jit_env --env halfcheetah --double_critic --action_concat --lr 0.0025 --lambda0 0.95 --lambda1 0.1 --alpha 1 --ld_weight 0.125 --hidden_size 512 --entropy_coeff 0.01 --steps_log_freq 8 --update_log_freq 10 --total_steps 5000000 --seed 2025 --platform gpu --debug --study_name halfcheetah_ppo_LD
python -m pobax.algos.ppo_no_jit_env --env halfcheetah --double_critic --action_concat --lr 0.0025 --lambda0 0.95 --lambda1 0.1 --alpha 1 --ld_weight 0.125 --hidden_size 512 --entropy_coeff 0.01 --steps_log_freq 8 --update_log_freq 10 --total_steps 5000000 --seed 2026 --platform gpu --debug --study_name halfcheetah_ppo_LD
python -m pobax.algos.ppo_no_jit_env --env halfcheetah --double_critic --action_concat --lr 0.0025 --lambda0 0.95 --lambda1 0.1 --alpha 1 --ld_weight 0.5 --hidden_size 512 --entropy_coeff 0.01 --steps_log_freq 8 --update_log_freq 10 --total_steps 5000000 --seed 2024 --platform gpu --debug --study_name halfcheetah_ppo_LD
python -m pobax.algos.ppo_no_jit_env --env halfcheetah --double_critic --action_concat --lr 0.0025 --lambda0 0.95 --lambda1 0.1 --alpha 1 --ld_weight 0.5 --hidden_size 512 --entropy_coeff 0.01 --steps_log_freq 8 --update_log_freq 10 --total_steps 5000000 --seed 2025 --platform gpu --debug --study_name halfcheetah_ppo_LD
python -m pobax.algos.ppo_no_jit_env --env halfcheetah --double_critic --action_concat --lr 0.0025 --lambda0 0.95 --lambda1 0.1 --alpha 1 --ld_weight 0.5 --hidden_size 512 --entropy_coeff 0.01 --steps_log_freq 8 --update_log_freq 10 --total_steps 5000000 --seed 2026 --platform gpu --debug --study_name halfcheetah_ppo_LD
python -m pobax.algos.ppo_no_jit_env --env halfcheetah --double_critic --action_concat --lr 0.0025 --lambda0 0.95 --lambda1 0.95 --alpha 1 --ld_weight 0.125 --hidden_size 512 --entropy_coeff 0.01 --steps_log_freq 8 --update_log_freq 10 --total_steps 5000000 --seed 2024 --platform gpu --debug --study_name halfcheetah_ppo_LD
python -m pobax.algos.ppo_no_jit_env --env halfcheetah --double_critic --action_concat --lr 0.0025 --lambda0 0.95 --lambda1 0.95 --alpha 1 --ld_weight 0.125 --hidden_size 512 --entropy_coeff 0.01 --steps_log_freq 8 --update_log_freq 10 --total_steps 5000000 --seed 2025 --platform gpu --debug --study_name halfcheetah_ppo_LD
python -m pobax.algos.ppo_no_jit_env --env halfcheetah --double_critic --action_concat --lr 0.0025 --lambda0 0.95 --lambda1 0.95 --alpha 1 --ld_weight 0.125 --hidden_size 512 --entropy_coeff 0.01 --steps_log_freq 8 --update_log_freq 10 --total_steps 5000000 --seed 2026 --platform gpu --debug --study_name halfcheetah_ppo_LD
python -m pobax.algos.ppo_no_jit_env --env halfcheetah --double_critic --action_concat --lr 0.0025 --lambda0 0.95 --lambda1 0.95 --alpha 1 --ld_weight 0.5 --hidden_size 512 --entropy_coeff 0.01 --steps_log_freq 8 --update_log_freq 10 --total_steps 5000000 --seed 2024 --platform gpu --debug --study_name halfcheetah_ppo_LD
python -m pobax.algos.ppo_no_jit_env --env halfcheetah --double_critic --action_concat --lr 0.0025 --lambda0 0.95 --lambda1 0.95 --alpha 1 --ld_weight 0.5 --hidden_size 512 --entropy_coeff 0.01 --steps_log_freq 8 --update_log_freq 10 --total_steps 5000000 --seed 2025 --platform gpu --debug --study_name halfcheetah_ppo_LD
python -m pobax.algos.ppo_no_jit_env --env halfcheetah --double_critic --action_concat --lr 0.0025 --lambda0 0.95 --lambda1 0.95 --alpha 1 --ld_weight 0.5 --hidden_size 512 --entropy_coeff 0.01 --steps_log_freq 8 --update_log_freq 10 --total_steps 5000000 --seed 2026 --platform gpu --debug --study_name halfcheetah_ppo_LD
python -m pobax.algos.ppo_no_jit_env --env halfcheetah --double_critic --action_concat --lr 0.00025 --lambda0 0.1 --lambda1 0.1 --alpha 1 --ld_weight 0.125 --hidden_size 512 --entropy_coeff 0.01 --steps_log_freq 8 --update_log_freq 10 --total_steps 5000000 --seed 2024 --platform gpu --debug --study_name halfcheetah_ppo_LD
python -m pobax.algos.ppo_no_jit_env --env halfcheetah --double_critic --action_concat --lr 0.00025 --lambda0 0.1 --lambda1 0.1 --alpha 1 --ld_weight 0.125 --hidden_size 512 --entropy_coeff 0.01 --steps_log_freq 8 --update_log_freq 10 --total_steps 5000000 --seed 2025 --platform gpu --debug --study_name halfcheetah_ppo_LD
python -m pobax.algos.ppo_no_jit_env --env halfcheetah --double_critic --action_concat --lr 0.00025 --lambda0 0.1 --lambda1 0.1 --alpha 1 --ld_weight 0.125 --hidden_size 512 --entropy_coeff 0.01 --steps_log_freq 8 --update_log_freq 10 --total_steps 5000000 --seed 2026 --platform gpu --debug --study_name halfcheetah_ppo_LD
python -m pobax.algos.ppo_no_jit_env --env halfcheetah --double_critic --action_concat --lr 0.00025 --lambda0 0.1 --lambda1 0.1 --alpha 1 --ld_weight 0.5 --hidden_size 512 --entropy_coeff 0.01 --steps_log_freq 8 --update_log_freq 10 --total_steps 5000000 --seed 2024 --platform gpu --debug --study_name halfcheetah_ppo_LD
python -m pobax.algos.ppo_no_jit_env --env halfcheetah --double_critic --action_concat --lr 0.00025 --lambda0 0.1 --lambda1 0.1 --alpha 1 --ld_weight 0.5 --hidden_size 512 --entropy_coeff 0.01 --steps_log_freq 8 --update_log_freq 10 --total_steps 5000000 --seed 2025 --platform gpu --debug --study_name halfcheetah_ppo_LD
python -m pobax.algos.ppo_no_jit_env --env halfcheetah --double_critic --action_concat --lr 0.00025 --lambda0 0.1 --lambda1 0.1 --alpha 1 --ld_weight 0.5 --hidden_size 512 --entropy_coeff 0.01 --steps_log_freq 8 --update_log_freq 10 --total_steps 5000000 --seed 2026 --platform gpu --debug --study_name halfcheetah_ppo_LD
python -m pobax.algos.ppo_no_jit_env --env halfcheetah --double_critic --action_concat --lr 0.00025 --lambda0 0.1 --lambda1 0.95 --alpha 1 --ld_weight 0.125 --hidden_size 512 --entropy_coeff 0.01 --steps_log_freq 8 --update_log_freq 10 --total_steps 5000000 --seed 2024 --platform gpu --debug --study_name halfcheetah_ppo_LD
python -m pobax.algos.ppo_no_jit_env --env halfcheetah --double_critic --action_concat --lr 0.00025 --lambda0 0.1 --lambda1 0.95 --alpha 1 --ld_weight 0.125 --hidden_size 512 --entropy_coeff 0.01 --steps_log_freq 8 --update_log_freq 10 --total_steps 5000000 --seed 2025 --platform gpu --debug --study_name halfcheetah_ppo_LD
python -m pobax.algos.ppo_no_jit_env --env halfcheetah --double_critic --action_concat --lr 0.00025 --lambda0 0.1 --lambda1 0.95 --alpha 1 --ld_weight 0.125 --hidden_size 512 --entropy_coeff 0.01 --steps_log_freq 8 --update_log_freq 10 --total_steps 5000000 --seed 2026 --platform gpu --debug --study_name halfcheetah_ppo_LD
python -m pobax.algos.ppo_no_jit_env --env halfcheetah --double_critic --action_concat --lr 0.00025 --lambda0 0.1 --lambda1 0.95 --alpha 1 --ld_weight 0.5 --hidden_size 512 --entropy_coeff 0.01 --steps_log_freq 8 --update_log_freq 10 --total_steps 5000000 --seed 2024 --platform gpu --debug --study_name halfcheetah_ppo_LD
python -m pobax.algos.ppo_no_jit_env --env halfcheetah --double_critic --action_concat --lr 0.00025 --lambda0 0.1 --lambda1 0.95 --alpha 1 --ld_weight 0.5 --hidden_size 512 --entropy_coeff 0.01 --steps_log_freq 8 --update_log_freq 10 --total_steps 5000000 --seed 2025 --platform gpu --debug --study_name halfcheetah_ppo_LD
python -m pobax.algos.ppo_no_jit_env --env halfcheetah --double_critic --action_concat --lr 0.00025 --lambda0 0.1 --lambda1 0.95 --alpha 1 --ld_weight 0.5 --hidden_size 512 --entropy_coeff 0.01 --steps_log_freq 8 --update_log_freq 10 --total_steps 5000000 --seed 2026 --platform gpu --debug --study_name halfcheetah_ppo_LD
python -m pobax.algos.ppo_no_jit_env --env halfcheetah --double_critic --action_concat --lr 0.00025 --lambda0 0.95 --lambda1 0.1 --alpha 1 --ld_weight 0.125 --hidden_size 512 --entropy_coeff 0.01 --steps_log_freq 8 --update_log_freq 10 --total_steps 5000000 --seed 2024 --platform gpu --debug --study_name halfcheetah_ppo_LD
python -m pobax.algos.ppo_no_jit_env --env halfcheetah --double_critic --action_concat --lr 0.00025 --lambda0 0.95 --lambda1 0.1 --alpha 1 --ld_weight 0.125 --hidden_size 512 --entropy_coeff 0.01 --steps_log_freq 8 --update_log_freq 10 --total_steps 5000000 --seed 2025 --platform gpu --debug --study_name halfcheetah_ppo_LD
python -m pobax.algos.ppo_no_jit_env --env halfcheetah --double_critic --action_concat --lr 0.00025 --lambda0 0.95 --lambda1 0.1 --alpha 1 --ld_weight 0.125 --hidden_size 512 --entropy_coeff 0.01 --steps_log_freq 8 --update_log_freq 10 --total_steps 5000000 --seed 2026 --platform gpu --debug --study_name halfcheetah_ppo_LD
python -m pobax.algos.ppo_no_jit_env --env halfcheetah --double_critic --action_concat --lr 0.00025 --lambda0 0.95 --lambda1 0.1 --alpha 1 --ld_weight 0.5 --hidden_size 512 --entropy_coeff 0.01 --steps_log_freq 8 --update_log_freq 10 --total_steps 5000000 --seed 2024 --platform gpu --debug --study_name halfcheetah_ppo_LD
python -m pobax.algos.ppo_no_jit_env --env halfcheetah --double_critic --action_concat --lr 0.00025 --lambda0 0.95 --lambda1 0.1 --alpha 1 --ld_weight 0.5 --hidden_size 512 --entropy_coeff 0.01 --steps_log_freq 8 --update_log_freq 10 --total_steps 5000000 --seed 2025 --platform gpu --debug --study_name halfcheetah_ppo_LD
python -m pobax.algos.ppo_no_jit_env --env halfcheetah --double_critic --action_concat --lr 0.00025 --lambda0 0.95 --lambda1 0.1 --alpha 1 --ld_weight 0.5 --hidden_size 512 --entropy_coeff 0.01 --steps_log_freq 8 --update_log_freq 10 --total_steps 5000000 --seed 2026 --platform gpu --debug --study_name halfcheetah_ppo_LD
python -m pobax.algos.ppo_no_jit_env --env halfcheetah --double_critic --action_concat --lr 0.00025 --lambda0 0.95 --lambda1 0.95 --alpha 1 --ld_weight 0.125 --hidden_size 512 --entropy_coeff 0.01 --steps_log_freq 8 --update_log_freq 10 --total_steps 5000000 --seed 2024 --platform gpu --debug --study_name halfcheetah_ppo_LD
python -m pobax.algos.ppo_no_jit_env --env halfcheetah --double_critic --action_concat --lr 0.00025 --lambda0 0.95 --lambda1 0.95 --alpha 1 --ld_weight 0.125 --hidden_size 512 --entropy_coeff 0.01 --steps_log_freq 8 --update_log_freq 10 --total_steps 5000000 --seed 2025 --platform gpu --debug --study_name halfcheetah_ppo_LD
python -m pobax.algos.ppo_no_jit_env --env halfcheetah --double_critic --action_concat --lr 0.00025 --lambda0 0.95 --lambda1 0.95 --alpha 1 --ld_weight 0.125 --hidden_size 512 --entropy_coeff 0.01 --steps_log_freq 8 --update_log_freq 10 --total_steps 5000000 --seed 2026 --platform gpu --debug --study_name halfcheetah_ppo_LD
python -m pobax.algos.ppo_no_jit_env --env halfcheetah --double_critic --action_concat --lr 0.00025 --lambda0 0.95 --lambda1 0.95 --alpha 1 --ld_weight 0.5 --hidden_size 512 --entropy_coeff 0.01 --steps_log_freq 8 --update_log_freq 10 --total_steps 5000000 --seed 2024 --platform gpu --debug --study_name halfcheetah_ppo_LD
python -m pobax.algos.ppo_no_jit_env --env halfcheetah --double_critic --action_concat --lr 0.00025 --lambda0 0.95 --lambda1 0.95 --alpha 1 --ld_weight 0.5 --hidden_size 512 --entropy_coeff 0.01 --steps_log_freq 8 --update_log_freq 10 --total_steps 5000000 --seed 2025 --platform gpu --debug --study_name halfcheetah_ppo_LD
python -m pobax.algos.ppo_no_jit_env --env halfcheetah --double_critic --action_concat --lr 0.00025 --lambda0 0.95 --lambda1 0.95 --alpha 1 --ld_weight 0.5 --hidden_size 512 --entropy_coeff 0.01 --steps_log_freq 8 --update_log_freq 10 --total_steps 5000000 --seed 2026 --platform gpu --debug --study_name halfcheetah_ppo_LD
python -m pobax.algos.ppo_no_jit_env --env halfcheetah --double_critic --action_concat --lr 2.5e-05 --lambda0 0.1 --lambda1 0.1 --alpha 1 --ld_weight 0.125 --hidden_size 512 --entropy_coeff 0.01 --steps_log_freq 8 --update_log_freq 10 --total_steps 5000000 --seed 2024 --platform gpu --debug --study_name halfcheetah_ppo_LD
python -m pobax.algos.ppo_no_jit_env --env halfcheetah --double_critic --action_concat --lr 2.5e-05 --lambda0 0.1 --lambda1 0.1 --alpha 1 --ld_weight 0.125 --hidden_size 512 --entropy_coeff 0.01 --steps_log_freq 8 --update_log_freq 10 --total_steps 5000000 --seed 2025 --platform gpu --debug --study_name halfcheetah_ppo_LD
python -m pobax.algos.ppo_no_jit_env --env halfcheetah --double_critic --action_concat --lr 2.5e-05 --lambda0 0.1 --lambda1 0.1 --alpha 1 --ld_weight 0.125 --hidden_size 512 --entropy_coeff 0.01 --steps_log_freq 8 --update_log_freq 10 --total_steps 5000000 --seed 2026 --platform gpu --debug --study_name halfcheetah_ppo_LD
python -m pobax.algos.ppo_no_jit_env --env halfcheetah --double_critic --action_concat --lr 2.5e-05 --lambda0 0.1 --lambda1 0.1 --alpha 1 --ld_weight 0.5 --hidden_size 512 --entropy_coeff 0.01 --steps_log_freq 8 --update_log_freq 10 --total_steps 5000000 --seed 2024 --platform gpu --debug --study_name halfcheetah_ppo_LD
python -m pobax.algos.ppo_no_jit_env --env halfcheetah --double_critic --action_concat --lr 2.5e-05 --lambda0 0.1 --lambda1 0.1 --alpha 1 --ld_weight 0.5 --hidden_size 512 --entropy_coeff 0.01 --steps_log_freq 8 --update_log_freq 10 --total_steps 5000000 --seed 2025 --platform gpu --debug --study_name halfcheetah_ppo_LD
python -m pobax.algos.ppo_no_jit_env --env halfcheetah --double_critic --action_concat --lr 2.5e-05 --lambda0 0.1 --lambda1 0.1 --alpha 1 --ld_weight 0.5 --hidden_size 512 --entropy_coeff 0.01 --steps_log_freq 8 --update_log_freq 10 --total_steps 5000000 --seed 2026 --platform gpu --debug --study_name halfcheetah_ppo_LD
python -m pobax.algos.ppo_no_jit_env --env halfcheetah --double_critic --action_concat --lr 2.5e-05 --lambda0 0.1 --lambda1 0.95 --alpha 1 --ld_weight 0.125 --hidden_size 512 --entropy_coeff 0.01 --steps_log_freq 8 --update_log_freq 10 --total_steps 5000000 --seed 2024 --platform gpu --debug --study_name halfcheetah_ppo_LD
python -m pobax.algos.ppo_no_jit_env --env halfcheetah --double_critic --action_concat --lr 2.5e-05 --lambda0 0.1 --lambda1 0.95 --alpha 1 --ld_weight 0.125 --hidden_size 512 --entropy_coeff 0.01 --steps_log_freq 8 --update_log_freq 10 --total_steps 5000000 --seed 2025 --platform gpu --debug --study_name halfcheetah_ppo_LD
python -m pobax.algos.ppo_no_jit_env --env halfcheetah --double_critic --action_concat --lr 2.5e-05 --lambda0 0.1 --lambda1 0.95 --alpha 1 --ld_weight 0.125 --hidden_size 512 --entropy_coeff 0.01 --steps_log_freq 8 --update_log_freq 10 --total_steps 5000000 --seed 2026 --platform gpu --debug --study_name halfcheetah_ppo_LD
python -m pobax.algos.ppo_no_jit_env --env halfcheetah --double_critic --action_concat --lr 2.5e-05 --lambda0 0.1 --lambda1 0.95 --alpha 1 --ld_weight 0.5 --hidden_size 512 --entropy_coeff 0.01 --steps_log_freq 8 --update_log_freq 10 --total_steps 5000000 --seed 2024 --platform gpu --debug --study_name halfcheetah_ppo_LD
python -m pobax.algos.ppo_no_jit_env --env halfcheetah --double_critic --action_concat --lr 2.5e-05 --lambda0 0.1 --lambda1 0.95 --alpha 1 --ld_weight 0.5 --hidden_size 512 --entropy_coeff 0.01 --steps_log_freq 8 --update_log_freq 10 --total_steps 5000000 --seed 2025 --platform gpu --debug --study_name halfcheetah_ppo_LD
python -m pobax.algos.ppo_no_jit_env --env halfcheetah --double_critic --action_concat --lr 2.5e-05 --lambda0 0.1 --lambda1 0.95 --alpha 1 --ld_weight 0.5 --hidden_size 512 --entropy_coeff 0.01 --steps_log_freq 8 --update_log_freq 10 --total_steps 5000000 --seed 2026 --platform gpu --debug --study_name halfcheetah_ppo_LD
python -m pobax.algos.ppo_no_jit_env --env halfcheetah --double_critic --action_concat --lr 2.5e-05 --lambda0 0.95 --lambda1 0.1 --alpha 1 --ld_weight 0.125 --hidden_size 512 --entropy_coeff 0.01 --steps_log_freq 8 --update_log_freq 10 --total_steps 5000000 --seed 2024 --platform gpu --debug --study_name halfcheetah_ppo_LD
python -m pobax.algos.ppo_no_jit_env --env halfcheetah --double_critic --action_concat --lr 2.5e-05 --lambda0 0.95 --lambda1 0.1 --alpha 1 --ld_weight 0.125 --hidden_size 512 --entropy_coeff 0.01 --steps_log_freq 8 --update_log_freq 10 --total_steps 5000000 --seed 2025 --platform gpu --debug --study_name halfcheetah_ppo_LD
python -m pobax.algos.ppo_no_jit_env --env halfcheetah --double_critic --action_concat --lr 2.5e-05 --lambda0 0.95 --lambda1 0.1 --alpha 1 --ld_weight 0.125 --hidden_size 512 --entropy_coeff 0.01 --steps_log_freq 8 --update_log_freq 10 --total_steps 5000000 --seed 2026 --platform gpu --debug --study_name halfcheetah_ppo_LD
python -m pobax.algos.ppo_no_jit_env --env halfcheetah --double_critic --action_concat --lr 2.5e-05 --lambda0 0.95 --lambda1 0.1 --alpha 1 --ld_weight 0.5 --hidden_size 512 --entropy_coeff 0.01 --steps_log_freq 8 --update_log_freq 10 --total_steps 5000000 --seed 2024 --platform gpu --debug --study_name halfcheetah_ppo_LD
python -m pobax.algos.ppo_no_jit_env --env halfcheetah --double_critic --action_concat --lr 2.5e-05 --lambda0 0.95 --lambda1 0.1 --alpha 1 --ld_weight 0.5 --hidden_size 512 --entropy_coeff 0.01 --steps_log_freq 8 --update_log_freq 10 --total_steps 5000000 --seed 2025 --platform gpu --debug --study_name halfcheetah_ppo_LD
python -m pobax.algos.ppo_no_jit_env --env halfcheetah --double_critic --action_concat --lr 2.5e-05 --lambda0 0.95 --lambda1 0.1 --alpha 1 --ld_weight 0.5 --hidden_size 512 --entropy_coeff 0.01 --steps_log_freq 8 --update_log_freq 10 --total_steps 5000000 --seed 2026 --platform gpu --debug --study_name halfcheetah_ppo_LD
python -m pobax.algos.ppo_no_jit_env --env halfcheetah --double_critic --action_concat --lr 2.5e-05 --lambda0 0.95 --lambda1 0.95 --alpha 1 --ld_weight 0.125 --hidden_size 512 --entropy_coeff 0.01 --steps_log_freq 8 --update_log_freq 10 --total_steps 5000000 --seed 2024 --platform gpu --debug --study_name halfcheetah_ppo_LD
python -m pobax.algos.ppo_no_jit_env --env halfcheetah --double_critic --action_concat --lr 2.5e-05 --lambda0 0.95 --lambda1 0.95 --alpha 1 --ld_weight 0.125 --hidden_size 512 --entropy_coeff 0.01 --steps_log_freq 8 --update_log_freq 10 --total_steps 5000000 --seed 2025 --platform gpu --debug --study_name halfcheetah_ppo_LD
python -m pobax.algos.ppo_no_jit_env --env halfcheetah --double_critic --action_concat --lr 2.5e-05 --lambda0 0.95 --lambda1 0.95 --alpha 1 --ld_weight 0.125 --hidden_size 512 --entropy_coeff 0.01 --steps_log_freq 8 --update_log_freq 10 --total_steps 5000000 --seed 2026 --platform gpu --debug --study_name halfcheetah_ppo_LD
python -m pobax.algos.ppo_no_jit_env --env halfcheetah --double_critic --action_concat --lr 2.5e-05 --lambda0 0.95 --lambda1 0.95 --alpha 1 --ld_weight 0.5 --hidden_size 512 --entropy_coeff 0.01 --steps_log_freq 8 --update_log_freq 10 --total_steps 5000000 --seed 2024 --platform gpu --debug --study_name halfcheetah_ppo_LD
python -m pobax.algos.ppo_no_jit_env --env halfcheetah --double_critic --action_concat --lr 2.5e-05 --lambda0 0.95 --lambda1 0.95 --alpha 1 --ld_weight 0.5 --hidden_size 512 --entropy_coeff 0.01 --steps_log_freq 8 --update_log_freq 10 --total_steps 5000000 --seed 2025 --platform gpu --debug --study_name halfcheetah_ppo_LD
python -m pobax.algos.ppo_no_jit_env --env halfcheetah --double_critic --action_concat --lr 2.5e-05 --lambda0 0.95 --lambda1 0.95 --alpha 1 --ld_weight 0.5 --hidden_size 512 --entropy_coeff 0.01 --steps_log_freq 8 --update_log_freq 10 --total_steps 5000000 --seed 2026 --platform gpu --debug --study_name halfcheetah_ppo_LD
