# file: /home/azureuser/agents/qa/athanor-sdk/src/kairos/eval_harness.py
# hypothesis_version: 6.152.1

[0.0, 0.5, 100, 120, 185, 200, 300, 493, 500, 600, 800, 1000, 1500, 2000, 2400, 3000, 3500, 6000, 8000, 8192, 10000, 16384, 32768, 50000, 65536, 200000, 4000000, '\n---\n', '  [', '"""(.*?)"""', '%Y%m%d_%H%M%S', '%{http_code}', '(no output)', '*', '*.json', ',', ', ', '-', '--', '--all-tasks', '--cap-add=SETGID', '--cap-add=SETUID', '--cap-drop=ALL', '--data-binary', '--env-dir', '--gpus', '--max-time', '--max-workers', '--model', '--network=none', '--no-header', '--output', '--patch', '--pids-limit=256', '--rm', '--run-id', '--task', '--tasks', '--user', '--workdir', '-/', '-H', '-X', '-c', '-m', '-o', '-q', '-rf', '-s', '-v', '-w', '.c', '.cache', '.cc', '.cedar', '.cedarschema', '.cpp', '.cxx', '.dfy', '.git', '.go', '.h', '.hpp', '.json', '.lean', '.md', '.mod', '.mypy_cache', '.py', '.pyi', '.pytest_cache', '.rs', '.ruff_cache', '.sh', '.sum', '.sv', '.svh', '.toml', '.txt', '.v', '.vh', '.yaml', '.yml', '/', '/-', '/v1', '/workdir/', '/workdir/data', '/workdir/data/', '0', '1', '128', '12g', '180', '200', '2g', '413', '429', '4g', '5', '512', '8g', ':', ': error:', '<|tool_call_begin|>', '???', '@-', 'AKIA[A-Z0-9]{16}', 'ALLOW_LOCAL_SCORING', 'ANTHROPIC_API_KEY', 'ANTHROPIC_BASE_URL', 'API error', 'API_FAIL', 'AZURE_AI_API_BASE', 'AZURE_AI_API_KEY', 'AZURE_API_KEY', 'Also complete', 'Authorization', 'Builder', 'CRON_SECRET', 'Cancelled by user', 'Complete', 'Content-Type', 'EVAL_ENV_DIR', 'Error', 'FAIL', 'Finisher', 'GEMINI_API_KEY', 'GOOGLE_API_KEY', 'GPU', 'LITELLM_API_KEY', 'ModuleNotFoundError', 'N/A', 'No scoring script', 'No such file', 'OPENAI_API_KEY', 'PASS', 'PATCH', 'PATH', 'PLATFORM_URL', 'POST', 'Path', 'Path to the file', 'Prefer', 'RUN_CONTRACT_TEST', 'Run cancelled', 'Run completed', 'SKIP', 'SYNC_TOKEN', 'VIOL', 'Verifier', 'WARN', 'Z', '[REDACTED]', '^\\s*end\\b', '_', '__init__.py', '__main__', '__pycache__', '_ath133_fallback', '_instructions', '_run', 'action', 'agent_roles', 'agent_traces', 'all', 'allow_mathlib', 'anthropic', 'anthropic/', 'api_base', 'api_key', 'api_wait_penalty', 'apikey', 'application/json', 'args', 'arguments', 'assistant', 'attempt', 'attempt_idx', 'avg_score', 'azure', 'azure_ai', 'azure_ai/kimi-k2.5', 'azure_ai/kimi-k2.6-1', 'bash', 'body', 'build', 'builder_verifier', 'cache_control', 'cache_read_tokens', 'cached_tokens', 'cancelled', 'cargo', 'choices', 'claude', 'claude-', 'cli', 'command', 'compile_output', 'complete-run', 'completed', 'completed_at', 'completed_tasks', 'completion_tokens', 'config', 'configs', 'content', 'content_len', 'cost_usd_estimate', 'create-run', 'curl', 'dafny_file', 'data', 'datetime', 'decl', 'decls_rewritten', 'def ', 'description', 'details', 'dir', 'dist', 'docker', 'dummy_config.json', 'duration_ms', 'edit_file', 'end_line', 'env_dir', 'environment', 'environment.', 'environment_dir', 'environment_id', 'environment_slug', 'ephemeral', 'err_count', 'errors', 'eval', 'eval-results.json', 'eval-workdir-', 'event_type', 'extracted', 'failed', 'full_content', 'full_output', 'function', 'gemini', 'gemini-', 'gemini/', 'gpt-', 'gpt-4o', 'handoff.json', 'handoff_summary', 'id', 'ignore', 'image', 'import Lean', 'import Mathlib', 'inf', 'infra_limitations', 'ingest-run', 'inspect', 'instructions', 'integration', 'kernel_file', 'kimi-', 'kind', 'kw', 'label', 'lake', 'lean', 'lean_file', 'lean_filename', 'local', 'max_tokens', 'mean_score', 'messages', 'metadata', 'mistral-', 'mode', 'model', 'model_dump', 'model_name', 'name', 'namespace ', 'new_string', 'no_tools_attempts', 'node_modules', 'none', 'not found', 'object', 'old_string', 'openai', 'openai/', 'openai/kimi-k2.5', 'openai/kimi-k2.6-1', 'organization_id', 'output', 'output_file', 'output_files', 'parameters', 'partial-continuation', 'partial-theorem', 'passed', 'path', 'per_phase_traces', 'phase', 'phase1_instructions', 'phase_containers', 'phase_metrics', 'phase_models', 'phase_no_tools', 'phase_output_file', 'phases', 'podman', 'prompt_tokens', 'properties', 'pydantic', 'pytest', 'python3', 'rate limit', 'read_file', 'reason', 'replace', 'required', 'requires_gpu', 'response_text', 'results', 'return=minimal', 'rm', 'role', 'root', 'root_data', 'run', 'run_id', 'running', 'rustc', 'score', 'score_output.json', 'scoring.py', 'scoring_data', 'scoring_metadata', 'scoring_script.py', 'scripts', 'shared', 'shared_data', 'skipped', 'snapshot_path', 'solution_file', 'source', 'source-strip', 'source_file', 'source_files', 'src', 'start_line', 'started_at', 'status', 'step', 'steps', 'stop', 'stop_reason', 'store_true', 'strategy', 'string', 'student_data', 'student_file', 'student_files', 'student_strategy', 'success', 'summary', 'sv_file', 'system', 'target', 'task', 'task_id', 'task_slug', 'tasks', 'tests', 'text', 'theorem ', 'threading', 'time_seconds', 'timed out', 'timestamp', 'token_count', 'tool', 'tool_call', 'tool_call_id', 'tool_calls', 'tool_calls_count', 'tool_calls_log', 'tool_calls_summary', 'tool_calls_total', 'tool_choice', 'tool_result', 'total', 'total_tasks', 'total_tokens', 'trace-event', 'traces', 'type', 'unknown', 'unshare', 'usage', 'user', 'utf-8', 'verifier_inputs', 'w', 'whitelist', '{}']