llm
simpleeval

[test]
pytest
