PostTrainBench

Python ★ 0 updated 4mo ago ⑂ fork

PostTrainBench measures how well CLI agents like Claude Code or Codex CLI can post-train base LLMs on a single H100 GPU in 10 hours

No plain-English explanation yet — one is being written right now. Check back in a minute.