Evaluation & Detection

Evaluation methods assess whether AI systems are aligned and safe to deploy.

General Evaluation:

Capability Assessment:

Deception Detection:

Evaluation Scaling:

Eval Saturation & The Evals Gap: Accelerating benchmark saturation and its implications
Scalable Eval Approaches: Practical tools for scaling evaluation capacity
Evaluation Awareness: Models detecting and adapting to evaluation contexts

Deployment Decisions: