Vulnerability in Trusted Monitoring and Mitigations

Jun 7, 2025

Research conducted as part of AI Safety Camp, exploring vulnerabilities in AI monitoring systems and developing robust mitigation strategies.