Changes to sandbox command assessment feature based on initial experiment feedback (#6091)

* Removed sandbox risk categories; feedback indicates that these are not that useful and "less is more" * Tweaked the assessment prompt to generate terser answers * Fixed bug in orchestrator that prevents this feature from being exposed in the extension
2025-11-01 16:52:23 -05:00
parent d9118c04bf
commit d5853d9c47
7 changed files with 20 additions and 98 deletions
--- a/codex-rs/otel/src/otel_event_manager.rs
+++ b/codex-rs/otel/src/otel_event_manager.rs
@@ -8,7 +8,6 @@ use codex_protocol::models::ResponseItem;
 use codex_protocol::protocol::AskForApproval;
 use codex_protocol::protocol::ReviewDecision;
 use codex_protocol::protocol::SandboxPolicy;
-use codex_protocol::protocol::SandboxRiskCategory;
 use codex_protocol::protocol::SandboxRiskLevel;
 use codex_protocol::user_input::UserInput;
 use eventsource_stream::Event as StreamEvent;
@@ -373,19 +372,9 @@ impl OtelEventManager {
        call_id: &str,
        status: &str,
        risk_level: Option<SandboxRiskLevel>,
-        risk_categories: &[SandboxRiskCategory],
        duration: Duration,
    ) {
        let level = risk_level.map(|level| level.as_str());
-        let categories = if risk_categories.is_empty() {
-            String::new()
-        } else {
-            risk_categories
-                .iter()
-                .map(SandboxRiskCategory::as_str)
-                .collect::<Vec<_>>()
-                .join(", ")
-        };

        tracing::event!(
            tracing::Level::INFO,
@@ -402,7 +391,6 @@ impl OtelEventManager {
            call_id = %call_id,
            status = %status,
            risk_level = level,
-            risk_categories = categories,
            duration_ms = %duration.as_millis(),
        );
    }