Diagnostics Catalog

This page maps diagnostics settings to runtime behavior and key metrics.

Configuration location

Primary controls:

Important: W&B metric group switches are only effective when W&B runtime is enabled.

observability.diagnostics.pair_count_stats_enable
- Enables pair-count stats diagnostics.
observability.diagnostics.sgld_log_gnoise
- Enables additional gradient-noise logging paths.
observability.diagnostics.sgld_log_temperature
- Enables additional temperature logging paths.
observability.diagnostics.display_precond_every
- Controls cadence for some preconditioner console diagnostics.
observability.diagnostics.profile_shared_event_re
- Enables shared-event profiling summaries in epoch logging.

Configured under:

Common group names seen in configs:

At current runtime, explicit group-gating is most actively used for:

Other names may be consumed by logger-side code paths depending on run mode and config.

When the optimizer exposes diagnostics methods, SPIDER logs:

Interpretation quick guide:

grad_noise_to_langevin_* compares minibatch gradient-noise variance to injected Langevin-noise variance.
t_eff_var_over_target near 1 suggests temperature calibration is closer to target.

Common metrics emitted during runs include:

For convergence/no-fallback triage, prioritize:

Configured under observability.diagnostics.ess_online:

Common derived metrics:

For production sampling with useful observability and moderate overhead: