1 month ago · 120b6a80b0
--- a/README.md
+++ b/README.md
@@ -1,3 +1,3 @@
 
															 # X_SSL_Net
														
 
															-ultrasound segmentation semi-supervised medical-imaging
														
 
															+ultrasound segmentation supervised medical-imaging
														
--- a/configs/segmentation/train_sup_us_template.yaml
+++ b/configs/segmentation/train_sup_us_template.yaml
@@ -0,0 +1,102 @@
 
															+trainer:
														
 
															+  name: supervised_segmentation
														
 
															+
														
 
															+train:
														
 
															+  seed: 42
														
 
															+  epochs: 200
														
 
															+  batch_size: 4
														
 
															+  val_batch_size: 4
														
 
															+  amp: true
														
 
															+  num_workers: 4
														
 
															+  pin_memory: true
														
 
															+  persistent_workers: true
														
 
															+  prefetch_factor: 2
														
 
															+  device: cuda
														
 
															+  grad_clip:
														
 
															+    enabled: true
														
 
															+    max_norm: 1.0
														
 
															+    norm_type: 2.0
														
 
															+  auto_batch_size:
														
 
															+    enabled: false
														
 
															+    target_memory_fraction: 0.75
														
 
															+    reference_gpu_gb: 8.0
														
 
															+    reference_batch_size: 4
														
 
															+    min_batch_size: 1
														
 
															+    max_batch_size: 8
														
 
															+
														
 
															+metrics:
														
 
															+  task_mode: binary
														
 
															+  metrics:
														
 
															+    - name: dice
														
 
															+    - name: iou
														
 
															+
														
 
															+validation:
														
 
															+  enabled: true
														
 
															+  interval: 1
														
 
															+  threshold: 0.5
														
 
															+  early_stopping: true
														
 
															+  early_stopping_patience: 40
														
 
															+  early_stopping_min_delta: 0.0
														
 
															+  metrics:
														
 
															+    task_mode: binary
														
 
															+    metrics:
														
 
															+      - name: dice
														
 
															+      - name: iou
														
 
															+
														
 
															+dataset:
														
 
															+  name: ultrasound_sup_seg
														
 
															+  dataset_name: BUSI
														
 
															+  root: data/BUSI
														
 
															+  split: train
														
 
															+  split_file: null
														
 
															+  val_split: val
														
 
															+  val_split_file: null
														
 
															+  image_size: [256, 256]
														
 
															+  in_channels: 3
														
 
															+  num_classes: 1
														
 
															+
														
 
															+model:
														
 
															+  model_name: swinv2_tiny_patch4_window8_256
														
 
															+  load_weights: false
														
 
															+  decoder_channels: [384, 192, 96, 96]
														
 
															+  fwta_wavelet: haar
														
 
															+  fwta_level: 1
														
 
															+  fwta_sigma_ratio: 0.35
														
 
															+  fwta_tau_fourier: 0.15
														
 
															+  fwta_gate_temperature: 1.0
														
 
															+  use_multiscale_features: true
														
 
															+  include_patch_embed: true
														
 
															+
														
 
															+optimizer:
														
 
															+  name: adamw
														
 
															+  lr: 1.0e-4
														
 
															+  weight_decay: 0.05
														
 
															+
														
 
															+scheduler:
														
 
															+  name: cosine
														
 
															+  warmup:
														
 
															+    name: linear
														
 
															+    params:
														
 
															+      start_factor: 0.1
														
 
															+      total_iters: 10
														
 
															+  params:
														
 
															+    T_max: 190
														
 
															+    eta_min: 1.0e-6
														
 
															+
														
 
															+checkpoint:
														
 
															+  dir: outputs/supervised_segmentation/train_sup_us_template
														
 
															+  save: true
														
 
															+  save_last: true
														
 
															+  monitor: dice
														
 
															+  monitor_mode: max
														
 
															+  resume: null
														
 
															+  resume_strict: true
														
 
															+  resume_training: true
														
 
															+
														
 
															+logging:
														
 
															+  log_interval: 10
														
 
															+  print_training_setup: true
														
 
															+  use_swanlab: true
														
 
															+  project: X_SSL_Net
														
 
															+  experiment_name: supervised_segmentation
														
 
															+  swanlab_mode: null
														
--- a/configs/segmentation/us_exp_sup_busi.yaml
+++ b/configs/segmentation/us_exp_sup_busi.yaml
@@ -0,0 +1,92 @@
 
															+trainer:
														
 
															+  name: supervised_segmentation
														
 
															+
														
 
															+train:
														
 
															+  seed: 42
														
 
															+  epochs: 200
														
 
															+  batch_size: 4
														
 
															+  val_batch_size: 4
														
 
															+  amp: true
														
 
															+  num_workers: 4
														
 
															+  pin_memory: true
														
 
															+  persistent_workers: true
														
 
															+  prefetch_factor: 2
														
 
															+  device: cuda
														
 
															+  grad_clip:
														
 
															+    enabled: true
														
 
															+    max_norm: 1.0
														
 
															+    norm_type: 2.0
														
 
															+
														
 
															+metrics:
														
 
															+  task_mode: binary
														
 
															+  metrics:
														
 
															+    - name: dice
														
 
															+    - name: iou
														
 
															+
														
 
															+validation:
														
 
															+  enabled: true
														
 
															+  interval: 1
														
 
															+  threshold: 0.5
														
 
															+  early_stopping: true
														
 
															+  early_stopping_patience: 40
														
 
															+  early_stopping_min_delta: 0.0
														
 
															+  metrics:
														
 
															+    task_mode: binary
														
 
															+    metrics:
														
 
															+      - name: dice
														
 
															+      - name: iou
														
 
															+
														
 
															+dataset:
														
 
															+  dataset_name: BUSI
														
 
															+  root: data/BUSI
														
 
															+  split: train
														
 
															+  val_split: val
														
 
															+  image_size: [256, 256]
														
 
															+  in_channels: 3
														
 
															+  num_classes: 1
														
 
															+
														
 
															+model:
														
 
															+  model_name: swinv2_tiny_patch4_window8_256
														
 
															+  load_weights: false
														
 
															+  decoder_channels: [384, 192, 96, 96]
														
 
															+  fwta_wavelet: haar
														
 
															+  fwta_level: 1
														
 
															+  fwta_sigma_ratio: 0.35
														
 
															+  fwta_tau_fourier: 0.15
														
 
															+  fwta_gate_temperature: 1.0
														
 
															+  use_multiscale_features: true
														
 
															+  include_patch_embed: true
														
 
															+
														
 
															+optimizer:
														
 
															+  name: adamw
														
 
															+  lr: 1.0e-4
														
 
															+  weight_decay: 0.05
														
 
															+
														
 
															+scheduler:
														
 
															+  name: cosine
														
 
															+  warmup:
														
 
															+    name: linear
														
 
															+    params:
														
 
															+      start_factor: 0.1
														
 
															+      total_iters: 10
														
 
															+  params:
														
 
															+    T_max: 190
														
 
															+    eta_min: 1.0e-6
														
 
															+
														
 
															+checkpoint:
														
 
															+  dir: outputs/experiments/supervised/BUSI
														
 
															+  save: true
														
 
															+  save_last: true
														
 
															+  monitor: dice
														
 
															+  monitor_mode: max
														
 
															+  resume: null
														
 
															+  resume_strict: true
														
 
															+  resume_training: true
														
 
															+
														
 
															+logging:
														
 
															+  log_interval: 10
														
 
															+  print_training_setup: true
														
 
															+  use_swanlab: true
														
 
															+  project: X_SSL_Net
														
 
															+  experiment_name: sup_busi
														
 
															+  swanlab_mode: null
														
--- a/lib/modules/__init__.py
+++ b/lib/modules/__init__.py
@@ -1,5 +1,8 @@
 
															 from .attentions_2d import CirculantAttention2d, ComplexLinear, WaveletAttentionGlobalBranch2d
														
 
															 from .blocks_2d import WaveletFFTBlock2d, WaveletFFTMRFFIModule2d
														
 
															+from .build_swinv2 import build_swinv2, build_swinv2_auto
														
 
															+from .decoder_2d import BoundaryRefineBlock2d, StructureAwareDecodeBlock2d, StructureAwareDecoder2d
														
 
															+from .fwta_2d import FourierWaveletTokenAggregation
														
 
															 from .layers_2d import (
														
 
															     BNLinear1d,
														
 
															     Conv2dBN,
														
@@ -10,16 +13,8 @@ from .layers_2d import (
 
															     Residual,
														
 
															     Scale,
														
 
															 )
														
 
															-from .nets_2d import (
														
 
															-    WaveletFFTNet2d,
														
 
															-    wavelet_fft_b1,
														
 
															-    wavelet_fft_b2,
														
 
															-    wavelet_fft_b4,
														
 
															-    wavelet_fft_s6,
														
 
															-    wavelet_fft_t2,
														
 
															-    wavelet_fft_t4,
														
 
															-)
														
 
															-from .build_swinv2 import build_swinv2, build_swinv2_auto
														
 
															+from .segmentation_2d import GlobalTokenConditioning2d, SegmentationNet2d
														
 
															+from .swinv2_fwta_encoder_2d import SwinV2FWTAEncoder2d
														
 
															 __all__ = [
														
 
															     "CirculantAttention2d",
														
@@ -27,6 +22,12 @@ __all__ = [
 
															     "WaveletAttentionGlobalBranch2d",
														
 
															     "WaveletFFTBlock2d",
														
 
															     "WaveletFFTMRFFIModule2d",
														
 
															+    "build_swinv2",
														
 
															+    "build_swinv2_auto",
														
 
															+    "BoundaryRefineBlock2d",
														
 
															+    "StructureAwareDecodeBlock2d",
														
 
															+    "StructureAwareDecoder2d",
														
 
															+    "FourierWaveletTokenAggregation",
														
 
															     "BNLinear1d",
														
 
															     "Conv2dBN",
														
 
															     "DWConv2dBNReLU",
														
@@ -35,13 +36,7 @@ __all__ = [
 
															     "PatchMerging2d",
														
 
															     "Residual",
														
 
															     "Scale",
														
 
															-    "WaveletFFTNet2d",
														
 
															-    "wavelet_fft_t2",
														
 
															-    "wavelet_fft_t4",
														
 
															-    "wavelet_fft_s6",
														
 
															-    "wavelet_fft_b1",
														
 
															-    "wavelet_fft_b2",
														
 
															-    "wavelet_fft_b4",
														
 
															-    "build_swinv2",
														
 
															-    "build_swinv2_auto",
														
 
															+    "GlobalTokenConditioning2d",
														
 
															+    "SegmentationNet2d",
														
 
															+    "SwinV2FWTAEncoder2d",
														
 
															 ]
														
--- a/lib/modules/segmentation_2d.py
+++ b/lib/modules/segmentation_2d.py
@@ -0,0 +1,138 @@
 
															+from __future__ import annotations
														
 
															+
														
 
															+from argparse import Namespace
														
 
															+from pathlib import Path
														
 
															+from typing import Any, Sequence
														
 
															+
														
 
															+import torch
														
 
															+import torch.nn as nn
														
 
															+import torch.nn.functional as F
														
 
															+
														
 
															+from .decoder_2d import StructureAwareDecoder2d
														
 
															+from .layers_2d import Conv2dBN
														
 
															+from .swinv2_fwta_encoder_2d import SwinV2FWTAEncoder2d
														
 
															+
														
 
															+
														
 
															+class SegmentationHead2d(nn.Module):
														
 
															+    def __init__(self, in_channels: int, out_channels: int) -> None:
														
 
															+        super().__init__()
														
 
															+        self.block = nn.Sequential(
														
 
															+            Conv2dBN(in_channels, in_channels, 3, 1, 1),
														
 
															+            nn.ReLU(inplace=True),
														
 
															+            nn.Conv2d(in_channels, out_channels, kernel_size=1, bias=True),
														
 
															+        )
														
 
															+
														
 
															+    def forward(self, x: torch.Tensor, output_size: tuple[int, int]) -> torch.Tensor:
														
 
															+        x = self.block(x)
														
 
															+        return F.interpolate(x, size=output_size, mode="bilinear", align_corners=False)
														
 
															+
														
 
															+
														
 
															+class BoundaryHead2d(nn.Module):
														
 
															+    def __init__(self, in_channels: int, out_channels: int = 1) -> None:
														
 
															+        super().__init__()
														
 
															+        self.block = nn.Sequential(
														
 
															+            Conv2dBN(in_channels, in_channels, 3, 1, 1),
														
 
															+            nn.ReLU(inplace=True),
														
 
															+            nn.Conv2d(in_channels, out_channels, kernel_size=1, bias=True),
														
 
															+        )
														
 
															+
														
 
															+    def forward(self, x: torch.Tensor, output_size: tuple[int, int]) -> torch.Tensor:
														
 
															+        x = self.block(x)
														
 
															+        return F.interpolate(x, size=output_size, mode="bilinear", align_corners=False)
														
 
															+
														
 
															+
														
 
															+class GlobalTokenConditioning2d(nn.Module):
														
 
															+    """
														
 
															+    使用 FWTA 更新后的全局前景 token 对解码特征做通道调制。
														
 
															+    """
														
 
															+
														
 
															+    def __init__(self, token_channels: int, feature_channels: int) -> None:
														
 
															+        super().__init__()
														
 
															+        hidden_channels = max(feature_channels // 2, 32)
														
 
															+        self.gate = nn.Sequential(
														
 
															+            nn.LayerNorm(token_channels),
														
 
															+            nn.Linear(token_channels, hidden_channels),
														
 
															+            nn.GELU(),
														
 
															+            nn.Linear(hidden_channels, feature_channels),
														
 
															+            nn.Sigmoid(),
														
 
															+        )
														
 
															+
														
 
															+    def forward(self, x: torch.Tensor, global_token: torch.Tensor) -> tuple[torch.Tensor, torch.Tensor]:
														
 
															+        channel_gate = self.gate(global_token).unsqueeze(-1).unsqueeze(-1)
														
 
															+        return x * (1.0 + channel_gate), channel_gate
														
 
															+
														
 
															+
														
 
															+class SegmentationNet2d(nn.Module):
														
 
															+    """
														
 
															+    第一版超声分割主网络骨架。
														
 
															+
														
 
															+    当前职责：
														
 
															+    - 编码器输出多尺度特征和稳定性图
														
 
															+    - 结构感知解码器恢复分割特征
														
 
															+    - 同时输出分割图和边界图
														
 
															+    """
														
 
															+
														
 
															+    def __init__(
														
 
															+            self,
														
 
															+            num_classes: int,
														
 
															+            model_name: str | None = None,
														
 
															+            config_path: str | Path | None = None,
														
 
															+            weight_path: str | Path | None = None,
														
 
															+            args: Namespace | None = None,
														
 
															+            *,
														
 
															+            decoder_channels: Sequence[int] | None = None,
														
 
															+            load_weights: bool = True,
														
 
															+            **encoder_kwargs: Any,
														
 
															+    ) -> None:
														
 
															+        super().__init__()
														
 
															+        self.encoder = SwinV2FWTAEncoder2d(
														
 
															+            model_name=model_name,
														
 
															+            config_path=config_path,
														
 
															+            weight_path=weight_path,
														
 
															+            args=args,
														
 
															+            load_weights=load_weights,
														
 
															+            **encoder_kwargs,
														
 
															+        )
														
 
															+        self.decoder = StructureAwareDecoder2d(
														
 
															+            encoder_channels=self.encoder.stage_channels,
														
 
															+            decoder_channels=decoder_channels,
														
 
															+        )
														
 
															+        self.global_conditioning = GlobalTokenConditioning2d(
														
 
															+            token_channels=self.encoder.stage_channels[-1],
														
 
															+            feature_channels=self.decoder.out_channels,
														
 
															+        )
														
 
															+        self.segmentation_head = SegmentationHead2d(self.decoder.out_channels, num_classes)
														
 
															+        self.boundary_head = BoundaryHead2d(self.decoder.out_channels, out_channels=1)
														
 
															+
														
 
															+    def forward(self, x: torch.Tensor) -> dict[str, torch.Tensor | list[torch.Tensor]]:
														
 
															+        encoder_outputs = self.encoder(x)
														
 
															+        features = encoder_outputs["features"]
														
 
															+        stability_map = encoder_outputs["stability_map"]
														
 
															+
														
 
															+        decoder_out, decoder_features = self.decoder(
														
 
															+            features=features,
														
 
															+            stability_map=stability_map,
														
 
															+        )
														
 
															+        conditioned_decoder_out, global_channel_gate = self.global_conditioning(
														
 
															+            decoder_out,
														
 
															+            encoder_outputs["global_token"],
														
 
															+        )
														
 
															+
														
 
															+        output_size = x.shape[-2:]
														
 
															+        seg_logits = self.segmentation_head(conditioned_decoder_out, output_size=output_size)
														
 
															+        boundary_logits = self.boundary_head(conditioned_decoder_out, output_size=output_size)
														
 
															+
														
 
															+        return {
														
 
															+            "seg_logits": seg_logits,
														
 
															+            "boundary_logits": boundary_logits,
														
 
															+            "stability_map": F.interpolate(
														
 
															+                stability_map, size=output_size, mode="bilinear", align_corners=False
														
 
															+            ),
														
 
															+            "encoder_features": features,
														
 
															+            "decoder_features": decoder_features,
														
 
															+            "conditioned_decoder_feature": conditioned_decoder_out,
														
 
															+            "deepest_feature": encoder_outputs["deepest_feature"],
														
 
															+            "global_token": encoder_outputs["global_token"],
														
 
															+            "global_channel_gate": global_channel_gate,
														
 
															+            "token_gate": encoder_outputs["token_gate"],
														
 
															+        }
														
--- a/lib/tools/__init__.py
+++ b/lib/tools/__init__.py
@@ -1,4 +1,6 @@
 
															+from .boundary import boundary_band_map, logits_to_boundary, logits_to_binary_mask, mask_to_boundary_map
														
 
															 from .loss import DEFAULT_TASK_LOSS, LOSS_REGISTRY, build_loss
														
 
															+from .loss import BinaryBoundaryLoss, MaskBoundaryConsistencyLoss
														
 
															 from .metrics import (
														
 
															     DEFAULT_METRIC_CONFIG,
														
 
															     METRIC_REGISTRY,
														
@@ -26,7 +28,13 @@ __all__ = [
 
															     "METRIC_REGISTRY",
														
 
															     "OPTIMIZER_REGISTRY",
														
 
															     "SCHEDULER_REGISTRY",
														
 
															+    "mask_to_boundary_map",
														
 
															+    "logits_to_binary_mask",
														
 
															+    "logits_to_boundary",
														
 
															+    "boundary_band_map",
														
 
															     "build_loss",
														
 
															+    "BinaryBoundaryLoss",
														
 
															+    "MaskBoundaryConsistencyLoss",
														
 
															     "build_metric",
														
 
															     "build_metrics",
														
 
															     "compute_metrics",
														
--- a/lib/tools/boundary.py
+++ b/lib/tools/boundary.py
@@ -0,0 +1,52 @@
 
															+from __future__ import annotations
														
 
															+
														
 
															+import torch
														
 
															+import torch.nn.functional as F
														
 
															+
														
 
															+
														
 
															+def _ensure_nchw(mask: torch.Tensor) -> torch.Tensor:
														
 
															+    if mask.ndim == 3:
														
 
															+        return mask.unsqueeze(1)
														
 
															+    if mask.ndim != 4:
														
 
															+        raise ValueError(f"Expected mask with 3 or 4 dims, got shape {tuple(mask.shape)}")
														
 
															+    return mask
														
 
															+
														
 
															+
														
 
															+def mask_to_boundary_map(mask: torch.Tensor, dilation: int = 1) -> torch.Tensor:
														
 
															+    """
														
 
															+    通过最大池化近似形态学梯度，生成边界图。
														
 
															+    """
														
 
															+    mask = _ensure_nchw(mask).float()
														
 
															+    kernel_size = dilation * 2 + 1
														
 
															+    pad = dilation
														
 
															+    dilated = F.max_pool2d(mask, kernel_size=kernel_size, stride=1, padding=pad)
														
 
															+    eroded = -F.max_pool2d(-mask, kernel_size=kernel_size, stride=1, padding=pad)
														
 
															+    boundary = (dilated - eroded).clamp_min(0.0)
														
 
															+    return (boundary > 0).float()
														
 
															+
														
 
															+
														
 
															+def logits_to_binary_mask(logits: torch.Tensor, threshold: float = 0.5) -> torch.Tensor:
														
 
															+    if logits.shape[1] == 1:
														
 
															+        probs = torch.sigmoid(logits)
														
 
															+        return (probs >= threshold).float()
														
 
															+    preds = torch.argmax(logits, dim=1, keepdim=True)
														
 
															+    return preds.float()
														
 
															+
														
 
															+
														
 
															+def logits_to_boundary(logits: torch.Tensor, threshold: float = 0.5, dilation: int = 1) -> torch.Tensor:
														
 
															+    mask = logits_to_binary_mask(logits, threshold=threshold)
														
 
															+    return mask_to_boundary_map(mask, dilation=dilation)
														
 
															+
														
 
															+
														
 
															+def boundary_band_map(boundary: torch.Tensor, radius: int = 2) -> torch.Tensor:
														
 
															+    boundary = _ensure_nchw(boundary).float()
														
 
															+    kernel_size = radius * 2 + 1
														
 
															+    return F.max_pool2d(boundary, kernel_size=kernel_size, stride=1, padding=radius)
														
 
															+
														
 
															+
														
 
															+__all__ = [
														
 
															+    "mask_to_boundary_map",
														
 
															+    "logits_to_binary_mask",
														
 
															+    "logits_to_boundary",
														
 
															+    "boundary_band_map",
														
 
															+]
														
--- a/lib/tools/loss.py
+++ b/lib/tools/loss.py
@@ -2,6 +2,8 @@ from __future__ import annotations
 
															 from typing import Any
														
 
															+import torch
														
 
															+import torch.nn.functional as F
														
 
															 from torch import nn
														
 
															 try:
														
@@ -140,4 +142,43 @@ def build_loss(config: dict[str, Any]) -> nn.Module:
 
															     return loss_cls(**params)
														
 
															-__all__ = ["DEFAULT_TASK_LOSS", "LOSS_REGISTRY", "build_loss"]
														
 
															+class BinaryBoundaryLoss(nn.Module):
														
 
															+    def __init__(self, bce_weight: float = 1.0, dice_weight: float = 1.0, eps: float = 1e-6) -> None:
														
 
															+        super().__init__()
														
 
															+        self.bce_weight = bce_weight
														
 
															+        self.dice_weight = dice_weight
														
 
															+        self.eps = eps
														
 
															+
														
 
															+    def forward(self, logits: torch.Tensor, target: torch.Tensor) -> torch.Tensor:
														
 
															+        target = target.float()
														
 
															+        bce = F.binary_cross_entropy_with_logits(logits, target)
														
 
															+        probs = torch.sigmoid(logits)
														
 
															+        intersection = (probs * target).sum(dim=(1, 2, 3))
														
 
															+        union = probs.sum(dim=(1, 2, 3)) + target.sum(dim=(1, 2, 3))
														
 
															+        dice = 1.0 - ((2.0 * intersection + self.eps) / (union + self.eps))
														
 
															+        return self.bce_weight * bce + self.dice_weight * dice.mean()
														
 
															+
														
 
															+
														
 
															+class MaskBoundaryConsistencyLoss(nn.Module):
														
 
															+    def forward(self, seg_logits: torch.Tensor, boundary_logits: torch.Tensor) -> torch.Tensor:
														
 
															+        if seg_logits.shape[1] == 1:
														
 
															+            seg_prob = torch.sigmoid(seg_logits)
														
 
															+        else:
														
 
															+            seg_prob = torch.softmax(seg_logits, dim=1)[:, 1:2]
														
 
															+
														
 
															+        boundary_prob = torch.sigmoid(boundary_logits)
														
 
															+        grad_x = torch.abs(seg_prob[:, :, :, 1:] - seg_prob[:, :, :, :-1])
														
 
															+        grad_y = torch.abs(seg_prob[:, :, 1:, :] - seg_prob[:, :, :-1, :])
														
 
															+        grad_x = F.pad(grad_x, (0, 1, 0, 0))
														
 
															+        grad_y = F.pad(grad_y, (0, 0, 0, 1))
														
 
															+        edge_proxy = torch.clamp(grad_x + grad_y, 0.0, 1.0)
														
 
															+        return F.l1_loss(boundary_prob, edge_proxy)
														
 
															+
														
 
															+
														
 
															+__all__ = [
														
 
															+    "DEFAULT_TASK_LOSS",
														
 
															+    "LOSS_REGISTRY",
														
 
															+    "build_loss",
														
 
															+    "BinaryBoundaryLoss",
														
 
															+    "MaskBoundaryConsistencyLoss",
														
 
															+]
														
--- a/lib/trainers/__init__.py
+++ b/lib/trainers/__init__.py
@@ -0,0 +1,10 @@
 
															+from .base import BaseTrainer
														
 
															+from .builder import TRAINER_REGISTRY, build_trainer
														
 
															+from .supervised import SupervisedSegmentationTrainer
														
 
															+
														
 
															+__all__ = [
														
 
															+    "BaseTrainer",
														
 
															+    "TRAINER_REGISTRY",
														
 
															+    "build_trainer",
														
 
															+    "SupervisedSegmentationTrainer",
														
 
															+]
														
--- a/lib/trainers/base.py
+++ b/lib/trainers/base.py
@@ -0,0 +1,636 @@
 
															+from __future__ import annotations
														
 
															+
														
 
															+from abc import ABC, abstractmethod
														
 
															+from pathlib import Path
														
 
															+import pprint
														
 
															+import time
														
 
															+from typing import Any
														
 
															+
														
 
															+import torch
														
 
															+import torch.nn as nn
														
 
															+import torch.nn.functional as F
														
 
															+from torch.amp import GradScaler
														
 
															+
														
 
															+from lib.data import build_dataloader
														
 
															+from lib.tools import build_metrics, compute_metrics, reset_metrics, update_metrics
														
 
															+
														
 
															+try:
														
 
															+    import swanlab
														
 
															+except ImportError:
														
 
															+    swanlab = None
														
 
															+
														
 
															+
														
 
															+class BaseTrainer(ABC):
														
 
															+    """
														
 
															+    训练器基类。
														
 
															+
														
 
															+    设计目标：
														
 
															+    - 统一配置入口
														
 
															+    - 统一模型/优化器/调度器创建
														
 
															+    - 不同训练流程只重写最少的方法
														
 
															+    """
														
 
															+
														
 
															+    def __init__(self, cfg: dict[str, Any], args: Any | None = None) -> None:
														
 
															+        self.cfg = cfg
														
 
															+        self.args = args
														
 
															+        self.device = self._build_device()
														
 
															+        self.output_dir = self._build_output_dir()
														
 
															+        self.start_epoch = 0
														
 
															+        self.best_metric: float | None = None
														
 
															+        self.no_improve_epochs = 0
														
 
															+        self.swanlab_run = None
														
 
															+        self.grad_scaler = GradScaler("cuda", enabled=self._amp_enabled())
														
 
															+
														
 
															+    def _build_device(self) -> torch.device:
														
 
															+        device_name = self.cfg.get("train", {}).get("device", "cpu")
														
 
															+        if device_name == "cuda" and not torch.cuda.is_available():
														
 
															+            device_name = "cpu"
														
 
															+        return torch.device(device_name)
														
 
															+
														
 
															+    def _build_output_dir(self) -> Path:
														
 
															+        output_dir = self.cfg.get("checkpoint", {}).get("dir", "outputs/supervised_segmentation")
														
 
															+        path = Path(output_dir)
														
 
															+        path.mkdir(parents=True, exist_ok=True)
														
 
															+        return path
														
 
															+
														
 
															+    def _amp_enabled(self) -> bool:
														
 
															+        return bool(self.cfg.get("train", {}).get("amp", False)) and self.device.type == "cuda"
														
 
															+
														
 
															+    def _auto_batch_size_cfg(self) -> dict[str, Any]:
														
 
															+        cfg = self.cfg.get("train", {}).get("auto_batch_size", {})
														
 
															+        return cfg if isinstance(cfg, dict) else {}
														
 
															+
														
 
															+    def _auto_batch_size_enabled(self) -> bool:
														
 
															+        return bool(self._auto_batch_size_cfg().get("enabled", False))
														
 
															+
														
 
															+    def _gpu_total_memory_gb(self) -> float | None:
														
 
															+        if self.device.type != "cuda" or not torch.cuda.is_available():
														
 
															+            return None
														
 
															+        props = torch.cuda.get_device_properties(self.device)
														
 
															+        return float(props.total_memory / (1024 ** 3))
														
 
															+
														
 
															+    def _estimate_auto_batch_size(self, *, default_batch_size: int, ssl: bool = False) -> int:
														
 
															+        cfg = self._auto_batch_size_cfg()
														
 
															+        if not cfg.get("enabled", False):
														
 
															+            return int(default_batch_size)
														
 
															+
														
 
															+        total_gb = self._gpu_total_memory_gb()
														
 
															+        if total_gb is None:
														
 
															+            return int(default_batch_size)
														
 
															+
														
 
															+        target_fraction = float(cfg.get("target_memory_fraction", 0.75))
														
 
															+        target_fraction = min(max(target_fraction, 0.1), 0.95)
														
 
															+        reference_gpu_gb = float(cfg.get("reference_gpu_gb", 8.0))
														
 
															+        reference_batch_size = int(cfg.get("reference_batch_size", default_batch_size))
														
 
															+        max_batch_size = int(cfg.get("max_batch_size", reference_batch_size))
														
 
															+        min_batch_size = int(cfg.get("min_batch_size", 1))
														
 
															+
														
 
															+        memory_penalty = float(cfg.get("memory_penalty", 1.0 if not ssl else 1.35))
														
 
															+        scaled = int((reference_batch_size * total_gb * target_fraction) / max(reference_gpu_gb * 0.75 * memory_penalty, 1e-6))
														
 
															+        batch_size = max(min_batch_size, min(max_batch_size, max(default_batch_size, scaled)))
														
 
															+        return int(batch_size)
														
 
															+
														
 
															+    def _resolve_batch_size(self, key: str, default: int, *, ssl: bool = False) -> int:
														
 
															+        train_cfg = self.cfg.get("train", {})
														
 
															+        configured = int(train_cfg.get(key, default))
														
 
															+        batch_size = self._estimate_auto_batch_size(default_batch_size=configured, ssl=ssl)
														
 
															+        if self._auto_batch_size_enabled() and batch_size != configured:
														
 
															+            print(
														
 
															+                {
														
 
															+                    "message": "auto_batch_size adjusted",
														
 
															+                    "key": key,
														
 
															+                    "configured": configured,
														
 
															+                    "resolved": batch_size,
														
 
															+                    "gpu_total_gb": self._gpu_total_memory_gb(),
														
 
															+                }
														
 
															+            )
														
 
															+        return batch_size
														
 
															+
														
 
															+    def _dataset_cfg(self) -> dict[str, Any]:
														
 
															+        return self.cfg.get("dataset", {})
														
 
															+
														
 
															+    def _dataset_name(self) -> str:
														
 
															+        dataset_cfg = self._dataset_cfg()
														
 
															+        dataset_name = dataset_cfg.get("dataset_name") or dataset_cfg.get("name")
														
 
															+        if not dataset_name:
														
 
															+            raise ValueError("dataset.dataset_name is required.")
														
 
															+        return str(dataset_name)
														
 
															+
														
 
															+    def _dataset_root(self) -> str:
														
 
															+        dataset_cfg = self._dataset_cfg()
														
 
															+        root = dataset_cfg.get("root")
														
 
															+        if not root:
														
 
															+            raise ValueError("dataset.root is required.")
														
 
															+        return str(root)
														
 
															+
														
 
															+    def _image_size(self) -> tuple[int, int]:
														
 
															+        dataset_cfg = self._dataset_cfg()
														
 
															+        image_size = dataset_cfg.get("image_size")
														
 
															+        if image_size is None:
														
 
															+            raise ValueError("dataset.image_size is required.")
														
 
															+        return int(image_size[0]), int(image_size[1])
														
 
															+
														
 
															+    def _build_resize_transform(self, *, mode: str) -> Any:
														
 
															+        height, width = self._image_size()
														
 
															+        interpolation_mode = "bilinear" if mode == "image" else "nearest"
														
 
															+
														
 
															+        def _transform(tensor: torch.Tensor) -> torch.Tensor:
														
 
															+            resized = F.interpolate(
														
 
															+                tensor.unsqueeze(0),
														
 
															+                size=(height, width),
														
 
															+                mode=interpolation_mode,
														
 
															+                align_corners=False if interpolation_mode != "nearest" else None,
														
 
															+            )
														
 
															+            return resized.squeeze(0)
														
 
															+
														
 
															+        return _transform
														
 
															+
														
 
															+    def _build_segmentation_loader(
														
 
															+            self,
														
 
															+            *,
														
 
															+            split: str,
														
 
															+            batch_size: int,
														
 
															+            shuffle: bool,
														
 
															+            split_file: str | None = None,
														
 
															+    ):
														
 
															+        dataset_cfg = self._dataset_cfg()
														
 
															+        train_cfg = self.cfg.get("train", {})
														
 
															+        num_workers = max(0, int(train_cfg.get("num_workers", 0)))
														
 
															+        persistent_workers = bool(train_cfg.get("persistent_workers", False)) if num_workers > 0 else False
														
 
															+        loader = build_dataloader(
														
 
															+            dataset_name=self._dataset_name(),
														
 
															+            root=self._dataset_root(),
														
 
															+            split=split,
														
 
															+            split_file=split_file,
														
 
															+            batch_size=batch_size,
														
 
															+            shuffle=shuffle,
														
 
															+            num_workers=num_workers,
														
 
															+            image_transform=self._build_resize_transform(mode="image"),
														
 
															+            mask_transform=self._build_resize_transform(mode="mask"),
														
 
															+            pin_memory=bool(train_cfg.get("pin_memory", self.device.type == "cuda")),
														
 
															+            persistent_workers=persistent_workers,
														
 
															+            prefetch_factor=train_cfg.get("prefetch_factor") if num_workers > 0 else None,
														
 
															+        )
														
 
															+        return loader
														
 
															+
														
 
															+    def _build_val_loader(
														
 
															+            self,
														
 
															+            *,
														
 
															+            batch_size: int,
														
 
															+            shuffle: bool = False,
														
 
															+    ):
														
 
															+        dataset_cfg = self._dataset_cfg()
														
 
															+        val_split = dataset_cfg.get("val_split", "val")
														
 
															+        if val_split is None:
														
 
															+            return None
														
 
															+        return self._build_segmentation_loader(
														
 
															+            split=str(val_split),
														
 
															+            split_file=dataset_cfg.get("val_split_file"),
														
 
															+            batch_size=batch_size,
														
 
															+            shuffle=shuffle,
														
 
															+        )
														
 
															+
														
 
															+    def _checkpoint_cfg(self) -> dict[str, Any]:
														
 
															+        return self.cfg.get("checkpoint", {})
														
 
															+
														
 
															+    def _logging_cfg(self) -> dict[str, Any]:
														
 
															+        return self.cfg.get("logging", {})
														
 
															+
														
 
															+    def _validation_cfg(self) -> dict[str, Any]:
														
 
															+        return self.cfg.get("validation", {})
														
 
															+
														
 
															+    def _checkpoint_enabled(self) -> bool:
														
 
															+        return bool(self._checkpoint_cfg().get("save", True))
														
 
															+
														
 
															+    def _best_mode(self) -> str:
														
 
															+        return str(self._checkpoint_cfg().get("monitor_mode", "min"))
														
 
															+
														
 
															+    def _is_better_metric(self, metric: float) -> bool:
														
 
															+        if self.best_metric is None:
														
 
															+            return True
														
 
															+        if self._best_mode() == "max":
														
 
															+            return metric > self.best_metric
														
 
															+        return metric < self.best_metric
														
 
															+
														
 
															+    def _save_checkpoint(self, filename: str, state: dict[str, Any]) -> Path | None:
														
 
															+        if not self._checkpoint_enabled():
														
 
															+            return None
														
 
															+        path = self.output_dir / filename
														
 
															+        torch.save(state, path)
														
 
															+        return path
														
 
															+
														
 
															+    def _resume_checkpoint_path(self) -> Path | None:
														
 
															+        resume_path = self._checkpoint_cfg().get("resume")
														
 
															+        if not resume_path:
														
 
															+            return None
														
 
															+        path = Path(str(resume_path))
														
 
															+        if not path.is_absolute():
														
 
															+            path = Path.cwd() / path
														
 
															+        return path
														
 
															+
														
 
															+    def _maybe_resume(
														
 
															+            self,
														
 
															+            *,
														
 
															+            module_map: dict[str, Any],
														
 
															+            optimizer: Any | None = None,
														
 
															+            scheduler: Any | None = None,
														
 
															+    ) -> dict[str, Any] | None:
														
 
															+        path = self._resume_checkpoint_path()
														
 
															+        if path is None:
														
 
															+            return None
														
 
															+        if not path.exists():
														
 
															+            raise FileNotFoundError(f"Resume checkpoint not found: {path}")
														
 
															+
														
 
															+        checkpoint = torch.load(path, map_location="cpu")
														
 
															+        strict = bool(self._checkpoint_cfg().get("resume_strict", True))
														
 
															+        for key, module in module_map.items():
														
 
															+            if module is None:
														
 
															+                continue
														
 
															+            state_dict = checkpoint.get(key)
														
 
															+            if state_dict is not None:
														
 
															+                module.load_state_dict(state_dict, strict=strict)
														
 
															+
														
 
															+        if optimizer is not None and checkpoint.get("optimizer") is not None:
														
 
															+            optimizer.load_state_dict(checkpoint["optimizer"])
														
 
															+        if scheduler is not None and checkpoint.get("scheduler") is not None:
														
 
															+            scheduler.load_state_dict(checkpoint["scheduler"])
														
 
															+        if checkpoint.get("grad_scaler") is not None:
														
 
															+            self.grad_scaler.load_state_dict(checkpoint["grad_scaler"])
														
 
															+
														
 
															+        if checkpoint.get("best_metric") is not None:
														
 
															+            self.best_metric = float(checkpoint["best_metric"])
														
 
															+        elif checkpoint.get("metrics") is not None:
														
 
															+            monitor_name = str(self._checkpoint_cfg().get("monitor", "total"))
														
 
															+            monitor_value = checkpoint["metrics"].get(f"val_{monitor_name}")
														
 
															+            if monitor_value is None:
														
 
															+                monitor_value = checkpoint["metrics"].get(monitor_name)
														
 
															+            if monitor_value is not None:
														
 
															+                self.best_metric = float(monitor_value)
														
 
															+        if checkpoint.get("no_improve_epochs") is not None:
														
 
															+            self.no_improve_epochs = int(checkpoint["no_improve_epochs"])
														
 
															+
														
 
															+        if bool(self._checkpoint_cfg().get("resume_training", True)):
														
 
															+            self.start_epoch = int(checkpoint.get("epoch", -1)) + 1
														
 
															+        return checkpoint
														
 
															+
														
 
															+    def _validation_enabled(self) -> bool:
														
 
															+        return bool(self._validation_cfg().get("enabled", True))
														
 
															+
														
 
															+    def _validation_interval(self) -> int:
														
 
															+        return max(1, int(self._validation_cfg().get("interval", 1)))
														
 
															+
														
 
															+    def _should_validate(self, epoch: int) -> bool:
														
 
															+        return self._validation_enabled() and ((epoch + 1) % self._validation_interval() == 0)
														
 
															+
														
 
															+    def _metric_task_mode(self) -> str:
														
 
															+        validation_cfg = self._validation_cfg()
														
 
															+        metrics_cfg = validation_cfg.get("metrics", self.cfg.get("metrics"))
														
 
															+        if isinstance(metrics_cfg, dict):
														
 
															+            return str(metrics_cfg.get("task_mode", "binary"))
														
 
															+        return "binary"
														
 
															+
														
 
															+    def _metric_threshold(self) -> float:
														
 
															+        validation_cfg = self._validation_cfg()
														
 
															+        threshold = validation_cfg.get("threshold", 0.5)
														
 
															+        return float(threshold)
														
 
															+
														
 
															+    def _build_validation_metrics(self) -> dict[str, Any]:
														
 
															+        validation_cfg = self._validation_cfg()
														
 
															+        metrics_cfg = validation_cfg.get("metrics", self.cfg.get("metrics"))
														
 
															+        if metrics_cfg is None:
														
 
															+            return {}
														
 
															+        return build_metrics(metrics_cfg)
														
 
															+
														
 
															+    def _early_stopping_enabled(self) -> bool:
														
 
															+        return bool(self._validation_cfg().get("early_stopping", False))
														
 
															+
														
 
															+    def _early_stopping_patience(self) -> int:
														
 
															+        return max(1, int(self._validation_cfg().get("early_stopping_patience", 10)))
														
 
															+
														
 
															+    def _early_stopping_min_delta(self) -> float:
														
 
															+        return float(self._validation_cfg().get("early_stopping_min_delta", 0.0))
														
 
															+
														
 
															+    def _update_validation_metrics(
														
 
															+            self,
														
 
															+            metrics: dict[str, Any],
														
 
															+            *,
														
 
															+            logits: torch.Tensor,
														
 
															+            target: torch.Tensor,
														
 
															+    ) -> None:
														
 
															+        if not metrics:
														
 
															+            return
														
 
															+        update_metrics(
														
 
															+            metrics,
														
 
															+            logits,
														
 
															+            target,
														
 
															+            task_mode=self._metric_task_mode(),
														
 
															+            threshold=self._metric_threshold(),
														
 
															+            num_classes=int(self._dataset_cfg().get("num_classes", 1)),
														
 
															+        )
														
 
															+
														
 
															+    def _compute_validation_metric_values(self, metrics: dict[str, Any]) -> dict[str, float]:
														
 
															+        if not metrics:
														
 
															+            return {}
														
 
															+        values = compute_metrics(metrics)
														
 
															+        reset_metrics(metrics)
														
 
															+        return values
														
 
															+
														
 
															+    def _init_swanlab(self) -> None:
														
 
															+        logging_cfg = self._logging_cfg()
														
 
															+        if not bool(logging_cfg.get("use_swanlab", False)):
														
 
															+            return
														
 
															+        if swanlab is None:
														
 
															+            print("SwanLab is not installed. Logging will continue without SwanLab.")
														
 
															+            return
														
 
															+
														
 
															+        run_name = logging_cfg.get("experiment_name") or self.output_dir.name
														
 
															+        self.swanlab_run = swanlab.init(
														
 
															+            project=logging_cfg.get("project", "X_SSL_Net"),
														
 
															+            name=run_name,
														
 
															+            config=self.cfg,
														
 
															+            mode=logging_cfg.get("swanlab_mode"),
														
 
															+        )
														
 
															+
														
 
															+    def _log_metrics(self, metrics: dict[str, float], *, step: int) -> None:
														
 
															+        if self.swanlab_run is None:
														
 
															+            return
														
 
															+        swanlab.log(metrics, step=step)
														
 
															+
														
 
															+    def _close_loggers(self) -> None:
														
 
															+        if self.swanlab_run is not None:
														
 
															+            swanlab.finish()
														
 
															+            self.swanlab_run = None
														
 
															+
														
 
															+    def _log_interval(self) -> int:
														
 
															+        return max(1, int(self._logging_cfg().get("log_interval", 20)))
														
 
															+
														
 
															+    def _grad_clip_cfg(self) -> dict[str, Any]:
														
 
															+        cfg = self.cfg.get("train", {}).get("grad_clip", {})
														
 
															+        return cfg if isinstance(cfg, dict) else {}
														
 
															+
														
 
															+    def _grad_clip_enabled(self) -> bool:
														
 
															+        return bool(self._grad_clip_cfg().get("enabled", False))
														
 
															+
														
 
															+    def _clip_gradients(self, module: nn.Module | None) -> float | None:
														
 
															+        if module is None or not self._grad_clip_enabled():
														
 
															+            return None
														
 
															+        cfg = self._grad_clip_cfg()
														
 
															+        max_norm = float(cfg.get("max_norm", 1.0))
														
 
															+        norm_type = float(cfg.get("norm_type", 2.0))
														
 
															+        params = [param for param in module.parameters() if param.requires_grad and param.grad is not None]
														
 
															+        if not params:
														
 
															+            return None
														
 
															+        total_norm = torch.nn.utils.clip_grad_norm_(params, max_norm=max_norm, norm_type=norm_type)
														
 
															+        return float(total_norm.detach().cpu() if isinstance(total_norm, torch.Tensor) else total_norm)
														
 
															+
														
 
															+    def _current_lrs(self, optimizer: Any | None) -> list[float]:
														
 
															+        if optimizer is None:
														
 
															+            return []
														
 
															+        return [float(group.get("lr", 0.0)) for group in optimizer.param_groups]
														
 
															+
														
 
															+    @staticmethod
														
 
															+    def _count_parameters(module: nn.Module | None) -> dict[str, int]:
														
 
															+        if module is None:
														
 
															+            return {"total": 0, "trainable": 0}
														
 
															+        total = sum(param.numel() for param in module.parameters())
														
 
															+        trainable = sum(param.numel() for param in module.parameters() if param.requires_grad)
														
 
															+        return {"total": int(total), "trainable": int(trainable)}
														
 
															+
														
 
															+    @staticmethod
														
 
															+    def _loader_summary(loader: Any | None) -> dict[str, Any] | None:
														
 
															+        if loader is None:
														
 
															+            return None
														
 
															+        dataset = getattr(loader, "dataset", None)
														
 
															+        return {
														
 
															+            "dataset_size": len(dataset) if dataset is not None else None,
														
 
															+            "num_batches": len(loader),
														
 
															+            "batch_size": getattr(loader, "batch_size", None),
														
 
															+            "num_workers": getattr(loader, "num_workers", None),
														
 
															+            "pin_memory": getattr(loader, "pin_memory", None),
														
 
															+            "persistent_workers": getattr(loader, "persistent_workers", None),
														
 
															+            "prefetch_factor": getattr(loader, "prefetch_factor", None),
														
 
															+            "drop_last": getattr(loader, "drop_last", None),
														
 
															+        }
														
 
															+
														
 
															+    def _training_setup_summary(
														
 
															+            self,
														
 
															+            *,
														
 
															+            model_map: dict[str, nn.Module | None],
														
 
															+            loader_map: dict[str, Any | None],
														
 
															+            optimizer: Any | None = None,
														
 
															+            scheduler: Any | None = None,
														
 
															+    ) -> dict[str, Any]:
														
 
															+        return {
														
 
															+            "trainer": self.cfg.get("trainer", {}).get("name"),
														
 
															+            "device": str(self.device),
														
 
															+            "amp_enabled": self._amp_enabled(),
														
 
															+            "output_dir": str(self.output_dir),
														
 
															+            "start_epoch": self.start_epoch,
														
 
															+            "train": self.cfg.get("train", {}),
														
 
															+            "dataset": self.cfg.get("dataset", {}),
														
 
															+            "model": self.cfg.get("model", {}),
														
 
															+            "optimizer": self.cfg.get("optimizer", {}),
														
 
															+            "scheduler": self.cfg.get("scheduler"),
														
 
															+            "current_lrs": self._current_lrs(optimizer),
														
 
															+            "validation": self.cfg.get("validation", {}),
														
 
															+            "checkpoint": self.cfg.get("checkpoint", {}),
														
 
															+            "logging": self.cfg.get("logging", {}),
														
 
															+            "model_parameters": {
														
 
															+                name: self._count_parameters(module)
														
 
															+                for name, module in model_map.items()
														
 
															+            },
														
 
															+            "loaders": {
														
 
															+                name: self._loader_summary(loader)
														
 
															+                for name, loader in loader_map.items()
														
 
															+            },
														
 
															+            "cuda": {
														
 
															+                "available": torch.cuda.is_available(),
														
 
															+                "device_name": torch.cuda.get_device_name(self.device) if self.device.type == "cuda" else None,
														
 
															+                "device_count": torch.cuda.device_count(),
														
 
															+            },
														
 
															+        }
														
 
															+
														
 
															+    def _print_training_setup(
														
 
															+            self,
														
 
															+            *,
														
 
															+            model_map: dict[str, nn.Module | None],
														
 
															+            loader_map: dict[str, Any | None],
														
 
															+            optimizer: Any | None = None,
														
 
															+            scheduler: Any | None = None,
														
 
															+    ) -> None:
														
 
															+        if not bool(self._logging_cfg().get("print_training_setup", True)):
														
 
															+            return
														
 
															+        summary = self._training_setup_summary(
														
 
															+            model_map=model_map,
														
 
															+            loader_map=loader_map,
														
 
															+            optimizer=optimizer,
														
 
															+            scheduler=scheduler,
														
 
															+        )
														
 
															+        print("========== TRAINING SETUP ==========")
														
 
															+        pprint.pprint(summary, sort_dicts=False, width=120)
														
 
															+        print("======== END TRAINING SETUP ========")
														
 
															+
														
 
															+    def _gpu_memory_mb(self) -> float:
														
 
															+        if self.device.type != "cuda" or not torch.cuda.is_available():
														
 
															+            return 0.0
														
 
															+        return float(torch.cuda.max_memory_allocated(device=self.device) / (1024 ** 2))
														
 
															+
														
 
															+    def _performance_snapshot(
														
 
															+            self,
														
 
															+            *,
														
 
															+            epoch: int,
														
 
															+            step: int,
														
 
															+            num_steps: int,
														
 
															+            data_time: float,
														
 
															+            iter_time: float,
														
 
															+            metrics: dict[str, float],
														
 
															+            prefix: str = "train",
														
 
															+    ) -> dict[str, float | int]:
														
 
															+        snapshot: dict[str, float | int] = {
														
 
															+            "epoch": epoch,
														
 
															+            "step": step,
														
 
															+            "num_steps": num_steps,
														
 
															+            "data_time": data_time,
														
 
															+            "iter_time": iter_time,
														
 
															+            "gpu_memory_mb": self._gpu_memory_mb(),
														
 
															+        }
														
 
															+        lrs = self._current_lrs(getattr(self, "optimizer", None))
														
 
															+        if lrs:
														
 
															+            snapshot["lr"] = lrs[0]
														
 
															+        for key, value in metrics.items():
														
 
															+            snapshot[f"{prefix}_{key}"] = value
														
 
															+        return snapshot
														
 
															+
														
 
															+    def _maybe_log_step(
														
 
															+            self,
														
 
															+            *,
														
 
															+            epoch: int,
														
 
															+            step: int,
														
 
															+            num_steps: int,
														
 
															+            data_time: float,
														
 
															+            iter_time: float,
														
 
															+            metrics: dict[str, float],
														
 
															+            prefix: str = "train",
														
 
															+    ) -> None:
														
 
															+        if step % self._log_interval() != 0 and step != num_steps:
														
 
															+            return
														
 
															+        snapshot = self._performance_snapshot(
														
 
															+            epoch=epoch,
														
 
															+            step=step,
														
 
															+            num_steps=num_steps,
														
 
															+            data_time=data_time,
														
 
															+            iter_time=iter_time,
														
 
															+            metrics=metrics,
														
 
															+            prefix=prefix,
														
 
															+        )
														
 
															+        print(snapshot)
														
 
															+        log_metrics = {
														
 
															+            f"{prefix}/{key}": value
														
 
															+            for key, value in metrics.items()
														
 
															+        }
														
 
															+        log_metrics.update(
														
 
															+            {
														
 
															+                f"{prefix}/data_time": data_time,
														
 
															+                f"{prefix}/iter_time": iter_time,
														
 
															+                f"{prefix}/gpu_memory_mb": float(snapshot["gpu_memory_mb"]),
														
 
															+            }
														
 
															+        )
														
 
															+        if "lr" in snapshot:
														
 
															+            log_metrics[f"{prefix}/lr"] = float(snapshot["lr"])
														
 
															+        self._log_metrics(log_metrics, step=epoch * max(1, num_steps) + step)
														
 
															+
														
 
															+    @staticmethod
														
 
															+    def _average_metric_sums(metric_sums: dict[str, float], steps: int) -> dict[str, float]:
														
 
															+        if steps <= 0:
														
 
															+            return {}
														
 
															+        return {key: value / steps for key, value in metric_sums.items()}
														
 
															+
														
 
															+    def _base_checkpoint_state(self, *, epoch: int, metrics: dict[str, float] | None = None) -> dict[str, Any]:
														
 
															+        state = {
														
 
															+            "epoch": epoch,
														
 
															+            "cfg": self.cfg,
														
 
															+            "metrics": metrics or {},
														
 
															+            "grad_scaler": self.grad_scaler.state_dict(),
														
 
															+            "no_improve_epochs": self.no_improve_epochs,
														
 
															+        }
														
 
															+        return state
														
 
															+
														
 
															+    def _finalize_epoch(
														
 
															+            self,
														
 
															+            *,
														
 
															+            epoch: int,
														
 
															+            train_metrics: dict[str, float],
														
 
															+            val_metrics: dict[str, float] | None,
														
 
															+            checkpoint_state: dict[str, Any],
														
 
															+    ) -> tuple[dict[str, Any], bool]:
														
 
															+        merged_metrics = dict(train_metrics)
														
 
															+        if val_metrics is not None:
														
 
															+            merged_metrics.update({f"val_{key}": value for key, value in val_metrics.items()})
														
 
															+
														
 
															+        improved = False
														
 
															+        if val_metrics is not None:
														
 
															+            monitor_name = str(self._checkpoint_cfg().get("monitor", "total"))
														
 
															+            if monitor_name not in val_metrics:
														
 
															+                raise KeyError(f"Checkpoint monitor '{monitor_name}' not found in val metrics.")
														
 
															+            monitor_value = float(val_metrics[monitor_name])
														
 
															+            delta = self._early_stopping_min_delta()
														
 
															+            previous_best = self.best_metric
														
 
															+            is_better = self._is_better_metric(monitor_value)
														
 
															+            if previous_best is not None and self._best_mode() == "max":
														
 
															+                is_better = monitor_value > (previous_best + delta)
														
 
															+            elif previous_best is not None and self._best_mode() == "min":
														
 
															+                is_better = monitor_value < (previous_best - delta)
														
 
															+
														
 
															+            if is_better:
														
 
															+                self.best_metric = monitor_value
														
 
															+                self.no_improve_epochs = 0
														
 
															+                improved = True
														
 
															+                best_state = dict(checkpoint_state)
														
 
															+                best_state.update(
														
 
															+                    self._base_checkpoint_state(
														
 
															+                        epoch=epoch,
														
 
															+                        metrics=merged_metrics,
														
 
															+                    )
														
 
															+                )
														
 
															+                best_state["best_metric"] = self.best_metric
														
 
															+                self._save_checkpoint("best.pth", best_state)
														
 
															+            else:
														
 
															+                self.no_improve_epochs += 1
														
 
															+
														
 
															+        save_last = bool(self._checkpoint_cfg().get("save_last", True))
														
 
															+        if save_last:
														
 
															+            last_state = dict(checkpoint_state)
														
 
															+            last_state.update(self._base_checkpoint_state(epoch=epoch, metrics=merged_metrics))
														
 
															+            if self.best_metric is not None:
														
 
															+                last_state["best_metric"] = self.best_metric
														
 
															+            self._save_checkpoint("last.pth", last_state)
														
 
															+
														
 
															+        summary = {"epoch": epoch}
														
 
															+        summary.update(train_metrics)
														
 
															+        if val_metrics is not None:
														
 
															+            summary.update({f"val_{key}": value for key, value in val_metrics.items()})
														
 
															+        if self.best_metric is not None:
														
 
															+            summary["best_metric"] = float(self.best_metric)
														
 
															+        summary["no_improve_epochs"] = self.no_improve_epochs
														
 
															+        lrs = self._current_lrs(getattr(self, "optimizer", None))
														
 
															+        if lrs:
														
 
															+            summary["lr"] = lrs[0]
														
 
															+        self._log_metrics(summary, step=epoch)
														
 
															+        should_stop = False
														
 
															+        if val_metrics is not None and self._early_stopping_enabled():
														
 
															+            should_stop = self.no_improve_epochs >= self._early_stopping_patience()
														
 
															+            summary["early_stop"] = should_stop
														
 
															+            summary["improved"] = improved
														
 
															+        return summary, should_stop
														
 
															+
														
 
															+    @abstractmethod
														
 
															+    def build(self) -> None:
														
 
															+        """
														
 
															+        创建模型、优化器、数据加载器等运行所需对象。
														
 
															+        """
														
 
															+
														
 
															+    @abstractmethod
														
 
															+    def train(self) -> None:
														
 
															+        """
														
 
															+        执行完整训练流程。
														
 
															+        """
														
--- a/lib/trainers/builder.py
+++ b/lib/trainers/builder.py
@@ -0,0 +1,27 @@
 
															+from __future__ import annotations
														
 
															+
														
 
															+from typing import Any
														
 
															+
														
 
															+from .base import BaseTrainer
														
 
															+from .supervised import SupervisedSegmentationTrainer
														
 
															+
														
 
															+
														
 
															+TRAINER_REGISTRY = {
														
 
															+    "supervised_segmentation": SupervisedSegmentationTrainer,
														
 
															+}
														
 
															+
														
 
															+
														
 
															+def build_trainer(cfg: dict[str, Any], args: Any | None = None) -> BaseTrainer:
														
 
															+    trainer_cfg = cfg.get("trainer", {})
														
 
															+    trainer_name = trainer_cfg.get("name", "supervised_segmentation")
														
 
															+    trainer_cls = TRAINER_REGISTRY.get(trainer_name)
														
 
															+    if trainer_cls is None:
														
 
															+        raise ValueError(
														
 
															+            f"Unsupported trainer '{trainer_name}'. Expected one of: {', '.join(TRAINER_REGISTRY)}."
														
 
															+        )
														
 
															+    trainer = trainer_cls(cfg=cfg, args=args)
														
 
															+    trainer.build()
														
 
															+    return trainer
														
 
															+
														
 
															+
														
 
															+__all__ = ["TRAINER_REGISTRY", "build_trainer"]
														
--- a/lib/trainers/supervised.py
+++ b/lib/trainers/supervised.py
@@ -0,0 +1,216 @@
 
															+from __future__ import annotations
														
 
															+
														
 
															+import time
														
 
															+from typing import Any
														
 
															+
														
 
															+import torch
														
 
															+from torch.utils.data import DataLoader
														
 
															+
														
 
															+from lib.modules import SegmentationNet2d
														
 
															+from lib.tools import (
														
 
															+    BinaryBoundaryLoss,
														
 
															+    MaskBoundaryConsistencyLoss,
														
 
															+    build_optimizer,
														
 
															+    build_scheduler,
														
 
															+    mask_to_boundary_map,
														
 
															+)
														
 
															+from .base import BaseTrainer
														
 
															+
														
 
															+
														
 
															+class SupervisedSegmentationTrainer(BaseTrainer):
														
 
															+    def __init__(self, cfg: dict[str, Any], args: Any | None = None) -> None:
														
 
															+        super().__init__(cfg=cfg, args=args)
														
 
															+        self.model: SegmentationNet2d | None = None
														
 
															+        self.optimizer = None
														
 
															+        self.scheduler = None
														
 
															+        self.loader: DataLoader | None = None
														
 
															+        self.val_loader: DataLoader | None = None
														
 
															+        self.seg_loss = None
														
 
															+        self.boundary_loss = BinaryBoundaryLoss()
														
 
															+        self.consistency_loss = MaskBoundaryConsistencyLoss()
														
 
															+
														
 
															+    def build(self) -> None:
														
 
															+        dataset_cfg = self.cfg["dataset"]
														
 
															+        model_cfg = self.cfg["model"]
														
 
															+        train_cfg = self.cfg["train"]
														
 
															+
														
 
															+        self.model = SegmentationNet2d(
														
 
															+            num_classes=dataset_cfg["num_classes"],
														
 
															+            model_name=model_cfg["model_name"],
														
 
															+            load_weights=model_cfg.get("load_weights", False),
														
 
															+            decoder_channels=model_cfg.get("decoder_channels"),
														
 
															+            fwta_wavelet=model_cfg.get("fwta_wavelet", "haar"),
														
 
															+            fwta_level=model_cfg.get("fwta_level", 1),
														
 
															+            fwta_sigma_ratio=model_cfg.get("fwta_sigma_ratio", 0.35),
														
 
															+            fwta_tau_fourier=model_cfg.get("fwta_tau_fourier", 0.15),
														
 
															+            fwta_gate_temperature=model_cfg.get("fwta_gate_temperature", 1.0),
														
 
															+        ).to(self.device)
														
 
															+
														
 
															+        self.optimizer = build_optimizer(self.model, self.cfg["optimizer"])
														
 
															+        self.scheduler = build_scheduler(self.optimizer, self.cfg.get("scheduler"))
														
 
															+        self.loader = self._build_segmentation_loader(
														
 
															+            split=str(dataset_cfg.get("split", "train")),
														
 
															+            split_file=dataset_cfg.get("split_file"),
														
 
															+            batch_size=self._resolve_batch_size("batch_size", 4),
														
 
															+            shuffle=bool(train_cfg.get("shuffle", True)),
														
 
															+        )
														
 
															+        self.val_loader = self._build_val_loader(
														
 
															+            batch_size=self._resolve_batch_size(
														
 
															+                "val_batch_size",
														
 
															+                int(train_cfg.get("batch_size", 4)),
														
 
															+            ),
														
 
															+            shuffle=False,
														
 
															+        )
														
 
															+        self._maybe_resume(
														
 
															+            module_map={"model": self.model},
														
 
															+            optimizer=self.optimizer,
														
 
															+            scheduler=self.scheduler,
														
 
															+        )
														
 
															+        self._init_swanlab()
														
 
															+
														
 
															+    def _compute_losses(
														
 
															+            self,
														
 
															+            image: torch.Tensor,
														
 
															+            mask: torch.Tensor,
														
 
															+    ) -> tuple[dict[str, torch.Tensor], dict[str, torch.Tensor]]:
														
 
															+        if self.model is None:
														
 
															+            raise RuntimeError("Model is not initialized.")
														
 
															+        with torch.autocast(device_type=self.device.type, enabled=self._amp_enabled()):
														
 
															+            outputs = self.model(image)
														
 
															+            seg_logits = outputs["seg_logits"]
														
 
															+            boundary_logits = outputs["boundary_logits"]
														
 
															+
														
 
															+            seg_loss = torch.nn.functional.binary_cross_entropy_with_logits(seg_logits, mask)
														
 
															+            boundary_target = mask_to_boundary_map(mask)
														
 
															+            boundary_loss = self.boundary_loss(boundary_logits, boundary_target)
														
 
															+            consistency_loss = self.consistency_loss(seg_logits, boundary_logits)
														
 
															+            total_loss = seg_loss + boundary_loss + 0.1 * consistency_loss
														
 
															+
														
 
															+        losses = {
														
 
															+            "total": total_loss,
														
 
															+            "seg": seg_loss,
														
 
															+            "boundary": boundary_loss,
														
 
															+            "consistency": consistency_loss,
														
 
															+        }
														
 
															+        return outputs, losses
														
 
															+
														
 
															+    @staticmethod
														
 
															+    def _detach_metrics(losses: dict[str, torch.Tensor]) -> dict[str, float]:
														
 
															+        return {key: float(value.detach().cpu()) for key, value in losses.items()}
														
 
															+
														
 
															+    def _validate(self) -> dict[str, float] | None:
														
 
															+        if self.model is None or self.val_loader is None:
														
 
															+            return None
														
 
															+
														
 
															+        self.model.eval()
														
 
															+        metrics = self._build_validation_metrics()
														
 
															+        total = 0.0
														
 
															+        seg = 0.0
														
 
															+        boundary = 0.0
														
 
															+        consistency = 0.0
														
 
															+        steps = 0
														
 
															+        with torch.no_grad():
														
 
															+            for batch in self.val_loader:
														
 
															+                image = batch["image"].to(self.device)
														
 
															+                mask = batch["mask"].to(self.device)
														
 
															+                outputs, losses = self._compute_losses(image, mask)
														
 
															+                total += float(losses["total"].detach().cpu())
														
 
															+                seg += float(losses["seg"].detach().cpu())
														
 
															+                boundary += float(losses["boundary"].detach().cpu())
														
 
															+                consistency += float(losses["consistency"].detach().cpu())
														
 
															+                self._update_validation_metrics(
														
 
															+                    metrics,
														
 
															+                    logits=outputs["seg_logits"],
														
 
															+                    target=mask,
														
 
															+                )
														
 
															+                steps += 1
														
 
															+
														
 
															+        if steps == 0:
														
 
															+            return None
														
 
															+        val_metrics = {
														
 
															+            "total": total / steps,
														
 
															+            "seg": seg / steps,
														
 
															+            "boundary": boundary / steps,
														
 
															+            "consistency": consistency / steps,
														
 
															+        }
														
 
															+        val_metrics.update(self._compute_validation_metric_values(metrics))
														
 
															+        return val_metrics
														
 
															+
														
 
															+    def train(self) -> None:
														
 
															+        if self.model is None or self.loader is None or self.optimizer is None:
														
 
															+            raise RuntimeError("Trainer.build() must be called before train().")
														
 
															+
														
 
															+        epochs = int(self.cfg["train"].get("epochs", 1))
														
 
															+        try:
														
 
															+            self._print_training_setup(
														
 
															+                model_map={"model": self.model},
														
 
															+                loader_map={"train": self.loader, "val": self.val_loader},
														
 
															+                optimizer=self.optimizer,
														
 
															+                scheduler=self.scheduler,
														
 
															+            )
														
 
															+            for epoch in range(self.start_epoch, epochs):
														
 
															+                self.model.train()
														
 
															+                train_metric_sums = {
														
 
															+                    "total": 0.0,
														
 
															+                    "seg": 0.0,
														
 
															+                    "boundary": 0.0,
														
 
															+                    "consistency": 0.0,
														
 
															+                }
														
 
															+                train_metrics: dict[str, float] | None = None
														
 
															+                end_time = time.perf_counter()
														
 
															+                num_steps = len(self.loader)
														
 
															+                for step, batch in enumerate(self.loader, start=1):
														
 
															+                    data_time = time.perf_counter() - end_time
														
 
															+                    iter_start = time.perf_counter()
														
 
															+                    image = batch["image"].to(self.device)
														
 
															+                    mask = batch["mask"].to(self.device)
														
 
															+                    _, losses = self._compute_losses(image, mask)
														
 
															+                    self.optimizer.zero_grad()
														
 
															+                    self.grad_scaler.scale(losses["total"]).backward()
														
 
															+                    grad_norm = None
														
 
															+                    if self._grad_clip_enabled():
														
 
															+                        self.grad_scaler.unscale_(self.optimizer)
														
 
															+                        grad_norm = self._clip_gradients(self.model)
														
 
															+                    self.grad_scaler.step(self.optimizer)
														
 
															+                    self.grad_scaler.update()
														
 
															+                    train_metrics = self._detach_metrics(losses)
														
 
															+                    if grad_norm is not None:
														
 
															+                        train_metrics["grad_norm"] = grad_norm
														
 
															+                    for key, value in train_metrics.items():
														
 
															+                        train_metric_sums.setdefault(key, 0.0)
														
 
															+                        train_metric_sums[key] += value
														
 
															+                    iter_time = time.perf_counter() - iter_start
														
 
															+                    self._maybe_log_step(
														
 
															+                        epoch=epoch,
														
 
															+                        step=step,
														
 
															+                        num_steps=num_steps,
														
 
															+                        data_time=data_time,
														
 
															+                        iter_time=iter_time,
														
 
															+                        metrics=train_metrics,
														
 
															+                        prefix="train",
														
 
															+                    )
														
 
															+                    end_time = time.perf_counter()
														
 
															+
														
 
															+                if self.scheduler is not None:
														
 
															+                    self.scheduler.step()
														
 
															+
														
 
															+                if train_metrics is None:
														
 
															+                    raise RuntimeError("Training loader is empty.")
														
 
															+                train_metrics = self._average_metric_sums(train_metric_sums, num_steps)
														
 
															+                val_metrics = self._validate() if self._should_validate(epoch) else None
														
 
															+                summary, should_stop = self._finalize_epoch(
														
 
															+                    epoch=epoch,
														
 
															+                    train_metrics=train_metrics,
														
 
															+                    val_metrics=val_metrics,
														
 
															+                    checkpoint_state={
														
 
															+                        "model": self.model.state_dict(),
														
 
															+                        "optimizer": self.optimizer.state_dict(),
														
 
															+                        "scheduler": self.scheduler.state_dict() if self.scheduler is not None else None,
														
 
															+                    },
														
 
															+                )
														
 
															+                print(summary)
														
 
															+                if should_stop:
														
 
															+                    print({"epoch": epoch, "message": "early stopping triggered"})
														
 
															+                    break
														
 
															+        finally:
														
 
															+            self._close_loggers()
														
--- a/tools/run_us_experiments.sh
+++ b/tools/run_us_experiments.sh
@@ -0,0 +1,91 @@
 
															+#!/usr/bin/env bash
														
 
															+set -euo pipefail
														
 
															+
														
 
															+ROOT_DIR="$(cd "$(dirname "${BASH_SOURCE[0]}")/.." && pwd)"
														
 
															+cd "$ROOT_DIR"
														
 
															+
														
 
															+# ===== 可直接改这里 =====
														
 
															+DATASET="${DATASET:-BUSI}"          # BUS-UCLM | BUSI | BUS-BRA | BUS_UC | CCAUI | DDTI | OTU_2d | TN3K | TG3K
														
 
															+SEED="${SEED:-42}"
														
 
															+RUN_ALL_SUP="${RUN_ALL_SUP:-0}"     # 1 表示跑内置所有全监督实验
														
 
															+PYTHON_BIN="${PYTHON_BIN:-python}"
														
 
															+EXTRA_SET_ARGS="${EXTRA_SET_ARGS:-}"
														
 
															+
														
 
															+# ===== 数据集根目录 =====
														
 
															+dataset_root() {
														
 
															+  case "$1" in
														
 
															+    "BUS-UCLM") echo "data/BUS-UCLM" ;;
														
 
															+    "BUSI") echo "data/BUSI" ;;
														
 
															+    "BUS-BRA") echo "data/BUS-BRA" ;;
														
 
															+    "BUS_UC") echo "data/BUS_UC" ;;
														
 
															+    "CCAUI") echo "data/CCAUI" ;;
														
 
															+    "DDTI") echo "data/DDTI" ;;
														
 
															+    "OTU_2d") echo "data/OTU_2d" ;;
														
 
															+    "TN3K") echo "data/TN3K" ;;
														
 
															+    "TG3K") echo "data/TG3K" ;;
														
 
															+    *) echo "Unsupported dataset: $1" >&2; exit 1 ;;
														
 
															+  esac
														
 
															+}
														
 
															+
														
 
															+# ===== 是否需要项目级 train/val =====
														
 
															+needs_project_split() {
														
 
															+  case "$1" in
														
 
															+    "BUS-UCLM"|"BUSI"|"BUS-BRA"|"BUS_UC"|"CCAUI"|"DDTI") return 0 ;;
														
 
															+    *) return 1 ;;
														
 
															+  esac
														
 
															+}
														
 
															+
														
 
															+prepare_project_splits() {
														
 
															+  local dataset="$1"
														
 
															+  local root
														
 
															+  root="$(dataset_root "$dataset")"
														
 
															+
														
 
															+  if needs_project_split "$dataset"; then
														
 
															+    echo "[split] generate project split for ${dataset}"
														
 
															+    "$PYTHON_BIN" tmp/generate_project_split.py --dataset "$dataset" --root "$root" --seed "$SEED"
														
 
															+  fi
														
 
															+}
														
 
															+
														
 
															+run_supervised() {
														
 
															+  local dataset="$1"
														
 
															+  local root
														
 
															+  root="$(dataset_root "$dataset")"
														
 
															+  prepare_project_splits "$dataset"
														
 
															+  echo "[train] supervised ${dataset}"
														
 
															+  "$PYTHON_BIN" tools/train.py \
														
 
															+    --config configs/segmentation/train_sup_us_template.yaml \
														
 
															+    --set \
														
 
															+      dataset.dataset_name="$dataset" \
														
 
															+      dataset.root="$root" \
														
 
															+      checkpoint.dir="outputs/experiments/supervised/${dataset}" \
														
 
															+      logging.experiment_name="sup_${dataset}" \
														
 
															+      ${EXTRA_SET_ARGS}
														
 
															+}
														
 
															+
														
 
															+run_all_supervised_suite() {
														
 
															+  local datasets=(
														
 
															+    "BUS-UCLM"
														
 
															+    "BUSI"
														
 
															+    "BUS-BRA"
														
 
															+    "BUS_UC"
														
 
															+    "CCAUI"
														
 
															+    "DDTI"
														
 
															+    "OTU_2d"
														
 
															+    "TN3K"
														
 
															+    "TG3K"
														
 
															+  )
														
 
															+  for ds in "${datasets[@]}"; do
														
 
															+    run_supervised "$ds"
														
 
															+  done
														
 
															+}
														
 
															+
														
 
															+main() {
														
 
															+  if [[ "$RUN_ALL_SUP" == "1" ]]; then
														
 
															+    run_all_supervised_suite
														
 
															+    exit 0
														
 
															+  fi
														
 
															+
														
 
															+  run_supervised "$DATASET"
														
 
															+}
														
 
															+
														
 
															+main "$@"
														
--- a/tools/summarize_results.py
+++ b/tools/summarize_results.py
@@ -0,0 +1,110 @@
 
															+from __future__ import annotations
														
 
															+
														
 
															+import argparse
														
 
															+import csv
														
 
															+from pathlib import Path
														
 
															+from typing import Any
														
 
															+
														
 
															+import torch
														
 
															+
														
 
															+
														
 
															+def _infer_mode(path: Path) -> str:
														
 
															+    parts = set(path.parts)
														
 
															+    if "supervised" in parts:
														
 
															+        return "supervised"
														
 
															+    return "unknown"
														
 
															+
														
 
															+
														
 
															+def _infer_dataset(ckpt: dict[str, Any], path: Path) -> str:
														
 
															+    cfg = ckpt.get("cfg", {})
														
 
															+    dataset_cfg = cfg.get("dataset", {})
														
 
															+    dataset_name = dataset_cfg.get("dataset_name") or dataset_cfg.get("name")
														
 
															+    if dataset_name:
														
 
															+        return str(dataset_name)
														
 
															+
														
 
															+    parts = path.parts
														
 
															+    if "supervised" in parts:
														
 
															+        idx = parts.index("supervised")
														
 
															+        if idx + 1 < len(parts):
														
 
															+            return parts[idx + 1]
														
 
															+    return "unknown"
														
 
															+
														
 
															+
														
 
															+def _infer_ratio(ckpt: dict[str, Any], path: Path) -> str:
														
 
															+    return "-"
														
 
															+
														
 
															+
														
 
															+def _extract_metric(metrics: dict[str, Any], *names: str) -> float | None:
														
 
															+    for name in names:
														
 
															+        value = metrics.get(name)
														
 
															+        if value is not None:
														
 
															+            return float(value)
														
 
															+    return None
														
 
															+
														
 
															+
														
 
															+def collect_rows(outputs_dir: Path) -> list[dict[str, Any]]:
														
 
															+    rows: list[dict[str, Any]] = []
														
 
															+    for best_path in sorted(outputs_dir.rglob("best.pth")):
														
 
															+        ckpt = torch.load(best_path, map_location="cpu")
														
 
															+        metrics = ckpt.get("metrics", {}) or {}
														
 
															+        row = {
														
 
															+            "dataset": _infer_dataset(ckpt, best_path),
														
 
															+            "mode": _infer_mode(best_path),
														
 
															+            "ratio": _infer_ratio(ckpt, best_path),
														
 
															+            "epoch": ckpt.get("epoch"),
														
 
															+            "best_metric": ckpt.get("best_metric"),
														
 
															+            "dice": _extract_metric(metrics, "val_dice", "dice"),
														
 
															+            "iou": _extract_metric(metrics, "val_iou", "val_miou", "iou", "miou"),
														
 
															+            "checkpoint": str(best_path),
														
 
															+        }
														
 
															+        rows.append(row)
														
 
															+    return rows
														
 
															+
														
 
															+
														
 
															+def write_csv(rows: list[dict[str, Any]], path: Path) -> None:
														
 
															+    path.parent.mkdir(parents=True, exist_ok=True)
														
 
															+    fieldnames = ["dataset", "mode", "ratio", "epoch", "best_metric", "dice", "iou", "checkpoint"]
														
 
															+    with path.open("w", encoding="utf-8", newline="") as handle:
														
 
															+        writer = csv.DictWriter(handle, fieldnames=fieldnames)
														
 
															+        writer.writeheader()
														
 
															+        writer.writerows(rows)
														
 
															+
														
 
															+
														
 
															+def write_markdown(rows: list[dict[str, Any]], path: Path) -> None:
														
 
															+    path.parent.mkdir(parents=True, exist_ok=True)
														
 
															+    lines = [
														
 
															+        "# 实验结果汇总",
														
 
															+        "",
														
 
															+        "| dataset | mode | ratio | epoch | best_metric | dice | iou | checkpoint |",
														
 
															+        "| --- | --- | --- | --- | --- | --- | --- | --- |",
														
 
															+    ]
														
 
															+    for row in rows:
														
 
															+        lines.append(
														
 
															+            f"| {row['dataset']} | {row['mode']} | {row['ratio']} | {row['epoch']} | "
														
 
															+            f"{row['best_metric']} | {row['dice']} | {row['iou']} | {row['checkpoint']} |"
														
 
															+        )
														
 
															+    if not rows:
														
 
															+        lines.append("| - | - | - | - | - | - | - | - |")
														
 
															+    path.write_text("\n".join(lines) + "\n", encoding="utf-8")
														
 
															+
														
 
															+
														
 
															+def main() -> None:
														
 
															+    parser = argparse.ArgumentParser(description="Summarize best experiment results from best.pth files.")
														
 
															+    parser.add_argument("--outputs-dir", default="outputs", help="Root output directory")
														
 
															+    parser.add_argument("--results-dir", default="results", help="Directory to write summary tables")
														
 
															+    args = parser.parse_args()
														
 
															+
														
 
															+    outputs_dir = Path(args.outputs_dir)
														
 
															+    results_dir = Path(args.results_dir)
														
 
															+    rows = collect_rows(outputs_dir)
														
 
															+
														
 
															+    csv_path = results_dir / "experiment_summary.csv"
														
 
															+    md_path = results_dir / "experiment_summary.md"
														
 
															+    write_csv(rows, csv_path)
														
 
															+    write_markdown(rows, md_path)
														
 
															+
														
 
															+    print({"num_results": len(rows), "csv": str(csv_path), "markdown": str(md_path)})
														
 
															+
														
 
															+
														
 
															+if __name__ == "__main__":
														
 
															+    main()
														
--- a/tools/summarize_results.sh
+++ b/tools/summarize_results.sh
@@ -0,0 +1,15 @@
 
															+#!/usr/bin/env bash
														
 
															+set -euo pipefail
														
 
															+
														
 
															+ROOT_DIR="$(cd "$(dirname "${BASH_SOURCE[0]}")/.." && pwd)"
														
 
															+cd "$ROOT_DIR"
														
 
															+
														
 
															+PYTHON_BIN="${PYTHON_BIN:-python}"
														
 
															+OUTPUTS_DIR="${OUTPUTS_DIR:-outputs}"
														
 
															+RESULTS_DIR="${RESULTS_DIR:-results}"
														
 
															+
														
 
															+"$PYTHON_BIN" tools/summarize_results.py --outputs-dir "$OUTPUTS_DIR" --results-dir "$RESULTS_DIR"
														
 
															+
														
 
															+echo "[done] results written to:"
														
 
															+echo "  - ${RESULTS_DIR}/experiment_summary.csv"
														
 
															+echo "  - ${RESULTS_DIR}/experiment_summary.md"
														
--- a/tools/train.py
+++ b/tools/train.py
@@ -0,0 +1,53 @@
 
															+from __future__ import annotations
														
 
															+
														
 
															+import argparse
														
 
															+import sys
														
 
															+from pathlib import Path
														
 
															+
														
 
															+ROOT_DIR = Path(__file__).resolve().parents[1]
														
 
															+if str(ROOT_DIR) not in sys.path:
														
 
															+    sys.path.insert(0, str(ROOT_DIR))
														
 
															+
														
 
															+from lib.trainers import build_trainer
														
 
															+from lib.utils.config import apply_dotlist_overrides, load_yaml_config
														
 
															+
														
 
															+
														
 
															+def parse_args() -> argparse.Namespace:
														
 
															+    parser = argparse.ArgumentParser(description="Unified training entrypoint.")
														
 
															+    parser.add_argument(
														
 
															+        "--config",
														
 
															+        type=str,
														
 
															+        required=True,
														
 
															+        help="Path to yaml config.",
														
 
															+    )
														
 
															+    parser.add_argument(
														
 
															+        "--trainer",
														
 
															+        type=str,
														
 
															+        default=None,
														
 
															+        help="Override trainer name from config.",
														
 
															+    )
														
 
															+    parser.add_argument(
														
 
															+        "--set",
														
 
															+        nargs="*",
														
 
															+        default=None,
														
 
															+        help="Override config values with key=value pairs, e.g. train.epochs=2 model.load_weights=false",
														
 
															+    )
														
 
															+    return parser.parse_args()
														
 
															+
														
 
															+
														
 
															+def main() -> None:
														
 
															+    args = parse_args()
														
 
															+    cfg_path = ROOT_DIR / args.config if not Path(args.config).is_absolute() else Path(args.config)
														
 
															+    cfg = load_yaml_config(cfg_path)
														
 
															+    cfg = apply_dotlist_overrides(cfg, args.set)
														
 
															+
														
 
															+    if args.trainer is not None:
														
 
															+        cfg.setdefault("trainer", {})
														
 
															+        cfg["trainer"]["name"] = args.trainer
														
 
															+
														
 
															+    trainer = build_trainer(cfg, args=args)
														
 
															+    trainer.train()
														
 
															+
														
 
															+
														
 
															+if __name__ == "__main__":
														
 
															+    main()