OneTrainer/modules/modelSetup/BaseModelSetup.py at main · pythonlearner1025/OneTrainer

166 lines (146 loc) · 4.48 KB
from abc import ABCMeta, abstractmethod
from typing import Iterable, Iterator
import torch
from torch import Tensor
from torch.nn import Parameter
from modules.model.BaseModel import BaseModel
from modules.util.TimedActionMixin import TimedActionMixin
from modules.util.TrainProgress import TrainProgress
from modules.util.config.TrainConfig import TrainConfig
from modules.util.enum.LearningRateScaler import LearningRateScaler
class BaseModelSetup(
    TimedActionMixin,
    metaclass=ABCMeta,
    def __init__(
            self,
            train_device: torch.device,
            temp_device: torch.device,
            debug_mode: bool,
        super(BaseModelSetup, self).__init__()
        self.train_device = train_device
        self.temp_device = temp_device
        self.debug_mode = debug_mode
    @abstractmethod
    def create_parameters(
            self,
            model: BaseModel,
            config: TrainConfig,
    ) -> Iterable[Parameter]:
        pass
    def create_parameters_for_optimizer(
            self,
            model: BaseModel,
            config: TrainConfig,
    ) -> Iterable[Parameter] | list[dict]:
        return self.create_parameters(model, config)
    @abstractmethod
    def setup_model(
            self,
            model: BaseModel,
            config: TrainConfig,
        pass
    @abstractmethod
    def setup_train_device(
            self,
            model: BaseModel,
            config: TrainConfig,
        pass
    @abstractmethod
    def predict(
            self,
            model: BaseModel,
            batch: dict,
            config: TrainConfig,
            train_progress: TrainProgress,
            deterministic: bool = False,
    ) -> dict:
        pass
    @abstractmethod
    def calculate_loss(
            self,
            model: BaseModel,
            batch: dict,
            data: dict,
            config: TrainConfig,
    ) -> Tensor:
        pass
    @abstractmethod
    def after_optimizer_step(
            self,
            model: BaseModel,
            config: TrainConfig,
            train_progress: TrainProgress,
        pass
    def create_param_groups(
            self,
            config: TrainConfig,
            params: Iterator[Parameter] | list[Parameter],
            lr_arg: float,
    ) -> dict:
        batch_size_scale = 1 if config.learning_rate_scaler in [
            LearningRateScaler.NONE,
            LearningRateScaler.GRADIENT_ACCUMULATION,
        ] else config.batch_size
        gradient_accumulation_steps_scale = 1 if config.learning_rate_scaler in [
            LearningRateScaler.NONE,
            LearningRateScaler.BATCH,
        ] else config.gradient_accumulation_steps
        # Determine the learning rate
        lr = lr_arg if lr_arg is not None else config.learning_rate
        lr = lr * ((batch_size_scale * gradient_accumulation_steps_scale) ** 0.5)
        # Create a parameter group for the text encoder
        return {
            'params': list(params),
            'lr': lr,
            'initial_lr': lr,
    def stop_unet_training_elapsed(
            self,
            config: TrainConfig,
            train_progress: TrainProgress,
        return self.single_action_elapsed(
            "stop_unet_training",
            config.unet.stop_training_after,
            config.unet.stop_training_after_unit,
            train_progress,
    def stop_prior_training_elapsed(
            self,
            config: TrainConfig,
            train_progress: TrainProgress,
        return self.single_action_elapsed(
            "stop_prior_training",
            config.prior.stop_training_after,
            config.prior.stop_training_after_unit,
            train_progress,
    def stop_text_encoder_training_elapsed(
            self,
            config: TrainConfig,
            train_progress: TrainProgress,
        return self.single_action_elapsed(
            "stop_text_encoder_training",
            config.text_encoder.stop_training_after,
            config.text_encoder.stop_training_after_unit,
            train_progress,
    def stop_text_encoder_2_training_elapsed(
            self,
            config: TrainConfig,
            train_progress: TrainProgress,
        return self.single_action_elapsed(
            "stop_text_encoder_2_training",
            config.text_encoder_2.stop_training_after,
            config.text_encoder_2.stop_training_after_unit,
            train_progress,
Provide feedback

Saved searches

Use saved searches to filter your results more quickly

FilesExpand file tree

BaseModelSetup.py

Latest commit

History

BaseModelSetup.py

File metadata and controls