[Bugfix][TPU] Do not use torch.Generator for TPUs (#6981)

2024-07-31 18:50:28 -07:00 · 2024-07-31 18:50:28 -07:00 · 23993a7997
commit 23993a7997
parent 1d2e7fb73f
1 changed files with 6 additions and 0 deletions
--- a/vllm/model_executor/model_loader/weight_utils.py
+++ b/vllm/model_executor/model_loader/weight_utils.py
@ -22,6 +22,7 @@ from vllm.logger import init_logger
 from vllm.model_executor.layers.quantization import (QuantizationConfig,
                                                     get_quantization_config)
 from vllm.model_executor.layers.quantization.schema import QuantParamSchema
 from vllm.platforms import current_platform
 from vllm.utils import print_warning_once
 logger = init_logger(__name__)
@ -490,6 +491,11 @@ def initialize_dummy_weights(
    """
    for param in model.state_dict().values():
        if torch.is_floating_point(param):
            if current_platform.is_tpu():
                # XLA device does not support torch.Generator()
                param.uniform_(low, high)
                continue
            generator = torch.Generator(device=param.data.device)
            generator.manual_seed(seed)
            if torch.finfo(param.data.dtype).bits < 16: