vllm/executor at c42590f97a8fd7bcc22137777f031eeee6df8187 - vllm

History

Kunshang Ji c42590f97a [Hardware] [Intel GPU] refactor xpu worker/executor (#7686 )		2024-08-20 09:54:10 -07:00
..
__init__.py	Add distributed model executor abstraction (#3191 )	2024-03-11 11:03:45 -07:00
cpu_executor.py	[VLM] Refactor `MultiModalConfig` initialization and profiling (#7530 )	2024-08-17 13:30:55 -07:00
distributed_gpu_executor.py	[Core] Introduce SPMD worker execution using Ray accelerated DAG (#6032 )	2024-07-17 22:27:09 -07:00
executor_base.py	[VLM] Refactor `MultiModalConfig` initialization and profiling (#7530 )	2024-08-17 13:30:55 -07:00
gpu_executor.py	[Core] Refactor executor classes for easier inheritance (#7673 )	2024-08-20 00:56:50 -07:00
msgspec_utils.py	[Core] Optimize SPMD architecture with delta + serialization optimization (#7109 )	2024-08-18 17:57:20 -07:00
multiproc_gpu_executor.py	[cuda][misc] remove error_on_invalid_device_count_status (#7069 )	2024-08-02 00:14:21 -07:00
multiproc_worker_utils.py	[Core][Doc] Default to multiprocessing for single-node distributed case (#5230 )	2024-06-11 11:10:41 -07:00
neuron_executor.py	[Bugfix] update neuron for version > 0.5.0 (#7175 )	2024-08-15 09:44:14 -07:00
openvino_executor.py	[VLM] Refactor `MultiModalConfig` initialization and profiling (#7530 )	2024-08-17 13:30:55 -07:00
ray_gpu_executor.py	[Core] Refactor executor classes for easier inheritance (#7673 )	2024-08-20 00:56:50 -07:00
ray_tpu_executor.py	[Hardware][TPU] Implement tensor parallelism with Ray (#5871 )	2024-07-26 20:54:27 -07:00
ray_utils.py	[Core] Optimize SPMD architecture with delta + serialization optimization (#7109 )	2024-08-18 17:57:20 -07:00
ray_xpu_executor.py	[VLM] Refactor `MultiModalConfig` initialization and profiling (#7530 )	2024-08-17 13:30:55 -07:00
tpu_executor.py	[VLM] Refactor `MultiModalConfig` initialization and profiling (#7530 )	2024-08-17 13:30:55 -07:00
xpu_executor.py	[Hardware] [Intel GPU] refactor xpu worker/executor (#7686 )	2024-08-20 09:54:10 -07:00