vllm/server at 655a5e48df3937bf793add53aa95ce0c992a24c6 - vllm

History

Woosuk Kwon 655a5e48df Introduce LLM class for offline inference (#115 )		2023-05-21 17:04:18 -07:00
..
arg_utils.py	Introduce LLM class for offline inference (#115 )	2023-05-21 17:04:18 -07:00
llm_server.py	Introduce LLM class for offline inference (#115 )	2023-05-21 17:04:18 -07:00
ray_utils.py	Refactor system architecture (#109 )	2023-05-20 13:06:59 -07:00
tokenizer_utils.py	Refactor system architecture (#109 )	2023-05-20 13:06:59 -07:00