vllm/async_engine at e575df33b1963212f79b2efddd45d53225fa5c45 - vllm

History

Zhuohan Li 9d9072a069 Implement prompt logprobs & Batched topk for computing logprobs (#1328 ) Co-authored-by: Yunmo Chen <16273544+wanmok@users.noreply.github.com>		2023-10-16 10:56:50 -07:00
..
api_server_async_engine.py	TP/quantization/weight loading refactor part 1 - Simplify parallel linear logic (#1181 )	2023-10-02 15:36:09 -07:00
test_api_server.py	TP/quantization/weight loading refactor part 1 - Simplify parallel linear logic (#1181 )	2023-10-02 15:36:09 -07:00
test_async_llm_engine.py	TP/quantization/weight loading refactor part 1 - Simplify parallel linear logic (#1181 )	2023-10-02 15:36:09 -07:00
test_request_tracker.py	Implement prompt logprobs & Batched topk for computing logprobs (#1328 )	2023-10-16 10:56:50 -07:00