vllm/master at e9d3f2ff7772c8efe41dc805cec71c223ec18ec8 - vllm

History

Woosuk Kwon e9d3f2ff77 Add memory analyzer & utomatically configure KV cache size (#6 )		2023-03-11 23:23:14 -08:00
..
block_manager.py	Implement `single_query_cached_kv_attention` kernel (#3 )	2023-03-01 15:02:19 -08:00
frontend.py	Support beam search & parallel generation (#7 )	2023-03-10 09:58:21 -08:00
scheduler.py	Add memory analyzer & utomatically configure KV cache size (#6 )	2023-03-11 23:23:14 -08:00