vllm/kernels at 0f40557af6141ced118b81f2a04e651a0c6c9dbd - vllm

History

Woosuk Kwon 0f40557af6 Implement block copy kernel to optimize beam search (#32 )		2023-04-07 17:45:07 -07:00
..
activation.py	Optimize data movement (#20 )	2023-04-02 00:30:17 -07:00
attention.py	Basic attention kernel that supports cached KV + (multi-)prompts (#24 )	2023-04-04 20:34:46 -07:00
cache.py	Implement block copy kernel to optimize beam search (#32 )	2023-04-07 17:45:07 -07:00
layernorm.py	Add custom kernel for RMS normalization (#16 )	2023-04-01 00:51:22 +08:00
pos_encoding.py	Optimize data movement (#20 )	2023-04-02 00:30:17 -07:00