flash-attention

Author	SHA1	Message	Date
Tri Dao	b4018a5028	Implement Tensor Parallel for GPT model	2022-12-26 16:22:43 -08:00
Tri Dao	13cdceb377	Implement last_layer_subset optimization for BERT	2022-12-19 22:18:46 -08:00
Tri Dao	5fb6df0e04	Implement BERT	2022-12-18 21:47:27 -08:00

1 2