vllm/csrc/pos_encoding.cpp

#include <torch/extension.h>

void rotary_embedding(
  torch::Tensor& positions,
  torch::Tensor& query,
  torch::Tensor& key,
  int head_size,
  torch::Tensor& cos_sin_cache,
  bool is_neox);

PYBIND11_MODULE(TORCH_EXTENSION_NAME, m) {
  m.def(
    "rotary_embedding",
    &rotary_embedding,
    "Apply GPT-NeoX or GPT-J style rotary embedding to query and key");
}
Implement custom kernel for LLaMA rotary embedding (#14) 2023-03-31 02:04:21 +08:00			`#include <torch/extension.h>`

[BugFix] Implement RoPE for GPT-J (#941) 2023-09-06 10:54:33 +08:00			`void rotary_embedding(`
Implement custom kernel for LLaMA rotary embedding (#14) 2023-03-31 02:04:21 +08:00			`torch::Tensor& positions,`
			`torch::Tensor& query,`
			`torch::Tensor& key,`
Add support for GPT-NeoX (Pythia) (#50) 2023-04-28 15:32:10 +08:00			`int head_size,`
[BugFix] Implement RoPE for GPT-J (#941) 2023-09-06 10:54:33 +08:00			`torch::Tensor& cos_sin_cache,`
			`bool is_neox);`
Implement custom kernel for LLaMA rotary embedding (#14) 2023-03-31 02:04:21 +08:00
			`PYBIND11_MODULE(TORCH_EXTENSION_NAME, m) {`
			`m.def(`
[BugFix] Implement RoPE for GPT-J (#941) 2023-09-06 10:54:33 +08:00			`"rotary_embedding",`
			`&rotary_embedding,`
			`"Apply GPT-NeoX or GPT-J style rotary embedding to query and key");`
Implement custom kernel for LLaMA rotary embedding (#14) 2023-03-31 02:04:21 +08:00			`}`