Fix Stream-K reduce bug in epilogue with broadcast (#1224)
Co-authored-by: Ali Hassani <ahassanijr@gmail.com>
This commit is contained in:
parent
e9e30c2304
commit
a75b4ac483
@ -946,13 +946,13 @@ private:
|
|||||||
//
|
//
|
||||||
|
|
||||||
if (OutputOp::kStoreZ) {
|
if (OutputOp::kStoreZ) {
|
||||||
|
destination_iterator += reduce_fragment_idx;
|
||||||
destination_iterator.store(frag_Z);
|
destination_iterator.store(frag_Z);
|
||||||
++destination_iterator;
|
|
||||||
}
|
}
|
||||||
|
|
||||||
if (OutputOp::kStoreT) {
|
if (OutputOp::kStoreT) {
|
||||||
|
tensor_iterator += reduce_fragment_idx;
|
||||||
tensor_iterator.store(frag_T);
|
tensor_iterator.store(frag_T);
|
||||||
++tensor_iterator;
|
|
||||||
}
|
}
|
||||||
}
|
}
|
||||||
};
|
};
|
||||||
@ -1698,13 +1698,13 @@ private:
|
|||||||
//
|
//
|
||||||
|
|
||||||
if (OutputOp::kStoreZ) {
|
if (OutputOp::kStoreZ) {
|
||||||
|
destination_iterator += reduce_fragment_idx;
|
||||||
destination_iterator.store(frag_Z);
|
destination_iterator.store(frag_Z);
|
||||||
++destination_iterator;
|
|
||||||
}
|
}
|
||||||
|
|
||||||
if (OutputOp::kStoreT) {
|
if (OutputOp::kStoreT) {
|
||||||
|
tensor_iterator += reduce_fragment_idx;
|
||||||
tensor_iterator.store(frag_T);
|
tensor_iterator.store(frag_T);
|
||||||
++tensor_iterator;
|
|
||||||
}
|
}
|
||||||
}
|
}
|
||||||
};
|
};
|
||||||
|
Loading…
Reference in New Issue
Block a user