longfei li
|
5ac163f95c
|
加上一些点优化的脚本。
|
2025-04-12 14:21:52 +08:00 |
|
longfei li
|
baaa5dbc1c
|
也是可以的,总体用起来还真是方便,还有什么稀奇的用法呢,可以继续研究一下。
|
2025-04-12 13:25:22 +08:00 |
|
longfei li
|
9bc678f9a6
|
block的东西感觉差不多了。接着再实现一个多维的。
|
2025-04-12 13:11:54 +08:00 |
|
longfei li
|
4be98aed30
|
seems like merge to kernel together is faster.
|
2025-03-29 16:37:38 +08:00 |
|
long0x0
|
93b10bb894
|
简单修改一下。
|
2025-03-29 11:56:50 +08:00 |
|
long0x0
|
374cd36597
|
看起来尺寸大了以后效果可能会有差异。
|
2025-03-28 23:29:41 +08:00 |
|
long0x0
|
4774d3ef39
|
简单实现一个triton的矩阵乘法,感觉基本上就差不多了,可以快速用这个东西验证一些东西。
|
2025-03-28 23:20:58 +08:00 |
|
long0x0
|
e33d87b0aa
|
Merge branch 'main' of http://192.168.0.100:3000/squall/torch_ext
|
2025-03-28 22:19:30 +08:00 |
|
long0x0
|
89e3b9d190
|
本地修改一下。
|
2025-03-28 22:19:03 +08:00 |
|
longfei li
|
a1aa7fd0d6
|
Merge branch 'main' of http://192.168.0.100:3000/squall/torch_ext
|
2025-03-27 03:49:33 +08:00 |
|
longfei li
|
c77f9602ea
|
test triton, seems like very well.
|
2025-03-27 03:44:28 +08:00 |
|
long0x0
|
920ebe0f88
|
简单修改一下。
|
2025-01-04 13:47:42 +08:00 |
|
long0x0
|
80d7be70a5
|
简单修改一下。
|
2024-12-29 15:49:53 +08:00 |
|
longfei li
|
58093d7a71
|
试了一下写softmax,又学到一点。可以了
|
2024-12-29 01:23:00 +08:00 |
|
longfei li
|
acdacc2592
|
测试一下。
|
2024-12-27 21:55:12 +08:00 |
|
long0x0
|
0a6b5493fa
|
全都提交一下。
|
2024-12-14 13:34:30 +08:00 |
|
longfei li
|
4da12fd0c2
|
多维的问题也实验了一下,看起来还不错的样子。
|
2024-11-22 22:31:57 +08:00 |
|
longfei li
|
bf81e39d83
|
简单修改一下。
|
2024-11-18 22:13:43 +08:00 |
|
longfei li
|
a43baa8b7f
|
test multi dimension matrix multiply
|
2024-11-18 19:54:12 +08:00 |
|
longfei li
|
2285b8b6f2
|
修改一下
|
2024-11-17 09:25:37 +08:00 |
|
longfei li
|
8ae9fb6819
|
简单提交一下。
|
2024-11-16 19:26:54 +08:00 |
|