Commit Graph

21 Commits

Author SHA1 Message Date
longfei li
5ac163f95c 加上一些点优化的脚本。 2025-04-12 14:21:52 +08:00
longfei li
baaa5dbc1c 也是可以的,总体用起来还真是方便,还有什么稀奇的用法呢,可以继续研究一下。 2025-04-12 13:25:22 +08:00
longfei li
9bc678f9a6 block的东西感觉差不多了。接着再实现一个多维的。 2025-04-12 13:11:54 +08:00
longfei li
4be98aed30 seems like merge to kernel together is faster. 2025-03-29 16:37:38 +08:00
long0x0
93b10bb894 简单修改一下。 2025-03-29 11:56:50 +08:00
long0x0
374cd36597 看起来尺寸大了以后效果可能会有差异。 2025-03-28 23:29:41 +08:00
long0x0
4774d3ef39 简单实现一个triton的矩阵乘法,感觉基本上就差不多了,可以快速用这个东西验证一些东西。 2025-03-28 23:20:58 +08:00
long0x0
e33d87b0aa Merge branch 'main' of http://192.168.0.100:3000/squall/torch_ext 2025-03-28 22:19:30 +08:00
long0x0
89e3b9d190 本地修改一下。 2025-03-28 22:19:03 +08:00
longfei li
a1aa7fd0d6 Merge branch 'main' of http://192.168.0.100:3000/squall/torch_ext 2025-03-27 03:49:33 +08:00
longfei li
c77f9602ea test triton, seems like very well. 2025-03-27 03:44:28 +08:00
long0x0
920ebe0f88 简单修改一下。 2025-01-04 13:47:42 +08:00
long0x0
80d7be70a5 简单修改一下。 2024-12-29 15:49:53 +08:00
longfei li
58093d7a71 试了一下写softmax,又学到一点。可以了 2024-12-29 01:23:00 +08:00
longfei li
acdacc2592 测试一下。 2024-12-27 21:55:12 +08:00
long0x0
0a6b5493fa 全都提交一下。 2024-12-14 13:34:30 +08:00
longfei li
4da12fd0c2 多维的问题也实验了一下,看起来还不错的样子。 2024-11-22 22:31:57 +08:00
longfei li
bf81e39d83 简单修改一下。 2024-11-18 22:13:43 +08:00
longfei li
a43baa8b7f test multi dimension matrix multiply 2024-11-18 19:54:12 +08:00
longfei li
2285b8b6f2 修改一下 2024-11-17 09:25:37 +08:00
longfei li
8ae9fb6819 简单提交一下。 2024-11-16 19:26:54 +08:00