Commit Graph

  • 5ac163f95c 加上一些点优化的脚本。 main longfei li 2025-04-12 14:21:52 +0800
  • baaa5dbc1c 也是可以的,总体用起来还真是方便,还有什么稀奇的用法呢,可以继续研究一下。 longfei li 2025-04-12 13:25:22 +0800
  • 9bc678f9a6 block的东西感觉差不多了。接着再实现一个多维的。 longfei li 2025-04-12 13:11:54 +0800
  • 4be98aed30 seems like merge to kernel together is faster. longfei li 2025-03-29 16:37:38 +0800
  • 93b10bb894 简单修改一下。 long0x0 2025-03-29 11:56:50 +0800
  • 374cd36597 看起来尺寸大了以后效果可能会有差异。 long0x0 2025-03-28 23:29:41 +0800
  • 4774d3ef39 简单实现一个triton的矩阵乘法,感觉基本上就差不多了,可以快速用这个东西验证一些东西。 long0x0 2025-03-28 23:20:58 +0800
  • e33d87b0aa Merge branch 'main' of http://192.168.0.100:3000/squall/torch_ext long0x0 2025-03-28 22:19:30 +0800
  • 89e3b9d190 本地修改一下。 long0x0 2025-03-28 22:19:03 +0800
  • a1aa7fd0d6 Merge branch 'main' of http://192.168.0.100:3000/squall/torch_ext longfei li 2025-03-27 03:49:33 +0800
  • c77f9602ea test triton, seems like very well. longfei li 2025-03-27 03:44:28 +0800
  • 920ebe0f88 简单修改一下。 long0x0 2025-01-04 13:47:42 +0800
  • 80d7be70a5 简单修改一下。 long0x0 2024-12-29 15:49:53 +0800
  • 58093d7a71 试了一下写softmax,又学到一点。可以了 longfei li 2024-12-29 01:23:00 +0800
  • acdacc2592 测试一下。 longfei li 2024-12-27 21:55:12 +0800
  • 0a6b5493fa 全都提交一下。 long0x0 2024-12-14 13:34:30 +0800
  • 4da12fd0c2 多维的问题也实验了一下,看起来还不错的样子。 longfei li 2024-11-22 22:31:57 +0800
  • bf81e39d83 简单修改一下。 longfei li 2024-11-18 22:13:43 +0800
  • a43baa8b7f test multi dimension matrix multiply longfei li 2024-11-18 19:54:12 +0800
  • 2285b8b6f2 修改一下 longfei li 2024-11-17 09:25:37 +0800
  • 8ae9fb6819 简单提交一下。 longfei li 2024-11-16 19:26:54 +0800