网站地图官方微信:
网站首页 包装项目合作 包装产品加工 圆珠笔 眼镜架 验钞机 文件柜

当前位置: 首页 >

写CUDA到底难在哪?

对GPU进行性能优化时,cudagraph是绕不开的话题。

不仅是GPU,大部分的xpu都会提供类似graph mode的优化,相比于每次分别由CPU进行kernel launch的eager mode,graph mode通常都会有较大性能提升,然而也经常容易出现各种各样的奇怪问题。

NVIDIA有一个简单的 博客 介绍,其中只使用了stream capture的形式来构造cudagraph,而且本质上就是多个kernel前后提交,根本无法展示cudagraph的复杂性。

本文尝试从底层原理出发,根据文档 和 …。

写CUDA到底难在哪?

  • | 为什么是 9 月 3 日阅兵而不是 10 月 1 日国庆阅兵? |

    今年的9.3阅兵,可能是新中国成立以来最震撼、质量最高、规模...

    查看详情>>
  • | 为什么pH不用dB作为单位? |

  • | 有哪些新生代没见过或者无法理解的 Windows XP 7 时代的事情? |

  • | 为什么现在糖尿病越来越多? |

  • | 女明星穿瑜伽裤出门是什么体验? |

  • | 为什么安踏还不能和 Nike 相抗衡? |

  • | 如何评价网传鸿蒙 PC 成功裸机启动 Windows ARM? |

  • | 大家有什么被中医震惊征服的经历吗? |

  • | 感觉失业就会死,求生路!? |

  • | 现在写 J***aScript 的是不是已经没人在用 class 这个关键字了? |

  • | 听说有一门技术叫windows批处理(bat),请问它有什么现实用途? |

  • 没TS之前,哪怕代码再屎,不怎么懂前端的后端随随便便就知道改...

    2025-06-27
  • 说实话,Cursor/Augment Code/ Claud...

    2025-06-27
  • 喜欢就买 小蚁微单m1,前小米旗下企业,配了两个***代...

    2025-06-27
  • 我选Lar***el 优秀的文档Larv***el的文档精致...

    2025-06-27

关注我们

添加微信好友,关注最新动态