【Triton 教程】math-ops

张开发
2026/4/19 4:16:33 15 分钟阅读

分享文章

【Triton 教程】math-ops
Triton 是一种用于并行编程的语言和编译器。它旨在提供一个基于 Python 的编程环境以高效编写自定义 DNN 计算内核并能够在现代 GPU 硬件上以最大吞吐量运行。*在线运行 Triton 学习教程 → go.hyper.ai/wS9x1triton_language.abstriton.language.abs(x)计算x的逐元素绝对值。参数****x(Block) - 输入值。triton_language.cdivtriton.language.cdiv(x,div)计算x除以div的向上取整结果。参数x(Block) - 输入数字。div(Block) - 除数。这个函数也可作为tensor的成员函数调用例如x.div(...)而不是div(x, ...)。triton_language.ceiltriton.language.ceil(x)计算x的逐元素向上取整结果。参数****x(Block) - 输入值。triton_language.clamptriton.language.clamp(x, min, max, propagate_nan: ~triton.language.core.constexpr PROPAGATE_NAN.NONE: 0)将输入张量x的值限制在 [min, max] 范围内。参数x(Block) - 输入值。min(Block) – 限制操作的下界值。max(Block) – 限制操作的上界值。propagate_nan(tl.PropagateNan) – 是否将 NaN 值传播出去。此设置仅对张量x有效。如果min或max中任一值为NaN则最终结果将无法确定。另请参阅tl.PropagateNantriton_language.costriton.language.cos(x)计算x的逐元素余弦值。参数****x(Block) - 输入值。triton_language.div_rntriton.language.div_rn(x,y)计算x和y的逐元素精确除法根据 IEEE 标准四舍五入到最近的值。参数****x(Block) - 输入值。y(Block) - 输入值。triton_language.erftriton.language.erf(x)计算x的逐元素误差函数。参数****x(Block) - 输入值。triton_language.exptriton.language.exp(x)计算x的逐元素指数函数。参数****x(Block) - 输入值。triton_language.exp2triton.language.exp2(x)计算x的逐元素指数函数以 2 为底。参数****x(Block) - 输入值。triton_language.fdivtriton.language.fdiv(x,y)计算x和y的逐元素快速除法。参数****x(Block) - 输入值。y(Block) - 输入值。triton_language.floortriton.language.floor(x)计算x的逐元素向下取整。参数****x(Block) - 输入值。triton_language.fmatriton.language.fma(x,y,z)计算x、y和z的逐元素融合乘加运算。参数****x(Block) - 输入值。y(Block) - 输入值。z(Block) - 输入值。triton_language.logtriton.language.log(x)计算x的逐元素自然对数。参数****x(Block) - 输入值。triton_language.log2triton.language.log2(x)计算x的逐元素对数以 2 为底。参数****x(Block) - 输入值。triton_language.maximumtriton.language.maximum(x, y, propagate_nan: ~triton.language.core.constexpr PROPAGATE_NAN.NONE: 0计算x和y的逐元素最大值。参数****x(Block) - 第 1 个输入的张量。y(Block) - 第 2 个输入的张量。propagate_nan(tl.PropagateNan) - 是否传播 NaN 值。另请参阅tl.PropagateNantriton_language.minimumtriton.language.minimum(x,y)计算x和y的逐元素最小值。参数****x(Block) - 第 1 个输入的张量。y(Block) - 第 2 个输入的张量。propagate_nan(tl.PropagateNan) - 是否传播 NaN 值。另请参阅tl.PropagateNantriton_language.rsqrttriton.language.rsqrt(x)计算x的逐元素倒数平方根。参数****x(Block) - 输入值。triton_language.sigmoidtriton.language.sigmoid(x)计算x的逐元素 sigmoid 函数值。参数****x(Block) - 输入值。这个函数也可作为tensor的成员函数调用使用x.sigmoid(...)而不是sigmoid(x, ...)。triton_language.sintriton.language.sin(x)计算x的逐元素正弦值。参数****x(Block) - 输入值。triton_language.softmaxtriton.language.softmax(x, ieee_roundingFalse)计算x的逐元素 softmax 函数值。参数****x(Block) - 输入值。这个函数也可作为tensor的成员函数调用使用x.softmax(...)而不是softmax(x, ...)。triton_language.sqrttriton.language.sqrt(x)计算x的逐元素快速平方根。参数****x(Block) - 输入值。triton_language.sqrt_rntriton.language.sqrt_rn(x)计算x的逐元素精确平方根根据 IEEE 标准四舍五入到最近值。参数x(Block) - 输入值。triton_language.umulhitriton.language.umulhi(x,y)计算x和y的 2N 位乘积中逐元素的最高有效 N 位。参数****x(Block) - 输入值。y(Block) - 输入值。

更多文章