【Triton 教程】math-ops

张开发

• 2026/6/9 21:31:04 • 15 分钟阅读

分享文章

$【Triton 教程】math-ops$

Triton 是一种用于并行编程的语言和编译器。它旨在提供一个基于 Python 的编程环境以高效编写自定义 DNN 计算内核并能够在现代 GPU 硬件上以最大吞吐量运行。*在线运行 Triton 学习教程 → go.hyper.ai/wS9x1triton_language.abstriton.language.abs(x)计算x的逐元素绝对值。参数****x(Block) - 输入值。triton_language.cdivtriton.language.cdiv(x,div)计算x除以div的向上取整结果。参数x(Block) - 输入数字。div(Block) - 除数。这个函数也可作为tensor的成员函数调用例如x.div(...)而不是div(x, ...)。triton_language.ceiltriton.language.ceil(x)计算x的逐元素向上取整结果。参数****x(Block) - 输入值。triton_language.clamptriton.language.clamp(x, min, max, propagate_nan: ~triton.language.core.constexpr PROPAGATE_NAN.NONE: 0)将输入张量x的值限制在 [min, max] 范围内。参数x(Block) - 输入值。min(Block) – 限制操作的下界值。max(Block) – 限制操作的上界值。propagate_nan(tl.PropagateNan) – 是否将 NaN 值传播出去。此设置仅对张量x有效。如果min或max中任一值为NaN则最终结果将无法确定。另请参阅tl.PropagateNantriton_language.costriton.language.cos(x)计算x的逐元素余弦值。参数****x(Block) - 输入值。triton_language.div_rntriton.language.div_rn(x,y)计算x和y的逐元素精确除法根据 IEEE 标准四舍五入到最近的值。参数****x(Block) - 输入值。y(Block) - 输入值。triton_language.erftriton.language.erf(x)计算x的逐元素误差函数。参数****x(Block) - 输入值。triton_language.exptriton.language.exp(x)计算x的逐元素指数函数。参数****x(Block) - 输入值。triton_language.exp2triton.language.exp2(x)计算x的逐元素指数函数以 2 为底。参数****x(Block) - 输入值。triton_language.fdivtriton.language.fdiv(x,y)计算x和y的逐元素快速除法。参数****x(Block) - 输入值。y(Block) - 输入值。triton_language.floortriton.language.floor(x)计算x的逐元素向下取整。参数****x(Block) - 输入值。triton_language.fmatriton.language.fma(x,y,z)计算x、y和z的逐元素融合乘加运算。参数****x(Block) - 输入值。y(Block) - 输入值。z(Block) - 输入值。triton_language.logtriton.language.log(x)计算x的逐元素自然对数。参数****x(Block) - 输入值。triton_language.log2triton.language.log2(x)计算x的逐元素对数以 2 为底。参数****x(Block) - 输入值。triton_language.maximumtriton.language.maximum(x, y, propagate_nan: ~triton.language.core.constexpr PROPAGATE_NAN.NONE: 0计算x和y的逐元素最大值。参数****x(Block) - 第 1 个输入的张量。y(Block) - 第 2 个输入的张量。propagate_nan(tl.PropagateNan) - 是否传播 NaN 值。另请参阅tl.PropagateNantriton_language.minimumtriton.language.minimum(x,y)计算x和y的逐元素最小值。参数****x(Block) - 第 1 个输入的张量。y(Block) - 第 2 个输入的张量。propagate_nan(tl.PropagateNan) - 是否传播 NaN 值。另请参阅tl.PropagateNantriton_language.rsqrttriton.language.rsqrt(x)计算x的逐元素倒数平方根。参数****x(Block) - 输入值。triton_language.sigmoidtriton.language.sigmoid(x)计算x的逐元素 sigmoid 函数值。参数****x(Block) - 输入值。这个函数也可作为tensor的成员函数调用使用x.sigmoid(...)而不是sigmoid(x, ...)。triton_language.sintriton.language.sin(x)计算x的逐元素正弦值。参数****x(Block) - 输入值。triton_language.softmaxtriton.language.softmax(x, ieee_roundingFalse)计算x的逐元素 softmax 函数值。参数****x(Block) - 输入值。这个函数也可作为tensor的成员函数调用使用x.softmax(...)而不是softmax(x, ...)。triton_language.sqrttriton.language.sqrt(x)计算x的逐元素快速平方根。参数****x(Block) - 输入值。triton_language.sqrt_rntriton.language.sqrt_rn(x)计算x的逐元素精确平方根根据 IEEE 标准四舍五入到最近值。参数x(Block) - 输入值。triton_language.umulhitriton.language.umulhi(x,y)计算x和y的 2N 位乘积中逐元素的最高有效 N 位。参数****x(Block) - 输入值。y(Block) - 输入值。

更多文章

前端开发 2026/6/9 21:22:27

如何为Whisper ASR Webservice开发自定义引擎和插件

如何为Whisper ASR Webservice开发自定义引擎和插件【免费下载链接】whisper-asr-webservice OpenAI Whisper ASR Webservice API 项目地址: https://gitcode.com/gh_mirrors/wh/whisper-asr-webservice Whisper ASR Webservice是一个基于OpenAI Whisper的语音识别服务…

FastAPI WebSocket：配置实现终极指南【免费下载链接】fastapi FastAPI framework, high performance, easy to learn, fast to code, ready for production 项目地址: https://gitcode.com/GitHub_Trending/fa/fastapi FastAPI WebSocket 配置实现是构建实时…

张开发

前端开发 2026/5/12 23:32:25

ComfyUI-Manager 安装故障排查与解决方案

ComfyUI-Manager 安装故障排查与解决方案【免费下载链接】ComfyUI-Manager ComfyUI-Manager is an extension designed to enhance the usability of ComfyUI. It offers management functions to install, remove, disable, and enable various custom nodes of ComfyUI. Fur…

张开发

【Triton 教程】math-ops

最新文章

PAT乙级刷题避坑指南：从‘我要通过！’到‘狼人杀’，那些题目里没说清的隐藏考点

从芯片设计到客户手里：揭秘AE、FAE、PE、VE如何接力完成一颗IC的旅程

用PaddleOCR v3搞定80种语言图片文字提取：从安装到实战避坑全记录

保姆级避坑指南：在ROS Noetic上搞定aruco_ros编译与单目相机定位（解决CV_FILLED报错）

碧蓝航线Alas脚本完整指南：自动化游戏终极解决方案

FUXA工业级可视化监控系统：5天从零构建专业SCADA平台的完整指南

推荐文章

相关文章

分享文章

更多文章

如何为Whisper ASR Webservice开发自定义引擎和插件

还在为H5页面开发头疼吗？开源编辑器h5maker让你5分钟搞定专业级设计

如何在DroidKaigi 2024官方应用中实现高效列表展示：Compose最佳实践指南

AIGlasses_for_navigation开发者社区：CSDN博客写作与技术分享指南

intv_ai_mk11详细步骤：24GB单卡部署Llama模型并启用Web UI全流程

ESP32隐藏技能：5分钟搭建带记忆功能的WiFi配网服务器（PlatformIO全流程）

探秘书匠策AI：毕业论文写作的“智能魔法师”

FastAPI日志配置终极指南：10个简单步骤实现生产级日志管理

ClickHouse数据高效迁移：从S3到本地的全流程实践

中小餐饮企业福音：Ostrakon-VL-8B实现低成本AI视觉管理

FastAPI WebSocket：配置实现终极指南

ComfyUI-Manager 安装故障排查与解决方案