CANN/PyPTO卷积操作API文档-创锋一号

pypto.conv

【免费下载链接】pyptoPyPTO（发音: pai p-t-o）：Parallel Tensor/Tile Operation编程范式。项目地址: https://gitcode.com/cann/pypto

产品支持情况

产品	是否支持
Ascend 950PR/Ascend 950DT	√
Atlas A3 训练系列产品/Atlas A3 推理系列产品	×
Atlas A2 训练系列产品/Atlas A2 推理系列产品	×

功能说明

实现输入input_conv、weight完成卷积运算，支持bias参数，计算公式为：out = input_conv @ weight + bias (@表示为卷积处理)

input_conv 、weight、bias为源操作数；input_conv 为输入矩阵，weight为权重矩阵，bias为输入的偏置
out 为目的操作数，存放卷积处理结果的矩阵
当前暂不支持量化场景
当前暂不支持Relu功能

函数原型

conv(input_conv, weight, out_dtype, strides, paddings, dilations, *, groups=1, transposed=False, output_paddings=[], extend_params=None) -> Tensor

参数说明

参数名	输入/输出	说明
input_conv	输入	输入特征图 Tensor。不支持空 Tensor。支持维度：3D（1D conv）、4D（2D conv）、5D（3D conv）。支持格式：NCL、NCHW、NCDHW。支持数据类型：DT_FP16、DT_BF16、DT_FP32。 shape 约束：各维度取值范围 [1, 1000000]。 input_conv：cin = weight：cin * groups
weight	输入	卷积核 Tensor。维度必须与 input_conv 一致（3D/4D/5D）。数据类型必须与 input_conv 一致。 shape 约束：各维度取值范围 [1, 1000000]。
out_dtype	输入	输出 Tensor 数据类型。支持：DT_FP16、DT_BF16、DT_FP32。必须与 input_conv 一致；fixpipe 量化场景可单独指定。
strides	输入	卷积步长，单向参数。 - 1D（1D conv） - 2D（2D conv） - 3D（3D conv）取值范围：[1, 63]。
paddings	输入	卷积填充，双向参数。 - 2D（1D conv） - 4D（2D conv） - 6D（3D conv）取值范围：[0, 255]，且每维填充值 < 对应卷积核大小。
dilations	输入	空洞卷积膨胀率，单向参数。 - 1D（1D conv） - 2D（2D conv） - 3D（3D conv）取值范围：[1, 63]。
groups	输入	分组卷积组数，默认 1。取值范围：[1, 65535]。 Cin、Cout 必须可被 groups 整除。
transposed	输入	是否为转置卷积（反卷积），默认 False。当前暂不支持 True。
output_paddings	输入	转置卷积输出端填充，仅 transposed=True 时使用。当前暂不支持。
extend_params	输入	扩展参数字典，支持 bias、scale、relu、scale_tensor： - bias_tensor：可选的偏置张量，形状为 (C_out,)，仅支持 ND 格式，bias的数据类型必须与 input_conv 一致。 - scale：浮点型，per-tensor 缩放因子。 - scale_tensor：uint64 类型 per-channel 缩放 Tensor，shape [1, Cout]，仅 ND 格式。 - relu_type：激活类型，支持 RELU/NO_RELU 等。

返回值说明

返回卷积运算后的输出 Tensor：

1D 卷积输出 shape：(Batch, Cout, Wout)
2D 卷积输出 shape：(Batch, Cout, Hout, Wout)
3D 卷积输出 shape：(Batch, Cout, Dout, Hout, Wout)

输出 shape 各维度范围：[1, 1000000]。

约束说明

1. Shape 合法性约束

输入特征图（input_conv）：Batch、Cin、Hin、Win、Din 维度必须在 [1, 1000000] 范围内；
卷积核（weight）：Cout、Kh、Kw、Kd 维度必须在 [1, 1000000] 范围内；
偏置（bias_tensor）：shape 必须等于 [Cout]，否则校验失败；
输出特征图：H_out、W_out、D_out 维度必须在 [1, 1000000] 范围内。

2. 属性参数合法性约束

基础维度匹配约束：
- strides 维度数必须与卷积维度匹配（2D conv 长度=2，3D conv 长度=3）；
- dilations 维度数必须与卷积维度匹配（2D conv 长度=2，3D conv 长度=3）；
- paddings 维度数必须为2×卷积维度（2D conv 长度=4，3D conv 长度=6）；
数值范围约束：
- strides 取值范围 [1, 63]；
- dilations 取值范围 [1, 63]；
- paddings 取值范围 [0, 255]，且每维填充值 < 对应卷积核维度大小（如 padding_h < Kh、padding_w < Kw）；
- groups 取值范围 [1, 65535]；
卷积核约束：
- Kh ≤ 255、Kw ≤ 255；
- Kh × Kw × 32bytes/dtype ≤ 65535；dtype为input_conv的数据类型所占bit数，如FP16是16，FP32是32等
通道数约束：
- Cin（输入通道数）必须能被 groups 整除；
- Cout（输出通道数）必须能被 groups 整除；
- CinFmap = CinWeight × groups。

3. 缓存空间约束

调用 conv 接口前，必须通过 pypto.set_conv_tile_shapes 接口设置 L1/L0 层级的卷积 TileShape 切分大小。

4. 功能支持约束

transposed=True（转置卷积）暂不支持，调用会抛出 RuntimeError；
input_conv/weight 仅支持 DT_FP16、DT_BF16、DT_FP32 数据类型，其他类型会抛出 ValueError；
input_conv 与 weight 的维度必须一致（如 input_conv 为 4D 则 weight 也需为 4D），否则抛出 RuntimeError。

5. 动态轴切分支持

卷积算子支持以下维度的动态轴切分：

维度	是否支持	切分方式	说明
Batch	√	前端循环切分	TileL1Info.tileBatch 必须为 1（硬件约束），通过前端循环实现动态切分
Cout	√	TileShape 动态切分 + 前端循环	支持 TileShape 配置的动态切分，配合前端循环实现完整 Cout 维度覆盖
Dout	√	TileShape 动态切分 + 前端循环	仅 3D 卷积支持，Dout 维度动态切分
Hout	√	TileShape 动态切分 + 前端循环	Hout 维度动态切分，配合前端循环实现完整覆盖
Wout	√	TileShape 动态切分 + 前端循环	Wout 维度动态切分，配合前端循环实现完整覆盖
Cin	√	前端循环切分 + pypto.add 累加	Cin 维度动态切分需使用 pypto.add 累加多个 tile 结果

Cin 维度动态切分精度说明：

Cin 维度的动态轴切分会影响计算精度，原因如下：

Cin 切分后需要对多个 tile 的卷积结果进行累加（通过 pypto.add 实现）
累加过程中存在两次 cast 操作（FP16/BF16 → FP32 → FP16/BF16）
这两次精度转换会引入精度损失，在 Cin 切分场景下需要评估精度需求

建议：

如果精度要求较高，建议避免 Cin 维度的动态切分
如果必须进行 Cin 切分，建议使用 FP32 数据类型以减少精度损失
Cin 切分的 tile 大小需满足 32 字节对齐约束（FP16/BF16: %16==0, FP32: %8==0）

调用示例

# 2D 卷积基础示例 input_conv = pypto.tensor((1, 32, 8, 16), pypto.DT_FP16, "input_conv") weight = pypto.tensor((32, 32, 1, 1), pypto.DT_FP16, "weight") # 暂时不支持子图合并特性，需要手动关闭 pypto.set_pass_options( cube_l1_reuse_setting={-1: 1}, cube_nbuffer_setting={-1: 1}, ) out = pypto.conv(input_conv, weight, pypto.DT_FP16, strides=[1, 1], paddings=[0, 0, 0, 0], dilations=[1, 1]) # 2D 卷积带 bias 和 ReLu （当前暂不支持ReLu） input_conv = pypto.tensor((1, 32, 8, 16), pypto.DT_FP16, "input_conv") weight = pypto.tensor((32, 32, 1, 1), pypto.DT_FP16, "weight") bias = pypto.tensor((32,), pypto.DT_FP16, "bias") extend_params = {'bias_tensor': bias, 'relu_type': pypto.ReLuType.RELU} # 暂时不支持子图合并特性，需要手动关闭 pypto.set_pass_options( cube_l1_reuse_setting={-1: 1}, cube_nbuffer_setting={-1: 1}, ) out = pypto.conv(input_conv, weight, pypto.DT_FP16, strides=[1, 1], paddings=[0, 0, 0, 0], dilations=[1, 1], extend_params=extend_params) # 3D 卷积示例 input_conv = pypto.tensor((1, 96, 2, 16, 16), pypto.DT_FP16, "input_conv") weight = pypto.tensor((32, 96, 1, 1, 1), pypto.DT_FP16, "weight") # 暂时不支持子图合并特性，需要手动关闭 pypto.set_pass_options( cube_l1_reuse_setting={-1: 1}, cube_nbuffer_setting={-1: 1}, ) out = pypto.conv(input_conv, weight, pypto.DT_FP16, strides=[1, 1, 1], paddings=[0, 0, 0, 0, 0, 0], dilations=[1, 1, 1])

【免费下载链接】pyptoPyPTO（发音: pai p-t-o）：Parallel Tensor/Tile Operation编程范式。项目地址: https://gitcode.com/cann/pypto

创作声明：本文部分内容由AI辅助生成（AIGC），仅供参考

企业官网建设流程全解析

pypto.conv

产品支持情况

功能说明

函数原型

参数说明

返回值说明

约束说明

1. Shape 合法性约束

2. 属性参数合法性约束

3. 缓存空间约束

4. 功能支持约束

5. 动态轴切分支持

调用示例

热门文章

文章分类

标签云

需要专业的网站建设服务？

企业官网建设流程全解析

pypto.conv

产品支持情况

功能说明

函数原型

参数说明

返回值说明

约束说明

1. Shape 合法性约束

2. 属性参数合法性约束

3. 缓存空间约束

4. 功能支持约束

5. 动态轴切分支持

调用示例

热门文章

文章分类

标签云

相关文章

数据资源：中国极端高温热浪人口暴露数据集（2000、2010、2020）

机电系统开发中的接口控制文档（ICD）与工具链构建

CANN矩阵乘算子样例

需要专业的网站建设服务？