cann/asc-devkit: Pack函数API文档
2026/5/11 18:25:27 网站建设 项目流程

Pack

【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C++标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit

产品支持情况

产品

是否支持

Ascend 950PR/Ascend 950DT

Atlas A3 训练系列产品 / Atlas A3 推理系列产品

x

Atlas A2 训练系列产品 / Atlas A2 推理系列产品

x

功能说明

根据所选的低位模式或高位模式,将输入MaskReg的偶数位bit提取到输出MaskReg的低半部分或高半部分。

函数原型

template <HighLowPart part = HighLowPart::LOWEST> __simd_callee__ inline void Pack(MaskReg& dst, MaskReg& src)

参数说明

表 1模板参数说明

参数名

描述

part

枚举类型,低位模式或高位模式。

  • LOWEST 低位模式;
  • HIGHEST 高位模式。

表 2参数说明

参数名

描述

dst

目的操作数。

src

源操作数。

返回值说明

约束说明

调用示例

template <typename T> __simd_vf__ inline void PackVF(__ubuf__ T* dstAddr, __ubuf__ T* srcAddr, uint32_t count, uint32_t oneRepeatSize, uint16_t repeatTimes) { AscendC::Reg::RegTensor<T> srcReg; AscendC::Reg::MaskReg maskFull = AscendC::Reg::CreateMask<T, AscendC::Reg::MaskPattern::ALL>(); AscendC::Reg::MaskReg mask0; AscendC::Reg::MaskReg mask1; AscendC::Reg::Pack<AscendC::Reg::HighLowPart::LOWEST>(mask0, maskFull); for (uint16_t i = 0; i < repeatTimes; ++i) { mask1 = AscendC::Reg::UpdateMask<T>(count); AscendC::Reg::LoadAlign(srcReg, srcAddr + i * oneRepeatSize); AscendC::Reg::Adds(srcReg, srcReg, 0, mask0); AscendC::Reg::StoreAlign(dstAddr + i * oneRepeatSize, srcReg, mask1); } }

【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C++标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

需要专业的网站建设服务?

联系我们获取免费的网站建设咨询和方案报价,让我们帮助您实现业务目标

立即咨询