CANN/asc-devkit原子最大值操作API-创锋一号

AtomicMax

【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言，原生支持C和C++标准规范，主要由类库和语言扩展层构成，提供多层级API，满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit

产品支持情况

产品	是否支持
Ascend 950PR/Ascend 950DT	√
Atlas A3 训练系列产品 / Atlas A3 推理系列产品	x
Atlas A2 训练系列产品 / Atlas A2 推理系列产品	x

功能说明

调用该接口后，可在指定GM地址上进行原子取大操作。

函数原型

template <typename T> __aicore__ inline T AtomicMax(__gm__ T *address, T value)

参数说明

表 1模板参数说明

参数名	描述
T	操作数数据类型。 Ascend 950PR/Ascend 950DT，支持的数据类型为：int32_t/uint32_t/float/int64_t/uint64_t

表 2参数说明

参数名	输入/输出	描述
address	输入	输入GM的地址。
value	输入	标量值，支持数据类型和address指向的数据类型保持一致。

返回值说明

GM地址上做原子操作前的数据。

约束说明

原子操作涉及标量计算，如果标量计算单元和搬运单元（MTE2/MTE3）在读写GM时存在数据依赖，开发者需要根据实际情况插入同步。

调用示例

extern "C" __global__ __aicore__ void atomic_simple_kernel(__gm__ uint8_t* dst， uint32_t dataSize) { // ... dst_global.SetGlobalBuffer(reinterpret_cast<__gm__ T *>(dst_gm), dataSize); LocalTensor<T> dstLocal = inQueueX.AllocTensor<T>(); int32_t value = 2; int32_t a = AscendC::AtomicMax(reinterpret_cast<__gm__ int32_t *>(dst), value); // 先执行完原子操作之后才能进行搬运操作，有数据依赖，需要手动插入MTE2等待Scalar的同步 event_t eventIdSToMte2 = static_cast<event_t>(GetTPipePtr()->AllocEventID<HardEvent::S_MTE2>()); SetFlag<HardEvent::S_MTE2>(eventIdSToMte2); WaitFlag<HardEvent::S_MTE2>(eventIdSToMte2); DataCopy(dstLocal, dst_global, dataSize); // ... }

假设上述函数在3个核上执行，核1、核2、核3依次调度，结果示例如下：

原GM数据dst: [1,1,1,1,1,...,1] 核1： 原子计算后GM数据dst: [2,1,1,1,1,...,1] 返回值 a: 1 核2： 原子计算后GM数据dst: [2,1,1,1,1,...,1] 返回值 a: 2 核3： 原子计算后GM数据dst: [2,1,1,1,1,...,1] 返回值 a: 2

创作声明：本文部分内容由AI辅助生成（AIGC），仅供参考

企业官网建设流程全解析

AtomicMax

产品支持情况

功能说明

函数原型

参数说明

返回值说明

约束说明

调用示例

热门文章

文章分类

标签云

需要专业的网站建设服务？

企业官网建设流程全解析

AtomicMax

产品支持情况

功能说明

函数原型

参数说明

返回值说明

约束说明

调用示例

热门文章

文章分类

标签云

相关文章

自供电智能传感：TENG与深度学习融合的设计与实现

AI与数字孪生赋能2型糖尿病精准管理：护士主导的临床实践

IVD开源数据管理框架：从设计到部署的完整指南

需要专业的网站建设服务？