CANN/asc-devkit:SetFixPipeConfig配置API SetFixPipeConfig【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言原生支持C和C标准规范主要由类库和语言扩展层构成提供多层级API满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit产品支持情况产品是否支持Ascend 950PR/Ascend 950DT√Atlas A3 训练系列产品/Atlas A3 推理系列产品√Atlas A2 训练系列产品/Atlas A2 推理系列产品√Atlas 200I/500 A2 推理产品√Atlas 推理系列产品AI CorexAtlas 推理系列产品Vector CorexAtlas 训练系列产品xKirin X90√Kirin 9030√功能说明DataCopy数据搬运L0C-GM、L0C-L1过程中进行随路量化时通过调用该接口设置量化的参数。函数原型template typename T __aicore__ inline void SetFixPipeConfig(const LocalTensorT reluPre, const LocalTensorT quantPre, bool isUnitFlag false) template typename T, bool setRelu false __aicore__ inline void SetFixPipeConfig(const LocalTensorT preData, bool isUnitFlag false)参数说明表 1模板参数说明参数名描述T操作数的数据类型。setRelu针对设置一个tensor的情况setRelu当前仅支持设置为false即只支持设置随路quantPre系数表 2参数说明参数名称输入/输出含义reluPre输入源操作数ReLU操作时参与计算的tensor类型为LocalTensor支持的物理内存为Fixpipe bufferTPosition为C2PIPE2GM为后续的功能扩展做保留传入一个空LocalTensor即可。quantPre输入源操作数quant tensor量化操作时参与计算的tensor类型为LocalTensor支持的物理内存为Fixpipe bufferTPosition为C2PIPE2GM。isUnitFlag输入unitFlag清空标志位类型为bool。如果设为trueL0C Buffer中所有内存块的单元标志位都会设为0。旨在消除之前操作中unitFlag产生的多余影响。preData输入支持设置一个Tensor通过开关控制是relu Tensor还是quant Tensor支持的物理内存为Fixpipe bufferTPosition为C2PIPE2GM。当前仅支持传入quant Tensor。对于单独设置unitFlag清空标志位isUnitFlag的场景支持的物理地址为L0C bufferTPosition设置为CO1。数据类型支持的数据类型为uint64_t。返回值说明无约束说明quantPre和reluPre必须是Fixpipe Buffer上的Tensor。调用示例完整示例可参考data_copy_l0c2gm。__aicore__ inline void SetFPC(const LocalTensor int32_t reluPreTensor, const LocalTensor int32_t quantPreTensor) { AscendC::LocalTensoruint64_t workA1 inQueueDeqA1.AllocTensoruint64_t(); uint16_t deqSize 128; // deq tensor的size AscendC::DataCopy(workA1, deqGlobal, deqSize); // deqGlobal为量化系数的gm地址 AscendC::LocalTensoruint64_t deqFB inQueueDeqFB.AllocTensoruint64_t(); // deq tensor在Fix上的地址 uint16_t fbufBurstLen deqSize / 128; // l1-fix, burst_len unit is 128Bytes AscendC::DataCopyParams dataCopyParams(1, fbufBurstLen, 0, 0); AscendC::DataCopy(deqFB, workA1, dataCopyParams); // 通过DataCopy搬入C2PIPE2GM。 AscendC::SetFixPipeConfig(deqFB); // 设置量化tensor AscendC::PipeBarrierPIPE_FIX(); }【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言原生支持C和C标准规范主要由类库和语言扩展层构成提供多层级API满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考