CANN/ge：文件队列加载模型API

发布时间：2026/6/20 23:28:33

aclmdlLoadFromFileWithQ【免费下载链接】geGEGraph Engine是面向昇腾的图编译器和执行器提供了计算图优化、多流并行、内存复用和模型下沉等技术手段加速模型执行效率减少模型内存占用。 GE 提供对 PyTorch、TensorFlow 前端的友好接入能力并同时支持 onnx、pb 等主流模型格式的解析与编译。项目地址: https://gitcode.com/cann/ge产品支持情况产品是否支持Atlas A3 训练系列产品 / Atlas A3 推理系列产品√Atlas A2 训练系列产品 / Atlas A2 推理系列产品√功能说明从文件加载离线模型数据模型的输入、输出数据都存放在队列中。本接口只支持加载固定Shape输入的模型。本接口中通过modelPath参数传入的文件是适配昇腾AI处理器的离线模型即*.om文件。关于如何获取om文件请参见《ATC离线模型编译工具用户指南》若对om模型文件大小有限制本接口还支持加载外置权重文件但需在构建模型时将权重保存在单独的文件中。例如在使用ATC工具生成om文件时将--external_weight参数设置为11表示将原始网络中的Const/Constant节点的权重保存在单独的文件中且该文件保存在与om文件同级的weight目录下那么在使用本接口加载om文件时需将weight目录与om文件放在同级目录下这时本接口会自行到weight目录下查找权重文件否则可能会导致单独的权重文件加载不成功。函数原型aclError aclmdlLoadFromFileWithQ(const char *modelPath, uint32_t *modelId, const uint32_t *inputQ, size_t inputQNum, const uint32_t *outputQ, size_t outputQNum)参数说明参数名输入/输出说明modelPath输入模型文件路径的指针路径中包含文件名。运行程序APP的用户需要对该存储路径有访问权限。modelId输出模型ID的指针。系统成功加载模型后返回模型ID作为后续操作时识别模型的标志。inputQ输入队列ID的指针一个模型的输入对应一个队列ID。inputQNum输入输入队列大小。outputQ输入队列ID的指针一个模型的输出对应一个队列ID。outputQNum输入输出队列大小。返回值说明返回0表示成功返回其他值表示失败请参见aclError。约束说明模型加载、模型执行、模型卸载的操作必须在同一个Context下关于Context的创建请参见aclrtSetDevice或aclrtCreateContext。在加载前请先根据模型文件的大小评估内存空间是否足够内存空间不足会导致应用程序异常。参考资源当前还提供了aclmdlSetConfigOpt接口、aclmdlLoadWithConfig接口来实现模型加载通过配置对象中的属性来区分在加载模型时是从文件加载还是从内存加载以及内存是由系统内部管理还是由用户管理。【免费下载链接】geGEGraph Engine是面向昇腾的图编译器和执行器提供了计算图优化、多流并行、内存复用和模型下沉等技术手段加速模型执行效率减少模型内存占用。 GE 提供对 PyTorch、TensorFlow 前端的友好接入能力并同时支持 onnx、pb 等主流模型格式的解析与编译。项目地址: https://gitcode.com/cann/ge创作声明：本文部分内容由AI辅助生成（AIGC），仅供参考

文章详情

CANN/ge：文件队列加载模型API

相关新闻

最新新闻

日新闻

周新闻

月新闻