B2B网站_日本理论_B2B免费发布信息网站_日本看片网站_B2B企业贸易平台 -日本看片网站- 企资网

二維碼
企資網

掃一掃關注

當前位置: 首頁 » 企業資訊 » 熱點 » 正文

在昇騰平臺上對TensorFlow網絡進行姓能

放大字體  縮小字體 發布日期:2023-03-19 13:34:53    作者:葉國慶    瀏覽次數:150
導讀

本文分享自華為云社區《在昇騰平臺上對TensorFlow網絡進行性能調優-云社區-華為云》,作者:昇騰CANN 。用戶將TensorFlow訓練網絡遷移到昇騰平臺后,如果存在性能不達標的問題,就需要進行調優。本文就帶大家了解在

本文分享自華為云社區《在昇騰平臺上對TensorFlow網絡進行性能調優-云社區-華為云》,作者:昇騰CANN 。

用戶將TensorFlow訓練網絡遷移到昇騰平臺后,如果存在性能不達標的問題,就需要進行調優。本文就帶大家了解在昇騰平臺上對TensorFlow訓練網絡進行性能調優的常用手段。

首先了解下性能調優的全流程:

當TensorFlow訓練網絡性能不達標時,首先可嘗試昇騰平臺提供的“三板斧”操作,即上圖中的“基本提升手段”:使能自動混合精度 > 進行親和接口的替換 > 使能訓練迭代循環下沉 > 使用AOE工具進行調優。

基本調優操作完成后,需要再次執行模型訓練并評估性能,如果性能達標了,調優即可結束;如果未達標,需要使用Profling工具采集詳細的性能數據進一步分析,從而找到性能瓶頸點,并進一步針對性的解決,這部分調優操作需要用戶有一定的經驗,難度相對較大,我們將這部分調優操作稱為進階調優。

本文主要帶大家詳細了解基本調優操作,即上圖中的灰色底紋部分。

使能自動混合精度

混合精度是業內通用的性能提升方式,通過降低部分計算精度提升數據計算的并行度?;旌嫌嬎阌柧毞椒ㄍㄟ^混合使用float16和float32數據類型來加速深度神經網絡的訓練過程,并減少內存使用和存取,從而可以提升訓練網絡性能,同時又能基本保證使用float32訓練所能達到的網絡精度。

Ascend平臺提供了“precision_mode”參數用于配置網絡的精度模式,用戶可以在訓練腳本的運行配置中添加此參數,并將取值配置為“allow_mix_precision”,從而使能自動混合精度,下面以手工遷移的訓練腳本為例,介紹配置方法。

  • Estimator模式下,在NPURunConfig中添加precision_mode參數設置精度模式:npu_config=NPURunConfig( model_dir=FLAGS.model_dir, save_checkpoints_steps=FLAGS.save_checkpoints_steps, session_config=tf.ConfigProto(allow_soft_placement=True,log_device_placement=False), precision_mode="allow_mix_precision" )
  • sess.run模式下,通過session配置項precision_mode設置精度模式:config = tf.ConfigProto(allow_soft_placement=True) custom_op = config.graph_options.rewrite_options.custom_optimizers.add() custom_op.name = "NpuOptimizer" custom_op.parameter_map["use_off_line"].b = True custom_op.parameter_map["precision_mode"].s = tf.compat.as_bytes("allow_mix_precision") … with tf.Session(config=config) as sess: print(sess.run(cost))親和接口替換

    針對TensorFlow訓練網絡中的dropout、gelu接口,Ascend平臺提供了硬件親和的替換接口,從而使網絡獲得更優性能。

  • 對于訓練腳本中的nn.dropout,建議替換為Ascend對應的API實現,以獲得更優性能:layers = npu_ops.dropout()
  • 若訓練腳本中存在layers.dropout、tf.layers.Dropout、tf.keras.layers.Dropout、tf.keras.layers.SpatialDropout1D、tf.keras.layers.SpatialDropout2D、tf.keras.layers.SpatialDropout3D接口,建議增加頭文件引用:from npu_bridge.estimator.npu import npu_convert_dropout
  • 對于訓練腳本中的gelu接口,建議替換為Ascend提供的gelu接口,以獲得更優性能。

    例如,TensorFlow原始代碼:

    遷移后的代碼:

    from npu_bridge.estimator.npu_unary_ops import npu_unary_opslayers = npu_unary_ops.gelu(x)訓練迭代循環下沉

    訓練迭代循環下沉是指在Host調用一次,在Device執行多次迭代,從而減少Host與Device間的交互次數,縮短訓練時長。用戶可通過iterations_per_loop參數指定訓練迭代的次數,該參數取值大于1即可使能訓練迭代循環下沉的特性。

    使用該特性時,要求訓練腳本使用TF Dataset方式讀數據,并開啟數據預處理下沉,即enable_data_pre_proc開關配置為True,例如sess.run配置示例如下:

    custom_op.parameter_map["enable_data_pre_proc"].b = True

    其他使用約束,用戶可參見昇騰文檔中心(昇騰社區-官網丨昇騰萬里 讓智能無所不及)的《TensorFlow模型遷移和訓練指南》。

    Estimator模式下,通過NPURunConfig中的iterations_per_loop參數配置訓練迭代循環下沉的示例如下:

    session_config=tf.ConfigProto(allow_soft_placement=True)config = NPURunConfig(session_config=session_config, iterations_per_loop=10)AOE自動調優

    昇騰平臺提供了AOE自動調優工具,可對網絡進行子圖調優、算子調優與梯度調優,生成最優調度策略,并將最優調度策略固化到知識庫。模型再次訓練時,無需開啟調優,即可享受知識庫帶來的收益。

    建議按照如下順序使用AOE工具進行調優:

    訓練場景下使能AOE調優有兩種方式:

  • 通過設置環境變量啟動AOE調優。# 1:子圖調優 # 2:算子調優 # 4:梯度調優 export AOE_MODE=2
  • 修改訓練腳本,通過“aoe_mode”參數指定調優模式,例如:

    sess.run模式,訓練腳本修改方法如下:

    custom_op.parameter_map["aoe_mode"].s = tf.compat.as_bytes("2")

    estimator模式下,訓練腳本修改方法如下:

    config = NPURunConfig( session_config=session_config, aoe_mode=2)

    以上就是TensorFlow網絡在昇騰平臺上進行性能調優的常見手段。關于更多文檔介紹,可以在昇騰文檔中心查看,您也可在昇騰社區在線課程板塊(昇騰社區-官網丨昇騰萬里 讓智能無所不及)學習視頻課程,學習過程中的任何疑問,都可以在昇騰論壇互動交流!

    相關參考:

    [1]昇騰文檔中心

    [2]昇騰社區在線課程

    [3]昇騰論壇

    關注#華為云開發者聯盟#點擊下方,第一時間了解華為云新鮮技術~

    華為云博客_大數據博客_AI博客_云計算博客_開發者中心-華為云

  •  
    (文/葉國慶)
    免責聲明
    本文僅代表作發布者:葉國慶個人觀點,本站未對其內容進行核實,請讀者僅做參考,如若文中涉及有違公德、觸犯法律的內容,一經發現,立即刪除,需自行承擔相應責任。涉及到版權或其他問題,請及時聯系我們刪除處理郵件:weilaitui@qq.com。
     

    Copyright ? 2016 - 2025 - 企資網 48903.COM All Rights Reserved 粵公網安備 44030702000589號

    粵ICP備16078936號

    微信

    關注
    微信

    微信二維碼

    WAP二維碼

    客服

    聯系
    客服

    聯系客服:

    在線QQ: 303377504

    客服電話: 020-82301567

    E_mail郵箱: weilaitui@qq.com

    微信公眾號: weishitui

    客服001 客服002 客服003

    工作時間:

    周一至周五: 09:00 - 18:00

    反饋

    用戶
    反饋

    主站蜘蛛池模板: VI设计-LOGO设计公司-品牌设计公司-包装设计公司-导视设计-杭州易象设计 | 衬塑设备,衬四氟设备,衬氟设备-淄博鲲鹏防腐设备有限公司 | 智能型高压核相仪-自动开口闪点测试仪-QJ41A电雷管测试仪|上海妙定 | 3dmax渲染-效果图渲染-影视动画渲染-北京快渲科技有限公司 | 立式矫直机_卧式矫直机-无锡金矫机械制造有限公司 | 胶泥瓷砖胶,轻质粉刷石膏,嵌缝石膏厂家,腻子粉批发,永康家德兴,永康市家德兴建材厂 | 环氧树脂地坪漆_济宁市新天地漆业有限公司 | 井式炉-台车式回火炉-丹阳市电炉厂有限公司 | 威廉希尔WilliamHill·足球(中国)体育官方网站 | 旋片真空泵_真空泵_水环真空泵_真空机组-深圳恒才机电设备有限公司 | 河南正规膏药生产厂家-膏药贴牌-膏药代加工-修康药业集团官网 | 拉力机-万能试验机-材料拉伸试验机-电子拉力机-拉力试验机厂家-冲击试验机-苏州皖仪实验仪器有限公司 | 欧必特空气能-商用空气能热水工程,空气能热水器,超低温空气源热泵生产厂家-湖南欧必特空气能公司 | 锯边机,自动锯边机,双面涂胶机-建业顺达机械有限公司 | 上海刑事律师|刑事辩护律师|专业刑事犯罪辩护律师免费咨询-[尤辰荣]金牌上海刑事律师团队 | 北京自然绿环境科技发展有限公司专业生产【洗车机_加油站洗车机-全自动洗车机】 | 滚筒线,链板线,总装线,流水线-上海体能机电有限公司 | 安全阀_弹簧式安全阀_美标安全阀_工业冷冻安全阀厂家-中国·阿司米阀门有限公司 | 深圳标识制作公司-标识标牌厂家-深圳广告标识制作-玟璟广告-深圳市玟璟广告有限公司 | 成都思迪机电技术研究所-四川成都思迪编码器 | 盛源真空泵|空压机-浙江盛源空压机制造有限公司-【盛源官网】 | 洗地机-全自动/手推式洗地机-扫地车厂家_扬子清洁设备 | 碳刷_刷握_集电环_恒压簧_电刷厂家-上海丹臻机电科技有限公司 | 环保袋,无纺布袋,无纺布打孔袋,保温袋,环保袋定制,环保袋厂家,环雅包装-十七年环保袋定制厂家 | 上海律师事务所_上海刑事律师免费咨询平台-煊宏律师事务所 | 黑龙江京科脑康医院-哈尔滨精神病医院哪家好_哈尔滨精神科医院排名_黑龙江精神心理病专科医院 | PC构件-PC预制构件-构件设计-建筑预制构件-PC构件厂-锦萧新材料科技(浙江)股份有限公司 | 亿立分板机_曲线_锯片式_走刀_在线式全自动_铣刀_在线V槽分板机-杭州亿协智能装备有限公司 | 沈阳液压泵_沈阳液压阀_沈阳液压站-沈阳海德太科液压设备有限公司 | 成都装修公司-成都装修设计公司推荐-成都朗煜装饰公司 | 陶瓷加热器,履带式加热器-吴江市兴达电热设备厂 | 视觉检测设备_自动化检测设备_CCD视觉检测机_外观缺陷检测-瑞智光电 | 嘉兴泰东园林景观工程有限公司_花箱护栏 | 劳动法网-专业的劳动法和劳动争议仲裁服务网 | 骨灰存放架|骨灰盒寄存架|骨灰架厂家|智慧殡葬|公墓陵园管理系统|网上祭奠|告别厅智能化-厦门慈愿科技 | 亚克力制品定制,上海嘉定有机玻璃加工制作生产厂家—官网 | 欧洲MV日韩MV国产_人妻无码一区二区三区免费_少妇被 到高潮喷出白浆av_精品少妇自慰到喷水AV网站 | 地磅-地秤-江阴/无锡地磅-江阴天亿计量设备有限公司_ | 日本东丽膜_反渗透膜_RO膜价格_超滤膜_纳滤膜-北京东丽阳光官网 日本细胞免疫疗法_肿瘤免疫治疗_NK细胞疗法 - 免疫密码 | 数显恒温培养摇床-卧式/台式恒温培养摇床|朗越仪器 | 电动打包机_气动打包机_钢带捆扎机_废纸打包机_手动捆扎机 |