【环境】

Ubuntu22.04+mindspore-gpu1.7.0+cuda11.1+cudnn8.0.5

【操作步骤&问题现象】

1、正确配置显卡驱动和安装cuda,自己写了个一个用GPU训练的测试程序,没有问题。

2、运行我自己写得网络的时候,数据处理部分没有问题,到训练那一步的时候突然终端会关闭掉。用pycharm的时候是pycharm会关闭掉。

在UBUNTU22.04上新建了一个16G的交换分区来作为备用内存,之后再跑代码就不会崩了,同时我监控了CPU的使用情况,确实跑满了16G内存又跑了8G交换分区,可见确实是内存不够导致出现退出的情况,目前代码运行已无问题。

【mindspore-gpu】【gpu训练】ubuntu终端自动退出相关推荐

  1. 关于gnome-terminal运行脚本,程序停止或者奔溃时终端自动退出问题

    gnome-terminal -- bash -c "./my_test.sh;" 改成 gnome-terminal -- bash -c "./my_test.sh; ...

  2. 阿里云使用笔记(一):从零开始配置阿里云GPU服务器训练深度学习模型

    题 神经网络训练需要强大的GPU支持,自己搭建成本太高,并且有时候出差等原因,无法将庞大的机箱搬走.因此,就产生了将深度学习网络训练的任务搬到云端的想法.由于初次使用,遇到不少大坑,花了两天时间才完整 ...

  3. pytorch多gpu并行训练操作指南

    关注上方"深度学习技术前沿",选择"星标公众号", 资源干货,第一时间送达! 来源:知乎 作者:link-web 链接:https://zhuanlan.zhi ...

  4. pytorch多gpu并行训练

    pytorch多gpu并行训练 link-web 转自:pytorch多gpu并行训练 - 知乎 目录(目录不可点击) 说明 1.和DataParallel的区别 2.如何启动程序的时候 2.1 单机 ...

  5. 单个GPU无法训练GPT-3,但有了这个,你能调优超参数了

    视学算法报道 编辑:陈萍.小舟 模型越大,超参数(HP)调优成本越高,微软联合 OpenAI 提出 HP 调优新范式,单个 GPU 上就可以调优 GPT-3 超参数. 伟大的科学成就不能仅靠反复试验取 ...

  6. 为什么安装的是gpu版本训练时还是用的cpu?_免费GPU哪家强?谷歌Kaggle vs. Colab | 硬核评测...

    作者 | Jeff Hale译者 | Monanfei责编 | 夕颜出品 | AI科技大本营(id:rgznai100) 谷歌有两个平台提供免费的云端GPU:Colab和Kaggle, 如果你想深入学 ...

  7. 如何应对多GPU大规模训练的挑战?

    几年前,深度学习还是一个只有少数几位人工智能和数据科学研究人员涉足的领域.而如今情况早已今非昔比.尤其是在 GPU 技术的推动下,深度学习正在全球掀起一番新的浪潮.自动驾驶汽车.工业目标检测.AI 医 ...

  8. Windows下使用Yolov3(GPU)训练+测试自己的数据集

    Windows下使用Yolov3(GPU)训练+测试自己的数据集 1.配置Yolov3 参考:Windows下使用darknet.exe跑通Yolov3 Window10+VS2017+CUDA10. ...

  9. ubuntu linux qq自动退出关闭的问题解决方法

    每次开机启动电脑,Ubuntu  10 linux qq 老是自动退出,QQ登陆了还没几分钟呢,刚想聊几句天的,悄无声息的QQ自动关闭了. 只要修改一下qq配置文件(/usr/bin/qq)就可以了. ...

最新文章

  1. 【转】Android APK反编译就这么简单 详解(附图)
  2. 大数据读书笔记(2)-流式计算
  3. ajax异步传输代码,Ajax同步与异步传输的示例代码
  4. JVM调优:常见垃圾回收器组合
  5. django - 替换admin的textarea为 富文本
  6. Coursera-AndrewNg(吴恩达)机器学习笔记——第四周编程作业(多分类与神经网络)...
  7. VB调用VC DLL函数
  8. 人人都可以创造自己的AI:深度学习的6大应用及3大成熟领域
  9. Git学习03-----最基本的几个命令
  10. ROS机器人SLAM学习:自建虚拟世界与Gazebo定位与导航仿真
  11. mysql 查询建表详情_MySQL 查看数据表结构以及详情的方法
  12. 数字信号处理的fpga实现_FPGA提高雷达性能,实现脉冲压缩
  13. 修改app名称后,分享到微信的app名称无变化问题
  14. 如何使用MDK建立STM32H7双核编译工程
  15. win32应用程序内存不足
  16. python基础(##16)
  17. 海绵城市 水利遥测终端机TY511
  18. 透明加密软件如何实现数据加密?
  19. Echarts分时图绘制
  20. UNIXLinux操作系统---文件系统

热门文章

  1. DivX/XviD -opencv 视频文件读取显示问题解决
  2. 口令破解工具L0phtCrack的使用
  3. 这种蔬菜水果店管理技巧,简直就是王炸操作!
  4. Teacher-Forcing, Student-Forcing, Schedual sampling , Teacher-Recommended and Professor-Forcing训练策略
  5. 网关kong及konga的API认证
  6. 【SICP练习】139 练习3.70
  7. 【基础①】python入门之环境搭建与输入输出
  8. 神经网络中卷积层的堆叠
  9. MPAndroidchart,折线图LineChart自定义x轴,使x轴上的值与折线上的点对应
  10. Arcface人脸识别算法流程分析