电子发烧友App

硬声App

0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示
电子发烧友网>电子资料下载>电子资料>PyTorch教程23.3之使用AWS EC2实例

PyTorch教程23.3之使用AWS EC2实例

2023-06-05 | pdf | 0.85 MB | 次下载 | 免费

资料介绍

在本节中,我们将向您展示如何在原始 Linux 机器上安装所有库。回想一下,在第 23.2 节中,我们讨论了如何使用 Amazon SageMaker,同时自己构建实例在 AWS 上的成本更低。演练包括三个步骤:

  1. 从 AWS EC2 请求 GPU Linux 实例。

  2. 安装 CUDA(或使用预装 CUDA 的 Amazon Machine Image)。

  3. 安装深度学习框架和其他用于运行本书代码的库。

这个过程也适用于其他实例(和其他云),尽管有一些小的修改。在继续之前,您需要创建一个 AWS 帐户,有关更多详细信息,请参阅第 23.2 节。

23.3.1. 创建和运行 EC2 实例

登录您的 AWS 账户后,点击“EC2”(图 23.3.1)进入 EC2 面板。

https://file.elecfans.com/web2/M00/A9/D0/poYBAGR9QHaAaMMdAAG90GcvmVs217.png

图 23.3.1打开 EC2 控制台。

图 23.3.2显示了 EC2 面板。

https://file.elecfans.com/web2/M00/AA/4B/pYYBAGR9QHmAKknEAAIPlu3IKCM499.png

图 23.3.2 EC2 面板。

23.3.1.1。预设位置

选择附近的数据中心以减少延迟,例如“Oregon”(图 23.3.2右上角的红色框标记)。如果您位于中国,则可以选择附近的亚太地区,例如首尔或东京。请注意,某些数据中心可能没有 GPU 实例。

23.3.1.2。增加限制

选择实例前,点击左侧栏中的“Limits”标签查看是否有数量限制,如图 23.3.2所示。图 23.3.3显示了这种限制的一个例子。该帐户目前无法按区域打开“p2.xlarge”实例。如果您需要开启一个或多个实例,请点击“请求提升限额”链接申请更高的实例配额。一般来说,处理一份申请需要一个工作日。

https://file.elecfans.com/web2/M00/AA/4B/pYYBAGR9QHuATts7AAHX3Eb3s3A849.png

图 23.3.3实例数量限制。

23.3.1.3。启动实例

接下来,单击图 23.3.2中红色框标记的“Launch Instance”按钮 以启动您的实例。

我们首先选择合适的 Amazon Machine Image (AMI)。选择一个 Ubuntu 实例(图 23.3.4)。

https://file.elecfans.com/web2/M00/A9/D0/poYBAGR9QH-AcEnuAAIX1rhac80359.png

图 23.3.4选择一个 AMI。

EC2 提供了许多不同的实例配置供您选择。这有时会让初学者感到不知所措。表 23.3.1列出了不同的适用机器。

表 23.3.1不同的 EC2 实例类型

姓名

显卡

笔记

g2

格子K520

古老的

p2

开普勒K80

旧但通常像现货一样便宜

g3

麦克斯韦M60

好的权衡

p3

沃尔特V100

FP16 的高性能

p4

安培A100

大规模训练的高性能

g4

图灵T4

推理优化 FP16/INT8

所有这些服务器都有多种类型,表明使用的 GPU 数量。例如,p2.xlarge 有 1 个 GPU,p2.16xlarge 有 16 个 GPU 和更多内存。有关更多详细信息,请参阅AWS EC2 文档摘要页面出于说明的目的,p2.xlarge 就足够了(在 图 23.3.5的红色框中标记)。

https://file.elecfans.com/web2/M00/AA/4B/pYYBAGR9QIKAUSHbAACrxhDri5c100.png

图 23.3.5选择一个实例。

请注意,您应该使用具有合适驱动程序的支持 GPU 的实例和支持 GPU 的深度学习框架。否则,您将看不到使用 GPU 带来的任何好处。

我们继续选择用于访问实例的密钥对。如果没有密钥对,点击 图23.3.6中的“新建密钥对”生成密钥对。随后,您可以选择之前生成的密钥对。如果生成新密钥对,请确保下载密钥对并将其存储在安全位置。这是您通过 SSH 连接到服务器的唯一方法。

https://file.elecfans.com/web2/M00/AA/4B/pYYBAGR9QISAAgZvAACgPcmz8T4238.png

图 23.3.6选择密钥对。

在这个例子中,我们将保留“网络设置”的默认配置(点击“编辑”按钮配置子网和安全组等项目)。我们只是将默认硬盘大小增加到 64 GB(图 23.3.7)。请注意,CUDA 本身已经占用了 4 GB。

https://file.elecfans.com/web2/M00/A9/D0/poYBAGR9QIaATSZqAAC8gtqzosk023.png

图23.3.7修改硬盘大小。

单击“Launch Instance”以启动创建的实例。点击图23.3.8所示的实例ID,可以查看该实例的状态。

https://file.elecfans.com/web2/M00/AA/4B/pYYBAGR9QImAEJv_AABy1ENBZ4s976.png

图 23.3.8点击实例 ID。

23.3.1.4。连接到实例

如图23.3.9所示,实例状态变为绿色后,右键单击实例,选择Connect查看实例访问方式。

https://file.elecfans.com/web2/M00/AA/4B/pYYBAGR9QI2AcD-kAACL74D0SIw403.png

图23.3.9查看实例访问方式。

如果这是一个新密钥,则必须不能公开查看 SSH 才能正常工作。转到您存储的文件夹D2L_key.pem并执行以下命令以使密钥不公开可见:

chmod 400 D2L_key.pem
https://file.elecfans.com/web2/M00/A9/D0/poYBAGR9QI-ADEEfAAH9nvBHBqI582.png

图23.3.10查看实例访问和启动方法。

现在,复制图23.3.10下方红框中的ssh命令 ,粘贴到命令行中:

ssh -i "D2L_key.pem" ubuntu@ec2-xx-xxx-xxx-xxx.y.compute.amazonaws.com

当命令行提示“Are you sure you want to continue connecting (yes/no)”时,输入“yes”并回车登录实例。

您的服务器现已准备就绪。

23.3.2。安装 CUDA

在安装 CUDA 之前,请务必使用最新的驱动程序更新实例。

sudo apt-get update && sudo apt-get install -y build-essential git libgfortran3

这里我们下载CUDA 10.1。访问NVIDIA官方资源库找到下载链接,如图23.3.11所示。

https://file.elecfans.com/web2/M00/AA/4B/pYYBAGR9QJKAFS77AANqH-N_aw0415.png

图 23.3.11找到CUDA 10.1下载地址。

复制说明并将其粘贴到终端以安装 CUDA 10.1。

# The link and file name are subject to changes
wget https://developer.download.nvidia.com/compute/cuda/repos/ubuntu1804/x86_64/cuda-ubuntu1804.pin
sudo mv cuda-ubuntu1804.pin /etc/apt/preferences.d/cuda-repository-pin-600
wget http://developer.download.nvidia.com/compute/cuda/10.1/Prod/local_installers/cuda-repo-ubuntu1804-10-1-local-10.1.243-418.87.00_1.0-1_amd64.deb
sudo dpkg -i cuda-repo-ubuntu1804-10-1-local-10.1.243-418.87.00_1.0-1_amd64.deb
sudo apt-key add /var/cuda-repo-10-1-local-10.1.243-418.87.00/7fa2af80.pub
sudo apt-get update
sudo apt-get -y install cuda

安装程序后,运行以下命令查看 GPU:

nvidia-smi

最后,将CUDA添加到库路径中,以帮助其他库找到它。

echo "export LD_LIBRARY_PATH=\${LD_LIBRARY_PATH}:/usr/local/cuda/lib64" >> ~/.bashrc

23.3.3。安装用于运行代码的库

要运行本书的代码,只需按照 在 EC2 实例上为 Linux 用户安装中的步骤操作,并使用以下在远程 Linux 服务器上工作的提示:

  • 在Miniconda安装页面下载bash脚本,右击下载链接,选择“复制链接地址”,然后执行 .wget [copied link address]

  • 运行后,您可以执行 而不是关闭并重新打开当前的 shell。~/miniconda3/bin/conda initsource ~/.bashrc

23.3.4。远程运行 Jupyter Notebook

要远程运行 Jupyter Notebook,您需要使用 SSH 端口转发。毕竟云端的服务器没有显示器和键盘。为此,从您的台式机(或笔记本电脑)登录您的服务器,如下所示:

# This command must be run in the local command line
ssh -i "/path/to/key.pem" ubuntu@ec2-xx-xxx-xxx-xxx.y.compute.amazonaws.com -L 8889:localhost:8888

接下来,到EC2实例上本书下载代码的位置,然后运行:

conda activate d2l
jupyter notebook

图 23.3.12显示了运行 Jupyter Notebook 后可能的输出。最后一行是端口 8888 的 URL。

https://file.elecfans.com/web2/M00/A9/D0/poYBAGR9QJWADhauAAPCkaX33oI402.png

图 23.3.12运行 Jupyter Notebook 后的输出。最后一行是端口 8888 的 URL。

由于你使用了端口转发到8889端口,复制图23.3.12红框中的最后一行,将URL中的“8888”替换为“8889”,在本地浏览器中打开。

23.3.5。关闭未使用的实例

由于云服务按使用时间计费,您应该关闭未使用的实例。请注意,还有其他选择:

  • “停止”实例意味着您将能够再次启动它。这类似于关闭常规服务器的电源但是,停止的实例仍会为保留的硬盘空间收取少量费用。

  • “终止”实例将删除与其关联的所有数据。这包括磁盘,因此您无法再次启动它。仅当您知道将来不需要它时才这样做。

如果您想将该实例用作更多实例的模板,请右键单击图 23.3.9中的示例并选择“图像” “创建”以创建实例的图像。完成后,选择“实例状态” “终止”终止实例。下次要使用该实例时,您可以按照本节中的步骤,根据保存的图像创建实例。唯一的区别是,在“1. 选择AMI”如图23.3.4所示,您必须使用左侧的“My AMIs”选项来选择您保存的图像。创建的实例将保留存储在映像硬盘上的信息。例如,您不必重新安装 CUDA 和其他运行时环境。

23.3.6. 概括

  • 我们可以按需启动和停止实例,而无需购买和构建我们自己的计算机。

  • 在使用支持 GPU 的深度学习框架之前,我们需要安装 CUDA。

  • 我们可以使用端口转发在远程服务器上运行 Jupyter Notebook。

23.3.7。练习

  1. 云提供了便利,但并不便宜。了解如何启动Spot 实例 以了解如何降低成本。

  2. 试验不同的 GPU 服务器。他们有多快?

  3. 试验多 GPU 服务器。你能把事情扩大到什么程度?

Discussions


下载该资料的人也在下载 下载该资料的人还在阅读
更多 >

评论

查看更多

下载排行

本周

  1. 1IP5332电源管理SOC中文手册
  2. 2.94 MB  |  3次下载  |  免费
  3. 2RGB SMD LED打造壮观的灯光秀
  4. 3.39 MB  |  2次下载  |  免费
  5. 3SD8224C触摸检测IC中文手册
  6. 13.73 MB  |  1次下载  |  2 积分
  7. 4PG-FP5 Flash Memory Programmer Setup 手册
  8. 150.83KB  |  1次下载  |  免费
  9. 5ZSPM9015数据表
  10. 601.74KB  |  1次下载  |  免费
  11. 6通过WIFI修改配置
  12. 0.71 MB  |  1次下载  |  免费
  13. 7LabVIEW调康耐视VisionPro
  14. 12.47 MB  |  1次下载  |  10 积分
  15. 8M16C/63 组 数据表
  16. 1016.09KB  |  1次下载  |  免费

本月

  1. 1传感器基础知识讲座
  2. 9.21 MB  |  37次下载  |  免费
  3. 2ASUS主板图纸
  4. 1.49 MB  |  21次下载  |  免费
  5. 3中科昊芯Start_DSC28034PNT开发板试用手册
  6. 2.98 MB  |  15次下载  |  免费
  7. 4Labview的9点标定计算
  8. 0.22 MB  |  8次下载  |  5 积分
  9. 5实现高效率、无LDO、低损耗电源的低噪声和低纹波技术
  10. 2.20 MB  |  8次下载  |  免费
  11. 6STM32F10xxx参考手册(中文)
  12. 15.19 MB  |  7次下载  |  1 积分
  13. 7智能电源板开源分享
  14. 0.00 MB  |  7次下载  |  免费
  15. 8STM32F10xxx闪存编程参考手册(中文)
  16. 0.45 MB  |  6次下载  |  1 积分

总榜

  1. 1matlab软件下载入口
  2. 未知  |  935037次下载  |  免费
  3. 2protel99se软件下载(可英文版转中文版)
  4. 78.1 MB  |  537765次下载  |  免费
  5. 3MATLAB 7.1 下载 (含软件介绍)
  6. 未知  |  420007次下载  |  免费
  7. 4OrCAD10.5下载,OrCAD10.5中文版软件
  8. 817182  |  234275次下载  |  免费
  9. 5Altium DXP2002下载入口
  10. 未知  |  233031次下载  |  免费
  11. 6数据采集系统基础知识视频
  12. 16.3 MB  |  192989次下载  |  免费
  13. 7电路仿真软件multisim 10.0免费下载
  14. 340992  |  191158次下载  |  免费
  15. 8十天学会AVR单片机与C语言视频教程 下载
  16. 158M  |  183248次下载  |  免费