操作系统:Linux version 3.10.0-957.el7.x86_64
CPU:海光CPU
GPU:海光DCU
调度器:Slurm
软件栈:ROCm框架
module rm compiler/rocm/2.9
module load compiler/rocm/4.0.1
module load apps/anaconda3/5.2.0
创建Python环境
conda create -p ~/conda-envs/paddle_dcu python==3.7.10
激活Python环境
conda activate ~/conda-envs/paddle_dcu
在激活的Conda Python环境中安装依赖库
wget https://baidu-nlp.bj.bcebos.com/PaddleHelix/HelixFold/paddlepaddle_rocm-0.0.0.dev628-cp37-cp37m-linux_x86_64.whl
pip install -r requirements_dcu.txt
在helixfold
目录下,下载HelixFold需要的两个工具:lddt和tm-score
wget https://baidu-nlp.bj.bcebos.com/PaddleHelix/HelixFold/lddt
wget https://baidu-nlp.bj.bcebos.com/PaddleHelix/HelixFold/tm_score
mkdir tools && mv lddt tm_score tools
在helixfold
目录下,下载Demo数据集
wget https://baidu-nlp.bj.bcebos.com/PaddleHelix/HelixFold/data.tar.gz
tar -zxvf data.tar.gz
- 任务配置
在 dcu_train.sh 脚本中配置任务使用的资源量
- 任务脚本
在 train_dcu.sh 脚本中加载PaddlePaddle Python环境
例如:
module rm compiler/rocm/2.9
module load compiler/rocm/4.0.1
module load apps/anaconda3/5.2.0
source activate ~/conda-envs/paddle_dcu
sbatch dcu_train.sh
日志在log/目录下