diff --git a/README.md b/README.md index 1fc1e2c0c..0a7e74705 100644 --- a/README.md +++ b/README.md @@ -1,6 +1,6 @@ # PaddleCustomDevice -简体中文 | [English](./README_en.md) +简体中文 | [English](./README_en.md) | [日本語](./README_ja.md) 『飞桨』自定义硬件接入实现。 diff --git a/README_en.md b/README_en.md index bdb486e05..89e9917f0 100644 --- a/README_en.md +++ b/README_en.md @@ -1,6 +1,6 @@ # PaddleCustomDevice -English | [简体中文](./README.md) +English | [简体中文](./README.md) | [日本語](./README_ja.md) PaddlePaddle custom device implementaion. diff --git a/README_ja.md b/README_ja.md new file mode 100644 index 000000000..71e5e6012 --- /dev/null +++ b/README_ja.md @@ -0,0 +1,23 @@ +# PaddleCustomDevice + +[English](./README_en.md) | [简体中文](./README.md) | 日本語 + +PaddlePaddle カスタムデバイスの実装。 + +## ユーザーガイド + +プログラム設計ドキュメントは[カスタムデバイスの概要](https://www.paddlepaddle.org.cn/documentation/docs/zh/develop/dev_guides/custom_device_docs/custom_device_overview_cn.html)を、開発ガイドラインについては、[新しいハードウェアのアクセス例](https://www.paddlepaddle.org.cn/documentation/docs/zh/develop/dev_guides/custom_device_docs/custom_device_example_cn.html)を、デモコードは [CustomCPU](backends/custom_cpu/README_ja.md) を参照してください。 + +## ハードウェアバックエンド + +PaddleCustomDevice は以下のバックエンドをサポートしています: + +- [Ascend NPU 用 PaddlePaddle カスタムデバイス実装](backends/npu/README.md) +- [Cambricon MLU 用 PaddlePaddle カスタムデバイス実装](backends/mlu/README.md) +- [Intel GPU 用 PaddlePaddle カスタムデバイス実装](backends/intel_gpu/README.md) +- [Apple MPS 用 PaddlePaddle カスタムデバイス実装](backends/mps/README.md) +- [Biren GPU 用 PaddlePaddle カスタムデバイス実装](backends/biren_gpu/README.md) + +## 著作権とライセンス + +PaddleCustomDevice は [Apache-2.0 license](LICENSE) の下で提供されています。 diff --git a/backends/custom_cpu/README.md b/backends/custom_cpu/README.md index e242d35a8..159e0bec3 100644 --- a/backends/custom_cpu/README.md +++ b/backends/custom_cpu/README.md @@ -1,6 +1,6 @@ # PaddlePaddle Custom Device Implementaion for Custom CPU -English | [简体中文](./README_cn.md) +English | [简体中文](./README_cn.md) | [日本語](./README_ja.md) Please refer to the following steps to compile, install and verify the custom device implementaion for Custom CPU. diff --git a/backends/custom_cpu/README_cn.md b/backends/custom_cpu/README_cn.md index 564231528..a6c665463 100644 --- a/backends/custom_cpu/README_cn.md +++ b/backends/custom_cpu/README_cn.md @@ -1,6 +1,6 @@ # 飞桨自定义接入硬件后端(Custom CPU) -简体中文 | [English](./README.md) +简体中文 | [English](./README.md) | [日本語](./README_ja.md) 请参考以下步骤进行硬件后端(Custom CPU)的编译安装与验证 diff --git a/backends/custom_cpu/README_ja.md b/backends/custom_cpu/README_ja.md new file mode 100644 index 000000000..aa4ccfe3a --- /dev/null +++ b/backends/custom_cpu/README_ja.md @@ -0,0 +1,131 @@ +# PaddlePaddle カスタム CPU のためのカスタムデバイス実装 + +[English](./README.md) | [简体中文](./README_cn.md) | 日本語 + +カスタム CPU 用カスタムデバイス実装のコンパイル、インストール、検証については、以下の手順を参照してください。 + +## 環境とソースコードの準備 + +```bash +# 1. PaddlePaddle CPU の開発用 Docker イメージをプル +# イメージの dockerfile は tools/dockerfile ディレクトリにあります +docker pull registry.baidubce.com/device/paddle-cpu:ubuntu18-x86_64-gcc82 +docker pull registry.baidubce.com/device/paddle-cpu:ubuntu18-aarch64-gcc82 + +# 2. docker コンテナを起動するには、以下のコマンドを参照 +docker run -it --name paddle-dev-cpu -v `pwd`:/workspace \ + --network=host --shm-size=128G --workdir=/workspace \ + --cap-add=SYS_PTRACE --security-opt seccomp=unconfined \ + registry.baidubce.com/device/paddle-cpu:ubuntu18-$(uname -m)-gcc82 /bin/bash + +# 3. Paddle のソースコードと一緒にソースコードを再帰的にクローン +git clone --recursive https://github.com/PaddlePaddle/PaddleCustomDevice +cd PaddleCustomDevice + +# 4. 以下のコマンドを実行してサブモジュールを更新 +git submodule sync +git submodule update --remote --init --recursive +``` + +## コンパイルとインストール + +```bash +# カスタム CPU の実装へナビゲート +cd backends/custom_cpu + +# コンパイルする前に、Paddle がインストールされていることを確認してください +pip install paddlepaddle==0.0.0 -f https://www.paddlepaddle.org.cn/whl/linux/cpu-mkl/develop.html + +# ビルドディレクトリを作成し +mkdir build && cd build + +cmake .. +make -j8 + +# pip を使って出力をインストールする +pip install dist/paddle_custom_cpu*.whl +``` + +## 検証 + +```bash +# 利用可能なハードウェアバックエンドをリストアップ +python -c "import paddle; print(paddle.device.get_all_custom_device_type())" + +# 期待出力 +['custom_cpu'] + +# 簡単なモデルを実行する +python ../tests/test_MNIST_model.py + +# 期待される同様の出力 +... ... +Epoch 0 step 0, Loss = [2.2956038], Accuracy = 0.15625 +Epoch 0 step 100, Loss = [2.1552896], Accuracy = 0.3125 +Epoch 0 step 200, Loss = [2.1177733], Accuracy = 0.4375 +Epoch 0 step 300, Loss = [2.0089214], Accuracy = 0.53125 +Epoch 0 step 400, Loss = [2.0845466], Accuracy = 0.421875 +Epoch 0 step 500, Loss = [2.0473], Accuracy = 0.453125 +Epoch 0 step 600, Loss = [1.8561764], Accuracy = 0.71875 +Epoch 0 step 700, Loss = [1.9915285], Accuracy = 0.53125 +Epoch 0 step 800, Loss = [1.8925955], Accuracy = 0.640625 +Epoch 0 step 900, Loss = [1.8199624], Accuracy = 0.734375 +``` + +## PaddleInference の使用 + +プラグインの再コンパイル + +```bash +# PaddleInference をコンパイルする +git clone https://github.com/PaddlePaddle/Paddle.git +git clone https://github.com/ronny1996/Paddle-Inference-Demo.git + +mkdir -p Paddle/build +pushd Paddle/build + +cmake .. -DPY_VERSION=3.7 -DWITH_GPU=OFF -DWITH_TESTING=ON -DCMAKE_BUILD_TYPE=Release -DON_INFER=ON -DWITH_MKL=ON -DWITH_CUSTOM_DEVICE=ON + +make -j8 + +popd +cp -R Paddle/build/paddle_inference_install_dir Paddle-Inference-Demo/c++/lib/paddle_inference +export PADDLE_INFERENCE_LIB_DIR=$(realpath Paddle-Inference-Demo/c++/lib/paddle_inference/paddle/lib) + +# プラグインのコンパイル +mkdir -p PaddleCustomDevice/backends/custom_cpu/build +pushd PaddleCustomDevice/backends/custom_cpu/build + +cmake .. -DON_INFER=ON -DPADDLE_INFERENCE_LIB_DIR=${PADDLE_INFERENCE_LIB_DIR} +make -j8 + +# プラグインディレクトリの指定 +export CUSTOM_DEVICE_ROOT=$PWD +popd +``` + +PaddleInference の使用 + +```bash +pushd Paddle-Inference-Demo/c++/resnet50 + +# resnet50_test.cc を修正し、config.EnableUseGpu(100, 0) の代わりに config.EnableCustomDevice("custom_cpu", 0) を使用 + +bash run.sh +``` + +期待される同様の出力 + +```bash +I0713 09:02:38.808723 24792 resnet50_test.cc:74] run avg time is 297.75 ms +I0713 09:02:38.808859 24792 resnet50_test.cc:89] 0 : 8.76192e-29 +I0713 09:02:38.808894 24792 resnet50_test.cc:89] 100 : 8.76192e-29 +I0713 09:02:38.808904 24792 resnet50_test.cc:89] 200 : 8.76192e-29 +I0713 09:02:38.808912 24792 resnet50_test.cc:89] 300 : 8.76192e-29 +I0713 09:02:38.808920 24792 resnet50_test.cc:89] 400 : 8.76192e-29 +I0713 09:02:38.808928 24792 resnet50_test.cc:89] 500 : 8.76192e-29 +I0713 09:02:38.808936 24792 resnet50_test.cc:89] 600 : 1.05766e-19 +I0713 09:02:38.808945 24792 resnet50_test.cc:89] 700 : 2.04093e-23 +I0713 09:02:38.808954 24792 resnet50_test.cc:89] 800 : 3.85255e-25 +I0713 09:02:38.808961 24792 resnet50_test.cc:89] 900 : 8.76192e-29 +```