KAMONOHASHI 1.xから2.xへの移行
考慮事項
- KAMONOHASHI2.x ではインフラ部分にdeepopsを採用する変更を行いました。
- Ubuntu16.04 はサポートされないため、18.04 へのバージョンアップが必要になります
- インフラ部分を含めたアンインストールとインストールが必要になります
- 2.x へのバージョンアップ後は、1.x へのバージョンダウンはできません
- 2.x のマシンの要件を事前にご確認ください
事前準備
- KAMONOHASHI のバックアップが取れていることを確認します
- KAMONOHASHI の Admin アカウントでログインできることを確認します
KAMONOHASHI 1.x のアンインストール
次のコマンドを実行します
cd /var/lib/kamonohashi/deploy-tools/<version>/infra/
./deploy-kqi-infra.sh prepare
./deploy-kqi-infra.sh clean
- deepops がインストールする GPU driver との競合を防ぐため、GPU ドライバをアンインストールします
- Ubuntu 16.04 を Ubuntu 18.04 にバージョンアップしてください
- Kubernetes Master の
/var/lib/kamonohashi/deploy-tools/
ディレクトリを別の場所に退避します - アンインストール完了後、マシンの要件に合わせた設定をしてください
2.x 構築ツールのセットアップ
- Kubernetes master をインストールするマシンにログインします。
sudo su -
を実行し、root ユーザになりますmkdir -p /var/lib/kamonohashi/ && cd /var/lib/kamonohashi/
を実行しますgit clone https://github.com/KAMONOHASHI/deploy-tools.git -b 2.2.1.0 --recursive
を実行してデプロイスクリプトを入手します/var/lib/kamonohashi/deploy-tools/
に移動します- プロキシ環境下では
./deepops/scripts/proxy.sh
ファイルにプロキシ設定を記載してください- no_proxy には
localhost,127.0.0.1,.cluster.local,使用するマシンのIPアドレス・ホスト名
の記載をしてください
- no_proxy には
-
./deploy-kamonohashi.sh prepare
を実行して構築に必要なソフトウェアをインストールします -
ansible でエラーが出る場合は ansible のアンインストールを実行してから
prepare
を実行してください- スクリプト実行中に適切な ansible がインストールされます
-
ubuntu アップグレードに際し、ansible の実行ファイルのみ残存するケースがあります。ansible のアンインストールと
prepare
実行時に次のようなエラーが発生します。その場合は、mv /usr/local/bin/ansible /tmp/
のようなコマンドで ansible 実行ファイルを退避してprepare
を実行してください -
ansible のアンインストールでのエラー
Cannot uninstall requirement ansible, not installed
-
prepare 実行時のエラー
Traceback (most recent call last): File "/usr/local/bin/ansible", line 40, in <module> from ansible.errors import AnsibleError, AnsibleOptionsError, AnsibleParserError ModuleNotFoundError: No module named 'ansible'
デプロイ構成の設定
./deploy-kamonohashi.sh configure cluster
を実行します。
対話形式で聞かれる以下の内容を入力します
質問文 | 解説 |
---|---|
Kubernetes master を デプロイするサーバ名 |
|
KAMONOHASHI を デプロイするサーバ名 |
|
Storage をデプロイするサーバ名 | HW ベンダーの NFS を使用する場合はカスタマイズ設定ガイドを参照してください |
計算ノード名 | ,区切りで複数指定できます。 例: gpu1,gpu2,gpu3 |
SSH で利用するユーザ名: | 構築時に使用する SSH ユーザを指定します。構築ツールが SSH 経由で構築を行う仕様のため、指定が必要になります |
入力内容に応じ、以下の設定ファイルに書き込みが行われます
- deepops の設定ファイル(deepops/config/inventry)
- kamonohashi の設定ファイル(kamonohashi/conf/settings.yml)
設定内容をカスタマイズする場合は次を参照し、設定ファイルの編集を行ってください。 カスタマイズ設定ガイド
デプロイの実行
以下のコマンドではデプロイ構成の設定で指定したユーザで SSH が実行されます。
指定したユーザでの SSH にパスワードが必要な場合は-k
、
指定したユーザでの sudo にパスワードが必要な場合は-K
のオプションを指定します。
例: ./deploy-kamonohashi.sh clean nvidia-repo -k -K
- ssh キーを~/.ssh/id_rsa で配置している場合は、ペアの id_rsa.pub も~/.ssh に配置してください
./deploy-kamonohashi.sh clean nvidia-repo
を実行します
- ubuntu16 用の nvidia リポジトリ登録が残っているためです
./deploy-kamonohashi.sh deploy nvidia-gpg-key
を実行します。
- nvidia の GPG キーは期限が半年であり、期限が切れると apt が失敗することの対応です
./deploy-kamonohashi.sh deploy all
を実行します。
実行後、対話形式で聞かれる以下の内容を入力します
質問文 | 解説 |
---|---|
Admin Password を入力: | KAMONOHASHI の admin アカウントで使用する 8 文字以上のパスワードです。数字のみのパスワードは使用不可となっているので注意してください。KAMONOHASHI Web UI ログイン・DB 接続、Object Storage へのログインに使用します。 一度構築に使用したパスワードはデプロイツールでは変更できません。パスワードを変える場合は、完全にデータを削除するか、パスワード変更手順を実施する必要があります。パスワード変更手順は[kamonohashi-support@jp.nssol.nipponsteel.com]にお問い合わせください |
SSH password: | 構築時に使用する、ssh ユーザのパスワードです。-k 指定時のみ聞かれます |
SUDO password[defaults to SSH password]: | 構築時に使用する、ssh ユーザの sudo パスワードです。-K 指定時のみ聞かれます。 |
入力後に構築が始まります。 構築には 20 分程かかります。
構築後にアクセス用の URL が表示されるので、それをブラウザで開きます