「メンテナンス」カテゴリーアーカイブ

【終了】【Unit1a】 ディスク装置内蔵HDDの交換実施について

Unit1a利用者 各位

        Unit1a ディスク装置内蔵HDDの交換実施について

Unit1aにて稼働中のディスク装置にて、サーバ内蔵のHDDに障害が発生した事を確認致しました。
そのため下記の通り、機器交換作業を実施致しますのでご連絡致します。
ご確認の程、よろしくお願い致します。

<システム停止期間>
 ・10月11日(火) 13:00 - 15:00

<作業内容>
 ・Unit1a ディスク装置
 ・内蔵HDDの交換

<利用者への影響>
 ・上記作業中、継続してご利用可能です。
 ・一時的にLustreファイルシステムへのアクセスに遅延が発生する可能性があります。

<問合せ先>
 ・support@sc.megabank.tohoku.ac.jp

よろしくお願いいたします。

【終了】【Unit1p】メンテナンスに伴うゲートウェイ停止について

Unit1p利用者 各位

        Unit1pメンテナンスに伴うゲートウェイ停止のお知らせ

Unit1pのメンテナンスに伴い、Unit1pのゲートウェイ及び共有メモリ型計算機を
停止しますので、お知らせいたします。
詳細は以下のとおりです。

<システム停止期間>
 ・10月5日(水) 10:00 - 11:00

<作業内容>
 ・Unit1pのゲートウェイ(gwp101-104)、共有メモリ型計算機(tma101)の再起動

<利用者への影響>
 ・Unit1pのゲートウェイ及び共有メモリ型計算機が停止します。
 ・NXのセッション情報が初期化されます。
 ・ゲートウェイや共有メモリ型計算機においてエディタで編集中であり、
  保存していない文書は消去されます。

<利用者への依頼事項>
 ・作業中の情報は、事前に必ず保存してください。

<問合せ先>
・support@sc.megabank.tohoku.ac.jp

ご迷惑をおかけして申し訳ございません。
どうぞよろしくお願いいたします。

【終了】【Unit1p,Unit1a,Unit3,Unit4】メンテナンス作業実施に伴うシステムの停止について

Unit1p、Unit1a、Unit3、Unit4 利用者各位

                         スーパーコンピュータ運営室


    メンテナンス作業実施に伴うシステムの停止について

メンテナンス作業実施に伴い、システムを停止しますのでお知らせいたします。
メンテナンス作業の詳細は以下の通りです。

<対象システム>
Unit1p、Unit1a、Unit3、Unit4

<システム停止期間>
 ・Unit1p、Unit1a
    2016年9月23日(金)9:00 - 19:00
  ・Unit3
    2016年9月26日(月)9:00 - 21:00
  ・Unit4
    2016年9月27日(火)9:00 - 22:00

<作業内容>
 ・Lustreファイルシステム関連機器Firmwareアップデート
 ・Lustreファイルシステムコントローラバッテリー交換
 ・Lustreファイルシステム関連サーバソフトウェアアップデート
 ・Infiniband ケーブルメンテナンス
 ・その他(RPMのアップデート等)

<作業に伴う利用者への影響>
 ・全システムが停止します。
 ・NXのセッション情報が初期化されます。
 ・ゲートウェイ上や計算ノードにおいてエディタで編集中であり、保存していない文書は消去されます。
 ・実行中のプロセスはシステム停止に伴い終了されます。またUGEで実行中の計算ジョブはリスケジュールされます。UGE計算ジョブのリスケジュール詳細については、下記<システム停止時に実行されていた計算ジョブについて>を参照ください。

<システム停止時に実行されていた計算ジョブについて>
システム停止開始時点でUGE(Univa Grid Engine)経由で実行中の計算ジョブはリスケジューリング処理を行い、システムメンテナンス完了後、リランしジョブを再開させます。
リスケジューリングしたジョブの情報は、対象ユーザのホームディレクトリ上に下記のファイル名のテキストファイルを置きます。そちらを御確認ください。

[Unit1a] u1p-rescheduling-20160923-.txt
[Unit1p] u1a-rescheduling-20160923-.txt
[Unit3]  u3-rescheduling-20160926-.txt
[Unit4]  u4-rescheduling-20160927-.txt

<利用者への依頼事項>
 ・作業中の情報は、事前に必ず保存しておくようにしてください。

<問合せ先>
 ・support@sc.megabank.tohoku.ac.jp

ご迷惑をおかけして申し訳ありません。
どうぞよろしくお願いいたします。


【Unit1p】3/21(月、祝日) 東北大学ネットワーク機器交換工事に伴うネットワーク停止について

Unit1p利用者各位


                    スーパーコンピュータ運営室

      東北大学ネットワーク機器交換工事に伴うネットワーク停止について

東北大学ネットワーク機器交換工事の実施に伴い、
Unit1pシステムへ外部からログインができない時間帯が発生しますので
お知らせいたします。

<ネットワーク停止期間>
 ・2016年3月21日(月)10:45 - 15:30

<作業内容>
 ・東北大学ネットワーク機器の交換工事

<作業に伴う利用者への影響>
 ・外部からUnit1pへのログインができません。
 ・利用停止期間中の作業情報は破棄されます。

<利用者への依頼事項>
 ・作業中の情報は、事前に必ず保存しておくようにしてください。

<問合せ先>
 ・support[at]sc.megabank.tohoku.ac.jp

ご迷惑をおかけして申し訳ありません。
どうぞよろしくお願いいたします。

【終了】【Unit1p】3/10(木) メンテナンス作業実施に伴うシステムの停止について

Unit1p利用者各位


                    スーパーコンピュータ運営室

   Unit1pメンテナンス作業実施に伴うシステムの停止について

Unit1pのメンテナンス作業実施に伴い、Unit1pのシステムを停止しますので
お知らせいたします。メンテナンス作業の詳細は以下の通りです。

<システム停止期間>
 ・2016年3月10日(木)9:00 - 17:00

<作業内容>
 ・Infiniband ケーブルメンテナンス
 ・LustreClientのアップデート
 ・NX Enterprise Serverアップデート
 ・UnivaGridEngineメンテナンス
 ・その他(RPMのアップデート等)

<作業に伴う利用者への影響>
 ・Unit1pの全システムが停止します。
 ・NXのセッション情報が初期化されます。
 ・ゲートウェイ上でコマンドライン経由で実行中のプロセスは途中で停止します
  (バッチジョブで登録している場合には下記を参照ください)。
 ・ゲートウェイ上や計算ノードにおいてエディタで編集中であり、保存していない文書は消去されます。

<システム停止時に実行されていた計算ジョブについて>
2016年3月10日(木)9時時点でUGE(Univa Grid Engine)経由で実行中の計算ジョブは
リスケジューリング処理を行い、3月10日のシステムメンテナンス完了後、リランしジョブを再開させます。
リスケジューリングしたジョブの情報は、対象ユーザのホームディレクトリ上に
 u1p-rescheduling-20160310-.txt
と言う名前でテキストファイルを置きます。そちらを御確認ください。

<利用者への依頼事項>
 ・作業中の情報は、事前に必ず保存しておくようにしてください。

<問合せ先>
 ・support[at]sc.megabank.tohoku.ac.jp

ご迷惑をおかけして申し訳ありません。
どうぞよろしくお願いいたします。

【終了】【Unit1p】2/18(木) 東北大学ネットワーク機器交換工事に伴うネットワーク停止について

Unit1p利用者各位


                    スーパーコンピュータ運営室

      東北大学ネットワーク機器交換工事に伴うネットワーク停止について

東北大学ネットワーク機器交換工事の実施に伴い、
Unit1pシステムへ外部からログインができない時間帯が発生しますので
お知らせいたします。

<ネットワーク停止期間>
 ・2016年2月18日(木)14:00 - 15:00(1時間)

<作業内容>
 ・東北大学ネットワーク機器の交換工事

<作業に伴う利用者への影響>
 ・外部からUnit1pへのログインができません。
 ・利用停止期間中の作業情報は破棄されます。

<利用者への依頼事項>
 ・作業中の情報は、事前に必ず保存しておくようにしてください。

<問合せ先>
 ・support[at]sc.megabank.tohoku.ac.jp

ご迷惑をおかけして申し訳ありません。
どうぞよろしくお願いいたします。

【終了】【Unit1p】1/29(金) 東北大学機器交換工事に伴うネットワーク停止について

Unit1p利用者各位


                    スーパーコンピュータ運営室

      東北大学機器交換工事に伴うネットワーク停止について

東北大学ネットワーク機器交換工事の実施に伴い、
Unit1pシステムへ外部からログインができない時間帯が発生しますので
お知らせいたします。

<ネットワーク停止期間>
 ・2016年1月29日(金)12:00 - 13:00(1時間)

<作業内容>
 ・東北大学ネットワーク機器の交換工事

<作業に伴う利用者への影響>
 ・外部からUnit1pへのログインができません。
 ・利用停止期間中の作業情報は破棄されます。

<利用者への依頼事項>
 ・作業中の情報は、事前に必ず保存しておくようにしてください。

<問合せ先>
 ・support[at]sc.megabank.tohoku.ac.jp

ご迷惑をおかけして申し訳ありません。
どうぞよろしくお願いいたします。

Unit1pメンテナンス作業実施に伴うシステムの停止について(9月28日(月)17:00~9月29日(火)21:00)【終了】

Unit1p利用者各位


                    スーパーコンピュータ運営室

   Unit1pメンテナンス作業実施に伴うシステムの停止について

Unit1pのメンテナンス作業実施に伴い、Unit1pのシステムを停止しますので
お知らせいたします。メンテナンス作業の詳細は以下の通りです。

<システム停止期間>
 ・2015年9月28日(月)17:00 - 2015年9月29日(火)21:00
 ※29日(火)のメンテナンスを9時から確実に実施するため、
前日の17時にストレージシステムを停止します。

<メンテナンス作業日時>
 ・2015年9月29日(火)9:00 - 21:00

<作業内容>
 ・Infiniband Switchのファームウェアアップデート
 ・Lustreのアップデート
 ・その他(RPMのアップデート等)

<問合せ先>
 ・support[at]sc.megabank.tohoku.ac.jp

ご迷惑をおかけして申し訳ありません。
どうぞよろしくお願いいたします。

【完了】Unit1p(公開系)臨時システムメンテナンス(5月19日(火)9:00~20:00)

Unit1pの臨時メンテナンスは2015年5月19日(火)19時30分までに全て
完了いたしました。ご協力ありがとうございました(5/19 19:35追記)


Unit1pの臨時メンテナンスは2015年5月19日(火)9時00分 – 20時00分までと
延長させて頂きます。ご迷惑をお掛けしております(5/19 16:35追記)


Unit1p利用者各位

5月15日(金)13時23分にInfiniBandスイッチに障害が発生しました。
それに伴い、Unit1pにおいて、ジョブ投入によって計算ノードが起動した
場合にInfiniBand通信が行えずに、起動したノードでジョブが
実行できない問題が発生しております。

上記障害対応のため、下記日時に臨時メンテナンスを実施いたします。

日時:2015年5月19日(火)9時00分 – 17時00分(予定)
内容:InfiniBandスイッチの再起動および部品交換

メンテナンス実施にあたり、ゲートウェイノードにログインしている
アカウントについては5月19日(火)9時にログアウトをさせて頂きます。
計算ノードにて実行しているジョブに関しては、同日9時に
リスケジューリングを行い、メンテナンス完了後、再実行を行うようにいたします。

Unit1p(公開系)システムメンテナンスの連絡(2015年5月18日(月)10:00~12:00 完了)

以下のメンテナンスは完了しました。(5月18日 14:00追記)。

Unit1p利用者各位

5月18日(月) 10:00~12:00に以下のメンテナンスを予定しています。

・ネットワーク設定変更
・ジョブスケジューラパラメータ変更
・ストレージ部分設定変更
※当初予定より一部作業内容を変更しております

メンテナンスを実施するにあたり、5月18日(月) 10:00~12:00にかけては
Unit1pにアクセスすることはできませんのでご了承願います。
Unit1pにて実行されている計算ジョブに関しては、そのまま計算が継続いたします。
Unit1p運用再開後にリスケジューリングは行いません。