告知欄ですー。

■掲示板に戻る■ 全部 1- 101- 201- 301- 401- 501- 601- 701- 801- 901- 最新50 [PR]ぜろちゃんねるプラス[PR]  
レス数が1000を超えています。残念ながら全部は表示しません。

【Team 2ch】分散コンピューティング総合270【UD→BOINC】

618 :名無しさん?:2008/05/10(土) 07:30:56 ID:???
http://www.worldcommunitygrid.org/forums/wcg/viewthread?thread=20201

Re: Long Outage
A quick update:

We have been using GPFS - a clustered file system to mount SAN storage across several servers.
The file systems that store workunit data for downloads and that store the results
when they are uploaded are on GPFS. For reasons that we are still trying to diagnose,
the GPFS software caused a kernel panic on the webservers which locked them up (and they had to be physically rebooted) and caused the outage.

We are still using GPFS on some of the backend servers, but the web servers are now accessing the data via NFS.
We are continuing to investigate what happened with GPFS but full connectivity to members has been restored.

The BOINC clients should be able to upload and download work easily at this time.
They will automatically attempt to reconnect once the back-off timers expire so no action is required by the members.

We appreciate your patience.

だそうだ。

619 :名無しさん?:2008/05/10(土) 07:50:17 ID:???
>>618
簡単だったので訳もしてみた。

Re: 長時間の停止について
とりあえずのアップデート。

我々はGPFSと呼ばれる、数台のサーバーをまたがったSANストレージのクラスタファイルシステムを利用してます。
ダウンロードするワークユニットやアップロードされた結果を保存するファイルシステムはGPFS上にあります。
何らからの理由で診断モードとなり、GPFSソフトがウェブサーバー上でカーネルパニックが発生し、
ロックされてしましましたました。(物理的な再起動を要求されました)
そのため長時間の停止が発生しました。


バックエンドのサーバー郡でもGPFSを利用していますが、NFSを経由してデータにアクセスしています。
我々は、GPFSで起こった不具合の究明を引き続き行っていますが、
メンバーからの全ての接続に関してはすでに復旧しております。

現在、BONICクライアントからのアップロードとダウンロードは正常です。
クライアント側が一度自動的に再接続を試みると、バックオフタイマーは破棄されますので
、メンバーの方々は何もする必要がありません。


315KB
READ.CGI - 0ch+ BBS 0.7.4 20131106
ぜろちゃんねるプラス