2008年12月23日火曜日

メモリエラー検出ができるEDACドライバ

~X38チップセット及びECC対応メモリ搭載マシンをご利用の方に~

 みなさん、こんにちは。かわらばん編集長の安藤です。今年からプチかわらばんを始めましたが、いかがでしょうか?昨年はリーマン・ショックの影響で日本経済にも大きな打撃がありました。今後しばらくこのような状況が続きそうですが、がんばって行きたいと思います。

 以前の“かわらばん”でECC機能の不具合修正についてお伝えしましたが、今回は、Intel社X38チップセット用のEDACドライバの作成についてのお話です。


 サーバやワークステーションのメインメモリにはDRAMが使われていますが、そのメモリに記憶されているデータは、時として、内容が書き換わってしまうエラーが生じることがあります。そのエラーにはソフトエラーとハードエラーの2種類があります。
 ソフトエラーは、宇宙から地上にやってくる宇宙線がメモリチップに衝突し、メモリセルに蓄えられた電荷の値を変化させてしまうことにより生じます。この現象は、メモリが壊れてしまっているわけではないですが、避けることができません。
 一方、ハードエラーはDRAMのメモリセル自体が壊れてしまったり、セルに蓄えられている電荷の“0”、“1”の情報を読み取るセンスアンプが壊れてしまったりして生じます。これはハード的に壊れた状態であるので、恒久的に正しいデータを読み取ることはできません。

 大切なデータが反転してしまっては困りますので、サーバやワークステーションでは、例えばビットエラーを自動で修正したり、修正不能な場合でもビットエラーが起こったことを、検出することができるECCメモリが使われています。
LinuxにはEDACというドライバがあり、それを用いることでメインメモリやPCIバスのビットエラーを検出することが出来ます。

 具体的には、Memory Controller Hub(一般にノースブリッジと呼ばれるマザーボード上のチップ)をPCIデバイスとして扱うことで、そこから Correctable Error(訂正可能エラー) 、 Uncorrectable Error(訂正不可能エラー) といったエラー情報を読み出し、ログに残したりカーネルパニックを起こしたりするといった動作をします。

 EDACはチップセットの機能を利用するので、チップセット毎に対応するドライバを用意しなければなりません。 ところがIntel社のX38チップセット用のEDACドライバは用意されていませんでしたので、今回それを作成しました。(コードはこちらです。)

 このコードを、EDACを管理しているbluesmokeプロジェクトのメーリングリストにそのモジュールを投稿したところ、Linuxカーネルの2.6.28-rc3にマージされました(ChangeLog、X38 という文字列で検索)。

 当社で扱っているサーバでも、X38を利用しているものがあります。実際にこのサーバとECCのチェックのためにデータピンを削ったメモリを使用し、動作を確認しています

 現時点では、まだRC版の段階なので正式リリースではありませんが、2.6.28のリリースには含まれる予定です。チップセットとしてX38を搭載し、ECC対応のメモリを搭載したマシンを利用している場合は、このモジュールを利用することでメモリエラーを検出することが可能になります。是非お使い下さい。

 本年も引き続き、最新情報や商品紹介などの情報を発信していきますので、どうぞよろしくお願いいたします。

2008年11月5日水曜日

memtest86+(プログラム)

かわらばん編集長の安藤です。

今回は豆情報です。

memtest86+というプログラムですが、これはとても便利なもので、PC/AT
互換機のメモリが壊れていないかどうかチェックすることができます。
memtest86+は、フロッピーからブートしたり、ネットブートしたりする
ことが出来るので、PC/AT互換機のメモリテストには、大変重宝します。

今回は以上です。

2008年10月25日土曜日

1U2ノードサーバのご紹介

こんにちは、かわらばん編集長の安藤です。この頃、めっきり涼しくなりましたね。昭和記念公園のコスモスも見ごろを迎え、秋本番です。

さて今回は、製品のご紹介をしたいと思います。インテルのサーバで、モデル名はSR1520MLです。この製品は、
「ラックスペースがいっぱいで、これ以上増やせない!」
「データセンター等、電源容量でお困りでは?」
「とにかく、計算処理が早いものがほしい!」
などのご要求にお答えできると思います。

なかなか優れもののこのサーバの最大の特徴は、2台のサーバが一つの筐体にはいっていることです。つまり、サーバボードが2枚、1Uユニットに収納されているのです。したがって、それぞれが完全に独立して動作させることができます。この方式により様々な応用が可能になります。

もう一つの特徴は、「安いけど速い」ということでしょうか。ストレージは小さいですが、高速演算処理が必要なユーザーの方にはご満足いただけるとおもいます。また、ノードあたりの消費電流が少ないため、熱的に問題になることも少ないでしょう。特に、ラックに複数設置する場合は特に有利になります。

 まず概略スペックですが、
 ・最速のCPUを載せられる
 ・メモリは8Gまで搭載可能
 ・2.5インチHDDを2個
 ・オンボードIPMI

 ・USBはノードあたり、3ポート(前1ポート、後2ポート)+筐体内に1ポート

 メリットとしては、
 ・2ソケットサーバと異なり、別々のCPUを搭載可能
 ・ノードあたりの消費電力が少ない(今までのものと比べて約30%減)
 ・ラックスペースが少なくてすむ
 ・安価(同一スペックと比較し約10万円安い)

このモデルの消費電流を測定したレポートがありますので、こちらをご参照下さい。
また、詳細について詳しくお知りになりたい方はこちらまでお気軽にご連絡下さい。


今後も最新情報や商品紹介などの情報を発信していきますので、どうぞよろしくお願いいたします。

2008年7月21日月曜日

IPMIでコスト削減

こんにちは、かわらばん編集長の安藤です。この頃はすっかり秋めいてきましたね。食欲の秋、読書の秋と、この季節は何をするのにもいい季節ですね。
今年の秋は、読書の秋と決めて、自分の専門外である様々な分野の本を読んで行きたいと思っています。皆さんは、どのような秋を過ごしていますか?

さて、今回はIPMIのお話をしたいと思います。IPMIってご存じですか?
これはサーバーの状態の監視やリモート制御を行うことができる標準インターフェース仕様のことです。

プロセッサーやOS、BIOSには依存しないので、パワーOFF状態からでもシステムを制御できる優れものです。したがって、遠隔操作によりサーバーの電源をON/OFFしたり起動時のコンソール画面を見たりすることができるので、データーセンター等に設置した遠隔地にあるサーバーにトラブルが発生したときは非常に便利な機能です。また、コンソールの操作によりBIOSの設定変更や、温度・電圧などの状態を監視することもできます。

今回はSupermicro X7SBiにIPMIカードを取り付けたときの、電源操作やコンソール操作について調べたので、それについて報告いたします。

IPMIの設定手順は次のようになります。
  • IPMIカード設定プログラムの起動
  • IPアドレスの設定
  • Console Redirectionの設定

【IPMIカード設定プログラムの起動】
IPMIを使用するには、ファームウェアの更新とIPMIカードへのIPアドレスの設定を行う必要があります。これらの設定を行うには、更新用のプログラムを実行します。
通常は、IPMIカードに添付されているドライバーCDからサーバーをブートすることでファームウェアの更新をします。別の方法として、ファームウェアの更新用のフロッピーを作成し、そこからブートすることもできます。このユーティリティはWindowsのみ利用できます。(この方法についての詳細はレポートhttp://www.clustcom.com/content/view/137/32/をご覧下さい)

【ファームの更新】
CDかフロッピーでブートすると、すぐにファームの更新が始まります。この間は操作の必要がなく、すべて自動で行われます。更新が完了すると。DOSのプロンプト画面に移行します。

【IPアドレスの設定】
IPMIを利用するためには、IPMIカード自体にIPアドレス等の設定をする必要があります。IPアドレスの設定は、ファーム更新後のプロンプトから「ipmicfg」というプログラムを利用して設定するこができます。方法については色々ありますので、レポートを参照してください。

【Console Redirectionの設定】
IPMIでコンソールを操作するには、BIOSでシリアルコンソールの設定が必要になります。

以上の設定を行うことにより、次のようなIPMIの利用が可能になります。

  • 電源操作
       再起動、電源を入れること、電源を切ること。
  • センサーによる監視
       サーバーに内蔵されている各種センサーによる情報を取得できます。
       (サーバーの温度、電圧、ファンの回転数等)
  • コンソールの操作
       OSが軌道する前の段階からコンソールを操作することができます。
       つまり、BIOSの画面やブートメニューなどを遠隔操作することができます。

以上のように、IPMIを導入することにより、再起動やBIOSの設定などを遠隔操作できますので、サーバーにトラブルが発生しても、設置されている現地での対応をする必要がないので、サービスの信頼性向上や余分なコストを抑えることが可能になります。

通信はすべてIPの上で行うので、IPのネットワークさえあれば、 ほかに特別な通信機器を導入する必要はありません。 また、複雑な設定も必要ないので、対応マザーボードさえあれば容易に導入することができるでしょう。

詳細について詳しくお知りになりたい方はこちらまでお気軽にご連絡下さい。

今後も最新情報や商品紹介などの情報を発信していきますので、どうぞよろしくお願いいたします。


2008年5月18日日曜日

LVS負荷分散ソリューションについて

こんにちは、かわらばん編集長の安藤です。関東地方もとうとう梅雨に入りましたね。去年と比べて20日も早いということです。毎年やってくる季節とは言え、私にはちょっと苦手です。

さて今回は、LVS負荷分散ソリューションについてお話したいと思います。これは、Webサーバを管理されているお客様には朗報になると思います。

「時々Webページが見られない、応答が遅い、ページの表示に時間がかかり過ぎる。」などの苦情がお客様から届いていませんか?
「処理スピードを上げようとして複数のサーバを用意したけれど、どのように処理を分散したら良いかわからない」とお感じではありませんか?

1台のサーバを使用しているときは関係ないのですが、処理速度を早くしようとして、サーバを増やしていっても、処理うまく分散できなければ意味がありません。

これを解決する手段としては、ロードバランサがあります。この技術は、単に負荷を分散し処理スピードを上げるだけではなく、構成の変更を外部に隠したまま、Webサーバを増やしたり、減らしたりすることもできます。つまり、Webサーバのどれかに障害が生じた場合でも、速やかにそのサーバを自動的に切り離すことが出来るのです。

当社では、この技術を活用したLVS(Linux Virtual Server)によるLVS負荷分散システムの設計及び構築をご提供させていただいております。

特長としては

  • http等のリクエストを自動的に負荷分散
  • TCP、UDP等のプロトコル、ポート番号に応じて、パケットを実サーバに振り分ける
  • ファイアーウォール(パケットフィルター)機能がある
  • どのリアルサーバに振り分けるかについて、複数のスケジューリングポリシーから選択可能
などとなっています。

LVSによる負荷分散の構成としては、いろいろ考えられますが、ここでは下記の2種類を紹介します。

【構成例 1】
  • LVSを導入してWebサーバを冗長化する
この構成では、複数あるWebサーバのどれかが障害をおこしても、自動的にそのサーバを切り離すことが出来、さらに障害が生じたことを外部から知られることもありません。
リアルサーバの稼働状態を周期的に監視し、異常があれば自動的に切り離しを行います。また、回復すれば自動的に参加させます。

【構成例 2】
  • LVSを冗長化する
この構成は、LVSを冗長化するものです。つまり、アクティブであるロードバランサとスタンバイ状態のロードバランサを持ち、アクティブロードバランサに障害が生じた場合、スタンバイロードバランサに切り替えるものです。

【LVS冗長化構成の特長】
  • L4ロードバランサ
  • 振り分けアルゴリズム(重み付ラウンドロビン、重み付最小コネクション等が指定可)
  • パーシスタンス機能
  • ヘルスチェック
  • フェイルオーバー
  • keepalived LVSと組み合わせて使うロードバランサの冗長性確保用デーモン
  • vrrp(Virtual Router Redundancy Protocol)ルータの多重化

【オープンソース(OSS)化構成によるメリット】
  • TCOの削減
  • 透明で自由度が高い
  • 経験豊富なエンジニアによるサポート体制
今回は、とても効果的な負荷分散が可能になるLVS負荷分散システムのお話でした。この内容についての詳細はこちらからお気軽にお問い合わせ下さい。

今後も最新情報や商品紹介などの情報を発信していきますので、どうぞよろしくお願いいたします。

Xeon3350 クアッドづくしサーバ

こんにちは、かわらばん編集長の安藤です。5月に入ってから、寒くなったり暑くなったりしています。体調管理が大切な時季ですので、どうぞお気を付けください。

さて今回は、新発売の45nm版クアッドコアシングルXeonプロセッサ搭載のサーバをご紹介したいと思います! このサーバは、人気の高いIntel Xeon 3350クアッドコアプロセッサ、または同等スペックのIntel Core 2 クアッドプロセッサQ9450を1個搭載しており、低消費電力でありながらハイパフォーマンスなモデルです。

Xeon 3350/Core 2 Quad Q9450は、優れたパフォーマンスに加え電力効率に優れたプロセッサです。45nmプロセス技術を採用していて、従来の65nmプロセスのCore 2 Quadシリーズと比べ、FSBが1066MHzから1333MHz向上、L2キャッシュが8MByte(4MByte×2)から 12MByte(6MByte×2)へ増強されいます。巷では、このプロセッサは品薄状態になっているようです。

このモデルは、Intel SATAコントローラに直結しているフロントHDDベイが4つあり、ディスク交換も簡単にできます。また、IntelギガビットNIC4ポートをボード上に搭載していますので、ボンディングで冗長化したり、ルーターとして用いたり、いろいろと応用が利きます。NICを4ポート、オンボードに内蔵しているサーバは、他にはありません!(当社調べ)。


特長としては
  • ギガビットネットワーク 4個
  • 最新のクアッドコアプロセッサ ペンギンが4匹(Linuxの場合)
  • メモリ最大8GB(2GBモジュール ×4スロット)
  • フロントHDDベイ4つ
となっており、まーさに、クアッドづくし

オプションとしてSATA HDD、IPMIカード、3ware RAIDカード他をご用意しております。SATA HDDがオプションになっているのは、お客様の好きなドライブを組み合わせて使って頂きたいからです。もちろん、弊社推奨のドライブも用意しております。3ware RAIDカードを追加すればデータベースサーバ、ファイルサーバとしても利用が可能です。

主要スペック
  • 型番       EZ1UX3350-4G
  • CPU       Intel Xeon 3350 Quad coreプロセッサ(Yorkfield, 2.66GHz, L2 Cache=12M, FSB1333MHz, Intel 64, VT, TDP=95W)
  • チップセット   IntelR 3200 + ICH9R Chipset
  • メモリ      2GB DDR2 800MHz Unbuffered ECC ×2
  • マザーボード  Supermicro X7SBi-LN4
  • ネットワーク   ギガビットイーサネット計4ポート Intel 82573V x1 , 82573L x3
  • グラフィック   ATI ES1000 32MB Graphics
  • HDD       Intel ICH9R SATA コントローラ, フロントHDDベイ4個
  • 光学ドライブ  無し
  • 電源       100 - 240V, 50 - 60Hz, 300W PFC 電源
  • 付属品      ラックマウント用スライドレール
  • 遠隔管理    SATA HDD、IPMIカード(遠隔管理用)、3ware RAIDカード他
この他にも、クロック周波数2.83GHzのXeon 3360プロセッサ搭載モデルEZ1UX3360-4Gもご用意しておりますので、ご要望に応じた選択が可能です。

今回は、新商品のご紹介をいたしました。製品の詳細についてはこちらからお気軽にお問い合わせ下さい。

今後も最新情報や商品紹介などの情報を発信していきますので、どうぞよろしくお願いいたします。

2008年5月12日月曜日

メモリーエラー。ECCは本当に機能しているのか?

こんにちは、かわらばん編集長の安藤です。ゴールデンウィークも終わりましたが、どのようにお過ごしになりましたか?今、東京国立近代美術館では「東山魁夷展」が開催されていますね。唐招提寺の襖を飾る荒海や水墨画の風景は圧巻です。

さて今回はIntel i3000チップセットのECC機能とLinuxでのエラー検出に関するお話です。

メモリに記憶されたデータというのは、何らかの原因によってエラーを起こすことがあります。この原因としては、メモリモジュールの故障や宇宙線によるビット反転(ソフトエラー)などが考えられます。

そこで特に信頼性が要求されるサーバなどにはECCメモリが採用されています。このECCメモリとは、本来のデータに誤り訂正用データを付加し冗長性を持たせることによって、1ビット誤った時に訂正を行い、2ビット以上誤った時には修正はできないが、誤りが発生したことを検出してくれる頼もしいメモリです。

Linuxでは2.6.16カーネルより、EDAC(Error Detection and Correction)機能により、このようなECCイベントをOSで検知できるようになりました。すなわち、システムログにECCイベントが記録されるので、障害時の原因切り分けやメモリの故障判別が非常に容易に行えます。

ECCメモリとEDACの組合せは、システムの信頼性を向上させるため大変有効な技術なのですが、Intel i3000のチップセットで検証したところ、これが機能せず、エラーを検知できていないことがわかりました。そこで当社では、EDACの不具合を修正しメモリエラーを検知できるようにしました。修正パッチの内容等詳しいことについてはこちらをご覧下さい。

このパッチについては、EDACプロジェクトのメーリングリストに投稿しましたが、最近リリースされた、linux-2.6.25バニラカーネル自体にも取り込まれることになりました。これによって、ECCエラーイベントをOS上で正常に検知することができるようになります。

サーバ等には必須のECCメモリですが、これで本来の機能を確保できるようになりました。ECCメモリを用いると、エラーの訂正や検出を行うためデータの信頼性が向上します。またEDAC機能により、ECCイベントをOSで検知し故障メモリの早期発見が可能となります。これによってメモリ交換の要・不要を容易に判断できますので、システム全体の信頼性を向上させることができます。

今回はメモリに関する技術的内容についてのお話でした。ご不明な点はこちらからお気軽にお問い合わせ下さい。

今後も最新情報や商品紹介などの情報を発信していきますので、どうぞよろしくお願いいたします。

2008年4月20日日曜日

ペンギンの大群、おもろー!な8コアサーバ

こんにちは、かわらばん編集長の安藤です。4月も半ばを過ぎ、だいぶ陽気が良くなってきました。ゴールデンウィークも間近ですが、どんな予定を立てていますか?私は久しぶりに美術館巡りをしようと思っています。

さて今回は新製品のお知らせです。

今回ご紹介する1UサーバEZ1UL5420は、Intelの低電圧版クアッドコアXeonを2個搭載しており、低消費電力でありながら、非常にハイパフォーマンスなサーバです。

クアッドコアXeonを2個搭載したサーバは従来より販売可能でしたが、消費電力が高く、専用のメモリモジュールの調達コストも高く、商品化を躊躇しておりました。

今年になってメモリ価格が下落し、また、低電圧版のクアッドコアXeon発売されたこともあり、お客様のためになると判断し、商品化に踏み切りました。

1UサーバEZ1UL5420の特長は次の通りです。
  • ペンギンが8匹(Linuxの場合)
  • 低電圧Xeon採用により、CPU当たりの消費電力50W
  • 最大搭載可能メモリ、4GByte x 4 = 16GByte
  • SATA HDD 4台搭載可能
  • 当社従来品(615BT-X5148DP2G)に比べ、CPU性能、メモリ容量も向上しているのに、約10万円安い
以上の様に、とてもお買い得なサーバですが、
今回は、な、なんと、

IPMIカードもつけてしまいます!

IPMIカードがあると、外部からデータセンターに設置したサーバの電源をON/OFFすることができたり、外部からBIOSの設定を変更したりすることができるようになります。(freeipmi等を使うと良いでしょう。)

たくさんの1Uサーバを自由自在に操るエキスパートのみなさんには、欠かせないツールですね!

主要スペック
  • 型番       EZ1UL5420
  • CPU       Intel Xeon L5420 Quad coreプロセッサ ×2(2.5GHz, Cache=12M, FSB1333MHz, 50W, Intel64, VT)
  • チップセット   Intel 5000V (Blackford VS) MCH + ESB2
  • メモリ      667MHz FB-DIMM ECC DDR2
  • マザーボード   Supermicro X7DVL-i
  • ネットワーク   Intel 82563EB デュアルポート ギガビット イーサネット
  • グラフィック   XGI Volari™ Z7
  • HDD        Intel ESB2 SATA 3.0Gbpsコントローラー, フロント4HDDベイ
  • 光学ドライブ   無し
  • 電源       100 - 240V,50-60Hz,520W PFC 電源
  • 付属品      ラックマウント用スライドレール
  • 遠隔管理     IPMIカードAOC-SIMLC-HTC付属

今回は、新商品のご紹介をいたしました。製品の詳細についてはこちらからお気軽にお問い合わせ下さい。

今後も最新情報や商品紹介などの情報を発信していきますので、どうぞよろしくお願いいたします。


2008年3月31日月曜日

エコでグリーンなあなたは、電流測っておきましょう!

かわらばんをご覧頂きありがとうございます。かわらばんでは当社で扱っている商品の説明や最新情報、技術レポートなど紹介していきたいと思いますので、どうぞよろしくお願いいたします。

桜の花もあっという間に満開になり、今まさに見頃といった感じですね。そういう私は、昨日近所の公園に花見にでも行こうと計画していたのですが、あいにくの雨と、肌寒さとのせいで、自宅に引きこもっていました。テレビでは、まだ今週末でも間に合うと言っていたので、楽しみにしています!

さて、今回のかわらばんではCPUの処理性能と消費電力について取り上げようと思います。

一般にCPUのクロック周波数が高くなれば処理性能も高くなりますが、それに伴って消費電力も増加してしまいます。しかし、これは同一世代のCPUに限った話であって、設計の異なるCPU同士を比較していくとおもしろいことがわかってきます。

少し古いデータですが、下表にlinuxカーネルコンパイルの所用時間とサーバの電流消費の関係を示します。CPU世代によって特性がだいぶ異なっているということがわかります。最近のCore2Duo世代のCPUですとちょっと前のPentiumDに比べて、処理スピードが1.5倍になっているにもかかわらず、電流消費が2/3程度になっています。

また、Xeon3.0EGz HT デュアル CPUと比べるとXeon3060 DualCore シングル CPUは、電流消費が半分以下で、約1.3倍高速でした。最新のCPUはさすがです。CPUの世代間でこんなにも特性が違うものなのです。詳しくは当社ホームページをご覧下さい。当社では、Intel社の最新のCoreマイクロアーキテクチャのXeon(デュアルコア、クアッドコア)の1Uサーバに注力しております。

また、最近のCPUにはクロック周波数(実際の動作周波数)を動的に変化させ、消費電力をセーブすることができるEIST(Enhanced Intel SpeedStep Technology)機能が備わっているものもあります。これを利用すれば、負荷状況に応じてクロック周波数を変化させることにより、消費電力を抑えることが可能になります。弊社では、この機能をLinuxサーバで利用できるよう、調査検討も行っています。これにより、環境にやさしい、データセンター運用が可能になると期待しています。

以上、今回はCPUの処理性能と消費電力について取り上げました。今後、最新の情報や商品紹介などの情報を発信していきますのでどうぞよろしくお願いいたします。