2011年夏、はてなは自社サーバー群の保守運用を、自社管理から「さくらインターネット」への業務委託に切り替えました。はてなが自作サーバーの自主運用から大規模データセンターへのアウトソースに切り替えた理由や、さくらインターネットが2011年11月にサービス開始を予定している「さくらのクラウド」について、さくらインターネットの田中邦裕社長、はてな最高技術責任者(CTO)の田中慎司(id:stanaka)、はてなエンジニアの吉田晃典(id:marqs)が語り合いました。
(※この記事は、さくらインターネットの提供によるPR記事です)
■ はてな、脱「自作サーバー」宣言の理由
stanaka この度はてなは、さくらインターネットさんにサーバーの保守運用を委託しました。2010年の夏から動き始めて、2011年夏前にはフルスペックでの保守運用委託をお願いできるようになりました。
さくら田中 はてなは自社でインフラを運用する印象が強かったので、実際に契約が決まったときは、本当にびっくりしました(笑)。ただ、技術トレンドという面で考えると、納得感がありましたね。背景には、自作サーバーと自社による運用が有利ではなくなってきた、という事情があると思います。Webサービスの大手会社が運用を外部に委託するケースは増えてきました。
stanaka 2010年の頭ごろ、自作サーバーの方が使いにくくなり、ベンダー製サーバーの方が使いやすくなる、という逆転があったと考えています。
以前は、自作サーバーの方に優位性がありました。2009年に、自作サーバーについて語る機会があったのですが、当時はサーバー向けパーツの価格や性能を考えると、相対的に自作する方が安くついたんです。
ただ、現時点ではベンダーが盛り返していて、Webサービス事業者にとって使いやすいスペックを安く提供するようになりました。一方、自作サーバー向けのPCパーツはニッチ層向けで、使いやすいパーツが減ってきました。
さくら田中 実は、さくらインターネットの内部でも、自社開発のオリジナル(自作)サーバーを作るのはやめようか、という意見が出ています。弊社でサーバー開発していた人間が「もうオリジナルサーバーはいらないんじゃないか」と言い始めているくらいで。
stanaka もう自作の理由がないですね。はてなの場合、以前は自作サーバーで細かな「やりくり」をしていました。それが、今は1ラックまるまる詰める形の調達をかける場合が多くなりました。スケールした結果、昔に比べて「やりくり感」が減って、運用エンジニアの人的リソースの方が貴重になりました。
さくらインターネットさんのデータセンターは、わたしたちに比べると1ケタ上の規模ですけれども、そこでもベンダー製サーバーが使いやすくなってきたのですね。
さくら田中 我々の場合、以前はサーバー1台をまるごと貸し出す専用サーバーがメインで、自作サーバーをいかにたくさん1ラックに詰めるかが勝負でした。それが、今は仮想化して1インスタンス、1コア単位でお貸しする時代になり、1ラックで何コア取れるかが重要になりました。
今では、ATOM搭載の専用サーバーが月額7800円ですが、仮想サーバーのさくらVPSは月額980円。VPSの方が速くて安い時代になりました。今後、専用サーバーが満たすべきニーズは、VPSではカバーすることが難しい領域に絞られていくでしょう。大容量のHDDやSSDを何台も並べたり、PCIe-SSD▼を搭載するなりといった特殊なスペックが欲しい場合や、パフォーマンスの安定性という意味合いで物理占有が必要だったり、システム要件的にリソース共有が許されないケースなどです。
さらに、規模を生かしてサプライチェーン全体を最適化することで、調達コストを下げて、しかも迅速な調達が可能になります。わたしたちは、メーカー製サーバーを月に何百台と買っていますので、調達コストも安くなっていく。当然、お客さまにもぐっと安い価格で提供していきたい。将来的には、メーカーと協力して当社データセンターのすぐ隣に倉庫を設置してもらい、例えば100台は常にサーバーの在庫を置いておくようにして、必要になれば即座に100台設置できます、といったことが可能になるようにしたいですね。
ワンポイント用語集
PCIe-SSD - 「PCIe」は、「PCI Express」というI/Oシリアルインターフェースのこと。「SSD」は、HDDに比べて読み出し性能が高いという特徴を持つ「ソリッドステートドライブ(Solid State Drive)」のこと。「PCIe-SSD」とは、PCI Expressバスで直結する形態のSSDのこと。 ▲
■ PCIe-SSDがクラウドサービスで利用可能に!
stanaka 開発中のIaaS▼型クラウドは、いつから開始なんですか?
さくら田中 だいぶ開発が進んできていて、9月上旬からベータテストを始める予定です。「何の変哲もないIaaSを圧倒的なコストパフォーマンスで提供する」をコンセプトに、価格と性能にこだわったサービスを実現していきます。もちろん、APIなどの機能やIaaSらしい拡張性も重要な要素です。正式サービスの開始時期は、11月ごろを予定しています。
stanaka PCIe-SSDについての取り組みを進めているということですが、要望が多かったのでしょうか。
さくらインターネット 田中邦裕社長
さくら田中 興味を持たれている企業が増えていますね。すでにPCIe-SSD、とりわけFusion-io▼を採用したWebサービス企業もあります。Fusion-ioのすごいところは、サーバーのスケールアップ▼の選択肢を提供してくれることです。
特に、データベースサーバーほどスケールアップが重要なものはありません。Fusion-ioを使うことで、それまで例えば100台に分散していたデータベースサーバーを、マスターとスレーブの2台に集約できる場合が出てきました。
marqs Fusion-ioのデバイスは値段が張りますが、お金を積めばスケールアップできるようになりました。ここがPCIe-SSDの良い点です。従来はI/Oがボトルネックでしたが、PCIe-SSDの採用によって解消されるわけですね。
stanaka さくらのPCIe-SSD搭載クラウドは出ますか?
さくら田中 出したいです!
stanaka、marqs おおー!(歓声)
さくら田中 PCIe-SSDですが、これを利用したサービスの提供形態としては、複数のオプションで使えるように考えています。
まずローカルでの利用。1つは、クラウド用のホストサーバーに装着して、仮想サーバーから直接使うやり方です。ホストを占有するか、他のユーザーと共有するか、という選択肢はまた別にあります。占有の場合は、それなりに高額になると思います。
次にネットワーク経由での利用があります。PCIe-SSDなどの高速ストレージを使ったSAN▼にInfiniBand▼で接続し、その帯域を各サーバーが切り抜いて使う。InfiniBandの実効スループットは25Gbpsほど出ていますので、ネットワーク経由でも十分なパフォーマンスを提供できると考えています。
こういう何段階かの形で、お客さまがPCIe-SSDの恩恵を受けられるようにします。とにかく速くなります。ただし、PCIe-SSDのパフォーマンスを最大限発揮させようと思ったら、やはり物理サーバーで使うに限ります。仮想環境で使うと、何割かは性能が犠牲になってしまいますからね。スケールアップという意味では、仮想から物理への回帰も進むと見ています。
ワンポイント用語集
IaaS - ITシステムのインフラ部分(仮想マシンやネットワークなど)をインターネット経由で利用するサービスモデル。「Infrastructure as a Service」の略。 ▲
Fusion-io - 米Fusion-io社が開発している、NAND型フラッシュメモリーをPCI-Expressバスで直結する形態の高速ストレージ・デバイス製品の総称。 ▲
スケールアップ - サーバー1台あたりの性能を高める手法。ちなみに、複数サーバーへ分散して性能を高める手法は「スケールアウト」と呼ぶ。 ▲
SAN - ストレージエリアネットワーク(Storage Area Network)のこと。ストレージとサーバーを結ぶ高速ネットワーク。 ▲
InfiniBand - スーパーコンピューター分野で利用実績がある高速インターコネクト。 ▲
■ 壊れるまでは安心できない
さくら田中 ただ、PCIe-SSDは最近登場したものなので、基幹データベースをそういうデバイスに置いていいのか、という議論はあるかもしれません。PCIe-SSDは「価格は高いけど信頼性はある」と言われていますが。
stanaka PCIe-SSDの信頼性は、さすがにまだ分からない部分が多いので、まずデータベースを再構築可能なところで試します。1回壊れるまで、安心できません(笑)。SSDは、そろそろ壊れ始めてきたので、だんだん扱い方が分かってきました。
さくら田中 壊れるときに、“きれいに壊れるかどうか”は大事ですね。ちゃんと壊れているよ、とエラーを出してくれるかどうか。
marqs Web業界では、PCIe-SSD(Fusion-io)でデータベースサーバーを集約するのがトレンドになっています。活用事例の講演などでは、今のところ問題ないという報告が出ていますね。
はてな 田中慎司(id:stanaka)
stanaka Fusion-ioは高価で、データベースサーバーのようにピンポイントで使うものですが、今は品薄でサービス事業者の間で取り合いになっているという話もあります。
marqs SSDは価格が下がってきているので、並列に並べて性能を出すというやり方もあると思います。はてなの経験では、SSDはHDDと比べて壊れにくい。そのため最近は運用ルールが変わって、大容量ストレージ以外はSSDにしています。SSDのベンダーは選んだ方がいいですが。
さくら田中 SSDオプションもPCIe-SSDオプションも、今年中には提供開始したいですね。ioDrive▼に至っては、デバイスを買ってしまっていますから(笑)。
ワンポイント用語集
ioDrive - 米Fusion-io社のストレージ製品。 ▲
■ クラウドとハウジング、両極端を推進する
さくら田中 今後、事業者向けに提供していくサービスの種類は、大きく分けて「クラウド」「専用サーバ」「マネージドハウジング」の3つになっていくと考えています。
「クラウド」は、CPU、ネットワーク、ディスクをすべて仮想化したリソースで提供します。
「専用サーバ」は、サーバーは物理的に見えていますが、ネットワークの部分をVLANの形で仮想化して提供します。
「マネージドハウジング」は、CPU、ネットワーク、ディスクのすべてが物理的に見えていて把握できます。アクセスがラックをまたいでいるとRTT▼がどれだけ遅れる、といった部分まで配慮した設計と運用ができます。
わたしたちのお客さまは今後、二極化していくのではないかと考えています。1つの方向が、はてなさんにお使いいただいているマネージドハウジングです。オーダーメイドで、性能、価格、安定性の最適解を追求する形です。もう1つの方向がクラウドです。レディメイドで、価格面でエッジを効かせて、その代わり性能をやや落とす形です。これらを適材適所で組み合わせる形になっていくと思います。
仮想化によるクラウドにも、物理サーバーやネットワークの細かい部分まで把握できるマネージドハウジングにも、それぞれ適切な使いどころがあると思います。MySQLを載せたデータベースサーバーなどでは、仮想化したクラウドよりも物理サーバーの方がぎりぎりまでスペックを使い切れます。Fusion-io搭載で高速化したサーバーを性能の上限まで使うような特殊な使い方もできます。
stanaka 基幹に関わるところについては、わたしたちは仮想化していますが、その組み合わせに注意を払っています。
特に重要なのは、複数のサーバーから参照されるデータベースです。例えばユーザーDBを載せたサーバーですね。ユーザーDBが遅くなれば、それを参照するすべてのサービスに影響が出てしまいます。だから、この部分は堅牢性、性能、安定性を追求しなければいけません。
はてな 吉田晃典(id:marqs)
marqs 仮想サーバーでも、(同じ物理サーバーに)同居する相手を選べるか、選べないかが大きいですね。純粋なパブリッククラウドの場合、少なくとも今の段階ではどの仮想サーバーの組み合わせを1つの物理サーバーに載せるかを選べません。例えば、各サービスのマスターDBは、同居させたくないですね。
さくら田中 先ほどちょっとお話ししましたが、さくらのサービスとしてクラウドの占有プランも検討しています。1台のホストをまるごと使えて、他のユーザーの仮想マシンが入ってこない形です。
stanaka、marqs いいですね!
ワンポイント用語集
RTT - ラウンドトリップタイム(Round Trip Time)のこと。データを送ってから、確認応答(ACK)が返ってくるまでにかかる時間。 ▲
■ クラウド直結のハウジングも提供
さくら田中 データセンターは、コストパフォーマンスも大事です。さくらインターネットの場合、東京にサーバーを置きつつ、現在建造中の石狩データセンターも併用する形を取れるようになると考えています。石狩は1ラックあたりの料金がより安くなります。それに1ラック8KVAの電源容量、1トンの荷重まで使えます。一方、東京は回線が安いし、RTTが短い。そこで画像キャッシュなどは東京に置いて、CPU負荷が大きな処理を担当するサーバーは石狩に置く、みたいな使い方ができます。
stanaka 回線は東京の方が安くなるんですか?
さくら田中 石狩データセンターでのサービス料金はまだ決まっていませんが、弊社側の回線コストだけでいえば、石狩よりも東京の方が安いといえます。10Mや100Mといった帯域であれば全体の中でコスト差を吸収できると思いますが、1G、10Gという話になると、東京の方が安く提供できると考えています。
石狩データセンターに関しては、クラウドとマネージドハウジングのラックとをネットワークで直結する構成を考えていて、実現を目指しています。間にスイッチが2~3個入るだけの構成です。
stanaka クラウドと直結できるのは魅力的だと思います。基幹サーバーや特殊なハードなどは、ハウジングの形態で運用したいですね。一方、アプリケーションやバッチ処理のようにサーバーの数がとにかく必要な部分をクラウドに任せることができれば、サーバー台数をフレキシブルに増減できます。その両者の間の回線が太い(広帯域)と、ハイブリッドにする意味が出てきます。
例えばmemcached▼を使う場合、1リクエストで100回程度のアクセスが発生します。ハウジングだと、遅延がμs台なので問題がないのですが、クラウドと直結する場合はどの程度になるのかが気になります。遅延が1msを切れるかどうかが、大きな分岐点になります。
さくら田中 遅延の話ですが、東京と石狩の間のRTTを下げるのは至難の業です。ただ、石狩データセンター内の話であれば、クラウドの真横に専用サーバやマネージドハウジングを置ける。専用の回線でつなぐこともできるので、理想的なハイブリッド構成が組めるでしょう。仮想が得意な分野は仮想にまかせ、物理が有利な部分は物理にやらせる。データセンターサービスをフルラインで提供する弊社だからこそ実現できる価値ですね。
stanaka 「さくらのクラウド」のサービス開始、楽しみです。今日はありがとうございました。
ワンポイント用語集
memcached - 米Danga Interactive社が開発した、分散型メモリキャッシュシステム。はてなやmixi、Facebookなど多くのWebサービス事業者が活用している。 ▲
■ さくらインターネット ロゴ入りMOLESKINE手帳をプレゼント!
※キャンペーンは終了しました。たくさんのご応募、ありがとうございました。
さくらインターネットのロゴが入ったMOLESKINE手帳を抽選で10名様にプレゼントします。
応募方法は、この記事をはてなブックマークに追加するだけ。詳しくは、下の応募要項をご覧ください。
応募要項
- 応募期間
- 2011年9月13日(火)から2011年9月26日(月)24時まで
- 賞品と当選人数
- さくらインターネット ロゴ入りMOLESKINE手帳(10名様)
- 応募方法
- この記事をはてなブックマークに追加
- ※プライベートモードでご利用の方は対象となりません
- 当選発表
- 厳正なる抽選の結果、当選された方は後日はてなブックマーク日記で発表いたします。
- 賞品発送
- 当選発表後、はてなよりメールをお送りし、送付先情報(送付先住所、受取人氏名、電話番号)をお聞きします
写真:小西武雄