ここから本文です

5分で絶対に分かるオブジェクトストレージ

7/3(月) 8:25配信

@IT

●1分――オブジェクトストレージが注目されている背景

 写真の容量が倍々の勢いで増えていくデジタルカメラ、ハイレゾなど年々高音質になっていく音声データ、8Kも実用化されつつある映像データ、かつてないほど大容量のデータが駆け巡っているインターネットなどなど、近年、データ量が爆発的に増加しています。これは皆さんも日々、肌で実感されているのではないでしょうか。

 企業ITの世界も同じです。販売データ、在庫データなど、業務取引に関わるデータが毎日生成される上、昨今は大量のセンサーデータを収集・蓄積・分析するIoTも進んでいます。ある調査によると、2013年までに作成されたデジタルデータの総量は実に4.4ゼタバイト。2年ごとに倍以上に増え、2020年には44ゼタバイトに達するといわれています(※)。

※出展:Data set to grow 10-fold by 2020 as internet of things takes off(Computer Weekly)

 増えたのは量だけではありません。10年前まではリレーショナルデータベースで管理できる構造化データが主流でした。しかし今や構造化データは20%にも満たず、テキスト、映像、音声のように構造定義を持たない非構造化データが主流になっています。そして何より重要なのは、単にデータの量と種類が増えたことではなく、こうしたデータを有効活用できるかどうかが、企業にとって勝敗を左右する大きなカギになっていることでしょう。

 ご存じの通り、昨今はデジタルトランスフォーメーションと呼ばれるトレンドが進展し、「大量データから新たなビジネス価値を発見する」「潜在・顕在ニーズを読み解きスピーディにアクションを起こす」ことが差別化のカギになるといわれています。いかに大量の構造化データ/非構造化データを活用しやすい環境を築くかというテーマは、企業にとっても皆さんにとっても、喫緊の課題となっているのです。

 こうした中、大量データの管理基盤として多くの企業の注目を集めているのがオブジェクトストレージです。では、オブジェクトストレージとはどのようなものなのでしょうか? 従来型のストレージでは、何が問題なのでしょう? 本稿では、大量データの管理基盤として注目を集めているオブジェクトストレージのメリットやユースケースについて、従来型ストレージと比較しながら、分かりやすく紹介していきます。

●2分――大量データ時代、従来型ストレージの問題点とは?

 では早速ですが、なぜ従来型のストレージでは大量データをうまく扱うことが難しいのでしょうか? 一言で言えば、“RAID(Redundant Arrays of Inexpensive Disks)頼りのアーキテクチャ”だからです。

 これまでのストレージは、複数のHDDを組み合わせて仮想的に1つのHDDとして認識させるRAID技術を使ったアーキテクチャが広く採用されてきました。目的は「万一ディスクが故障しても問題ないようデータの冗長性を担保する」ことです。また、「状況に応じて容量を拡大する」「処理性能を向上させる」という目的もあります。

 簡単におさらいすると、データを複数のディスクに書き込む「ストライピング」(RAID 0)、1つのディスクデータを別のディスクにコピーする「ミラーリング」(RAID 1)、「パリティ」と呼ばれる冗長コードを別のディスクにも保存することで故障時に記録データを修復可能にする「パリティ分散」(RAID 5)など、RAIDには重視する目的に応じた複数のパターンがあります。とはいえ、どの構成を組むにしても最大の目的は「HDDの信頼性を補う」ためです。

参考リンク:RAIDレベルを理解しよう(@IT)

 ただ、RAIDのレベルが上がったりHDDの数が増えたりすれば、それだけ故障の確率も上がります。HDDが数えられる程度で、扱うデータ量も限定的なら十分にHDDの信頼性を補うことができます。しかし大量のHDDを使ってペタバイト級のデータ量を扱うとなれば、そうはいきません。確率的に言って、エラーレートが無視できないレベルになってしまいます。

 また、データ保護処理の負荷が高まることから、障害が起きた際、RAIDを再構築する時間がいたずらに長くなる、再構築中に他のディスクも故障してデータが消えてしまうといったリスクも高まります。つまり、RAIDベースのアーキテクチャはペタバイト級のデータ管理には向かないのです。

 コスト面でも問題があります。従来型ストレージは、万一のリスクに備えてバックアップの仕組みを併用するのが一般的です。従って、大量データに対応するためには、メインのストレージとともに、バックアップ/ミラー用のストレージも追加しなければなりません。しかも業務要件を守るためには、ただストレージを追加すればよいわけではなく、バックアップシステムの容量、ネットワーク帯域幅など、「バックアップの仕組み」そのものを再設計する必要もあります。そのためには多大な時間とコストがかかることは言うまでもありません。つまりRAIDベースの従来型ストレージでは、データ量の増加に無駄なく柔軟に対応していくことも難しいのです。

●3分―オブジェクトストレージとは何か? ファイルストレージとどう違う?

 ではどうすれば、爆発的なデータ増大に対応できるストレージを実現できるのでしょうか? そこで注目されているのがオブジェクトストレージです。

 オブジェクトストレージとは、従来のようなファイル単位、プロック単位ではなく「オブジェクト」という単位でデータを管理するストレージです。と言っても分かりにくいので、広く使われているファイルストレージと比較して、そのメリットに注目しながら説明しましょう。

 両者の最も大きな違いはデータの格納方法です。ファイルストレージはフォルダを多用したディレクトリ構造でデータを格納します。これに対してオブジェクトストレージは階層構造を持たず、オブジェクトの保管場所となる空間に、フラットかつ何の依存関係もない状態で各オブジェクトを保管し、オブジェクトIDと呼ばれる個別識別子を付与して、このIDでデータを出し入れします。

 これは、以下の図のように駐車場に例えることができます。ファイルストレージは大型ショッピングモールの駐車場のイメージです。車を停めたエリアと位置を自分で覚えておく必要があるように、ファイルストレージはどの階層の、どのフォルダにデータを格納したか覚えておく必要があります。

 一方、オブジェクトストレージはIDだけでオブジェクトを出し入れしますから、格納場所を覚えておく必要はありません。これはタワー型の立体駐車場や、車を降りてボーイさんにキーを預ければあとはお任せのホテルの駐車場によく似ています。

 この「保管場所となる空間に、フラットかつ何の依存関係もなく、各オブジェクトを保管する」という特性が、データの取り出し、移動、複製を容易にしています。また、フラットで依存関係がない格納構造のため、データを分散して保管しやすいことも特徴です。

 一般に、オブジェクトストレージはノードを並列化した分散ストレージとして構成しますが、この仕組みにより、データ量が増えてもノードを追加するだけでスケールアウトすることができます。つまりアーキテクチャとして、大量データの保管に向いている上、データ量の増加にも柔軟に対応していくことができるのです。

 それだけではありません。サーバを介してデータを操作する従来型ストレージとは異なり、オブジェクトストレージは、REST(Representational State Transfer)APIと呼ばれるコマンド群を介してデータを操作します。つまりオブジェクトストレージを操作するためのサーバは必要ありませんし、サーバ特定のプラットフォームにロックインされることもありません。

 そしてREST APIはHTTP構文の中に直接書くことができますから、Web上のITサービスのような感覚で、Webインタフェースから直接データの読み書きができるのです。

●4分―オブジェクトストレージのメリット

 ではここで、あらためてオブジェクトストレージの特長を簡単に整理してみましょう。

○1.Webネイティブ

 サーバを介してではなく、REST API、HTTPプロトコルを介してデータを操作します。「ストレージにアクセスするために、そのストレージをマウントしたサーバにアクセスする」といった概念がないので、サーバ特定のプラットフォームにロックインされません。また、ネットワーク越しに使用することが前提である点でクラウドアプリケーションに最適であり、パブリック/プライベートクラウドが重視されている昨今のIT環境にぴったりといえます。

○2.分散化ストレージ

 オブジェクトストレージは、可用性を高めるために、同じデータを複数のノードに分散して書き込むことによって、ノードやラック、サイトといった単位での障害に耐えられる仕組みとなっています。ただ「同じデータを複数箇所に分散して書き込む」ということは、その分、データ容量が2倍、3倍と増えてしまうことになります。そこで昨今は、「イレージャーコーディング」(消失訂正符号技術)と呼ばれる手法によって、データ容量を抑えながら高度な安全性・信頼性を担保することもできるようになってきました。これがオブジェクトストレージの価格を引き下げると期待されています。

○3.無制限のスケールアウト

 オブジェクトストレージは、並列化したノードで構成したフラットなストレージ空間に、互いに依存関係のない個々のオブジェクトを分散して書き込む仕組みとしています。この仕組みによって、データ量が増えてもノードを追加するだけで、柔軟かつ無制限にスケールアウトすることができます。

○4.止まらないシステム

 ノードレベルでの停止がオブジェクトストレージ全体の運用には影響しない仕組みになっているため、リソースの拡張/縮小や、ファームウェアの更新/移転といった作業も、運用を止めることなく行うことができます(製品/サービスにより異なる)。

 こうして特長をまとめると、「クラウドファースト」「IoT/ビッグデータ時代」などと形容されることも多い昨今の企業ITの世界において、オブジェクトストレージが注目される理由も理解しやすいのではないでしょうか。

●オブジェクトストレージはどんなシーンにマッチするの?

 では最後に、オブジェクトストレージはどんなワークロードにマッチするのか、代表的な適用シーンを紹介します。

 オブジェクトストレージは、もともとインターネット経由のWebサービス分野で育った技術ということもあり、「情報の共有」を最も得意としています。例えば「ファイルコラボレーション」などと呼ばれている分野です。具体的には、組織の内外、業務や拠点、地域や国などをまたがって、関係者同士が必要なデータを、いつでも簡単に共有・活用できるようになるため、「よりスピーディにビジネスを行いたい」といったニーズに大きく寄与します。

 「安全・安価で大容量」という特長から、バックアップやアーカイブの基盤としても向いています。日々増大していくデータをコスト効率良く蓄積できる上、必要なデータをいつでも簡単に取り出せるわけですから、テープ保管によるバックアップ/アーカイブより、安くて便利なことは言うまでもないでしょう。

 特に昨今は、「ただ取っておくだけ」で死蔵させてしまいがちだったバックアップ/アーカイブデータを分析して、新たなビジネス価値を発見する取り組みも重視されています。その点、画像や音声、テキストのような非構造化データを含めて大量に蓄積しておき、必要なときに取り出せるという特長は、アナリティクス用途のストレージとしても大いに役立ちます。

 半面、現時点では「データへのアクセス頻度が高いシステム」には不向きとされていますが、その優れた可用性、安定性に着目して、災害対策やバックアップの仕組みなしで、低コストで止まらないシステムを作る試みも進みつつあるなど、オブジェクトストレージの適用パターンにはさまざまな可能性があります。

 データの爆発的増大とクラウド化が進む中、長年にわたって記憶媒体のテクノロジーに携わってきた筆者としては、今後の発展によっては高パフォーマンスが要求されるシステムでも活用されていくであろうことなど、オブジェクトストレージの可能性に大きな期待を寄せざるを得ません。皆さんも、ビジネス課題を解決する上では、あるいは大量データを価値に変える上では、どのような方法が最適なのか、数ある手段の1つとして、“自社におけるオブジェクトストレージの可能性”を探ってみてはいかがでしょうか。

●著者プロフィール

岡田 威徳(おかだ たけのり)
日本アイ・ビー・エム勤務
3880/3990磁気ディスクコントローラー、3380/90磁気ディスク装置など大型DASD装置、初期の3.5"HDDなど小型ハードディスク装置、世界初の3.5インチ光磁気ディスク装置、ストレージ関連チップ開発、NAS製品開発など、入社以来、ストレージの歴史とともに製造技術・品質管理や開発に携わる。
一方で、今では当たり前となった技術だが、IBMのストレージ製品から派生したコピー関連技術(FlashCopy/MetroMirror/GlobalMirrorなど)を生かしたオンラインバックアップや災害対策技術などのシステム設計・構築などにも精通し、現在はストレージやアーカイブ技術の最新形態ともいえるオブジェクトストレージの分野でテクニカルセールスとして活動中。

最終更新:7/3(月) 8:25
@IT