ここから本文です

富士フイルムとメルカリSREが語る、「運用管理」という仕事の本当の価値と役割とは

2/6(火) 8:15配信

@IT

 @ITは「@IT運用管理セミナー~運用管理は『なくなる仕事』?」を2017年12月12日に開催した。このセミナーでは、クラウドや自動化の浸透を受け、「担当システムの安定運用という従来型のミッションをこなすだけでは、運用管理者としての存在価値を発揮できなくなるのではないか」という問題意識を基に、「生き残れる運用管理者」のマインドセット、スキルセットを明確化。どうすれば運用管理者として「ビジネスに寄与」できるのか、“求められ続ける”方法をさまざまな角度から紹介した。

これからの運用管理~ソフトウェアで定義、管理~(柴田氏の講演資料から引用)

●運用管理とは「“顧客”とのリレーションシップを深めること」に他ならない

 基調講演には、富士フイルム ホールディングス 経営企画部 IT企画グループ グループ長 兼 富士フイルム 経営企画本部 ICT戦略推進室 マネージャーの柴田英樹氏が登壇し、グループ、グローバルでエンドユーザーとの信頼関係を深め続けている経験と知見を基に、「運用管理という仕事」の本当の価値と役割について語った。

 「ICTが高度化しデジタル変革が加速する中で、これからのIT基盤には、テクノロジーで既存のビジネスプロセスを変革することが期待されている。そのためには、従来の“効率化のためのIT”から“差別化のためのIT”へのパラダイムシフトが必要になる」(柴田氏)

 こうしたデジタル変革の波を受け、IT部門に求められる役割も大きく変化している。例えば、経営層からは、ITを徹底活用した業務最適化が強く求められる。営業部門からは、デジタルマーケティングなど、ICTによる営業/マーケティングの強化が期待されている。そして、事業部門からは、ICTを活用したビジネスモデルの変革やワークスタイルの変革が要求されている。

 その中で、IT部門が直面している課題について柴田氏は、「対処すべき問題の複雑化・高度化」「量と質の両面での人材不足」「依然として強いコスト抑制圧力」の3つを挙げ、「これらの“三重苦”ともいえる課題を抱えているIT部門は、新たなイノベーションに取り組む余裕がなく、デジタル変革への期待に応えられていないのが現実」と訴える。

 では、こうした現状を打破するためには、どうすればよいのか。

 柴田氏は「IT部門とユーザー部門の相互理解を深め、IT戦略の企画・立案からIT基盤の構築、運用、活用まで、全てのフェーズで連携することが成功のカギになる。またIT部門としては、デジタル技術を駆使して新たな価値を創造していける力を持ったIT人材を育成することが重要になる。その上で、IT人材を適材適所に配置し、デジタル変革に対してスピード感を持って取り組んでいくことで、経営層にその存在意義をアピールできるはずだ」との考えを述べた。

 デジタル変革に向けて、IT人材が提供できる具体的な付加価値としては、「ビジネスとITの間に立ち、プロジェクトを円滑に推進」「ハイパーコンバージドインフラストラクチャ(HCI)やクラウドの進展に伴うブラックボックス化のリスク軽減、および障害発生時の迅速かつ柔軟な対応」「RPA(Robotics Process Automation)やAIを効果的にビジネス活用し、“人・紙”の前提から“機械”を前提にした業務プロセスへ改革すること」を挙げた。

 これからの運用管理については、「Software Defined Infrastructure(SDI)の適用によって、人手による運用業務やシステム構成作業が不要になり、全てがソフトウェアで定義、管理されるようになる」と指摘。同社では、これを見据えて、IT部門のさらなる変革に向けた取り組みを進めているという。

 「自社内のエンドユーザーとのコミュニケーションにCRMの考え方を導入し、バリューチェーンの側面からユーザー部門のサポートを行っている。常に意識しているのは、『自分たちが誰のために何をすべきか』ということ。IT部門の活動をエンドユーザーに向けて積極的に情報発信するとともに、日常的に提案活動を行っている。(ITツールなどを押し付けるのではなく)『ITを使いたい』『ITを使うことでストレスフリーになる』とエンドユーザーが自ら思ってくれる環境を作ることを通じて、“ユーザー部門から信頼されるIT部門”を目指している」(柴田氏)

 最後に柴田氏は、今後も運用管理者が求められ続けるためのポイントとして、「RPAやAIなどの高度ICT、クラウドの徹底活用」と「自社でやるべきことの切り分け」を挙げた。

 「定常作業や問い合わせ対応など、各種運用管理の標準化・自動化が大切。また『自社ではどこまで運用管理業務を行うべきか』(社内に残すべき業務、外出しすべき業務の)線引きを行い、業務の最適化・効率化を図ることも重要だ。これからのIT部門は(さまざまな手段を使って、「より本質的な業務に注力できる環境」を作ることで)、コスト最適化、グローバル展開、スピード経営など、ビジネスへの貢献度を上げることが重要になる」

●AIによる「レコメンド」で経験に頼らない自律型システム運用を実現

 セッション「AIによる『レコメンド』で経験に頼らない自律型システム運用を実現」では、野村総合研究所(NRI)クラウド運用ソリューション事業部 上級の寺井忠仁氏が、システム運用現場におけるAI活用のキーワードとして、機械学習による「レコメンド」と「ナレッジ」を挙げ、自律型のシステム運用に向けた取り組みを紹介した。

 寺井氏は、現在のシステム運用が抱える課題について、「管理対象や運用業務の増大によって、“人”による対応が限界に達しつつある。しかし、運用管理者の経験が伝承できないため、メインフレーム時代から続く古い運用から脱却できないのが現状だ」と指摘する。

 この状況を打破できるのが、経験に頼らない自律型のシステム運用だ。自律型システム運用のイメージとしては、まずは管理対象のシステムからアラートなどのイベントを収集し、高度フィルタリングによって“人”による対応が必要な情報のみを抽出。次にインシデントとしてエスカレーションされたチケットを、蓄積された過去のインシデントの中からレコメンド表示する。そして、レコメンドされたナレッジに対し、最適な対応手順をナビゲーションする。

 NRIでは、自律型システム運用に向けたITサービスマネジメント製品として「Senju Autonomous Service Manager(Senju/ASM)」を提案している。Senju/ASMでは、今までベテランの経験に頼っていた「判断」や「予兆検知」を、AIを活用してシステム化。インシデントの内容に応じて、必要なナレッジをレコメンドすることで、経験に頼らない自律型運用を実現する。

 「今後は、インシデント記録を機械学習にかけ、ナレッジのさらなる精度向上を図る。また、障害対応の75%でナレッジの利用を目指す」(寺井氏)

●運用管理チームの価値を高める! グローバル石油企業におけるツール導入の成功事例

 セッション「運用管理チームの価値を高める! グローバル石油企業におけるツール導入の成功事例」では、フェス 第2事業部 統括グループ チームリーダの二木光一氏が、グローバル石油企業であるアラムコ・アジア・ジャパンにおけるアジア太平洋地域向けヘルプデスクツールの導入事例とその成功を紹介。併せて、ビジネス貢献のための「ツール選定の方法」「ツール導入時の注意事項」「ツール導入後の効果」などを説明した。

 アラムコ・アジア・ジャパンは、サウジアラビアの国営企業であるSaudi Aramcoの日本法人で、アジア地域5エリアに14拠点を構えている。IT担当者は18人で、各拠点にサービスデスクを設置し、日本から変更管理を実施している。

 「アラムコ・アジア・ジャパンはITサービスマネジメント(ITSM)の課題を抱えていた。既にMicrosoft SharePointを使った簡易ツールを用意して運用を実施していたが、きちんとしたインシデント管理ツールはなく、電話やメールが多くIT部門の工数が増えていた。また、ツール導入を機に申請書類もペーパーレス化したいという要望もあった」(二木氏)

 これらの課題を改善すべく、フェスではゾーホージャパンのヘルプデスクツール「ManageEngine ServiceDesk Plus」の導入プロジェクトを推進。導入効果としては、標準プロセスを導入したことで業務の可視化を実現した。また、メールや電話が減ったことによりIT部門の負担を軽減。さらに、導入時には見送った問題管理やFAQ機能も、容易に運用を開始できたという。

 「ヘルプデスクツール選定・導入のポイントは、まずツール導入の目標と、導入後の目指すべき姿の全体像を明らかにし、共通認識化すること。そして、最低限の業務要件を定義してからツールを選定し、予算化して導入する流れが、成功プロジェクトへの近道になる」(二木氏)

●メルカリSREの流儀 運用を変えるのは怖い、でもそれをやめたら自分のキャリアも終わりかな

 特別講演に登壇したのは、メルカリ SRE(Site Reliability Engineer)の佐々木健一氏。「メルカリSREの流儀 運用を変えるのは怖い、でもそれをやめたら自分のキャリアも終わりかな」と題し、国内最大級のフリマアプリ「メルカリ」のインフラを支えるSREチームの働きや「どのような仕組みで自動化を実現しているのか」を明かすとともに、「一運用エンジニアとして、顧客、サービス、そして自らの成長とどう向き合っているのか」を語った。

 SREは、Googleの運用チームを率いるベン・トレイナー氏が提唱したといわれている。その役割は、企業内のさまざまなプロダクトやサービスを横断して、ソフトウェアエンジニアリングによりサイトやサービスの信頼性を向上させることにある。

 メルカリでは、2015年11月に、従来の「インフラチーム」から「SRE」へと組織体制を移行した。

 「メルカリでは、売る側と買う側としてお客さまがいるが、双方がいつでも快適かつ安全に利用できる、“信頼性の高い”サービスの実現がSREのミッションとなる。そのためには新規サービスの開発以外のエンジニアリングは全部やるというスタンスで活動している」(佐々木氏)

 現在、メルカリは日米英でサービスを展開。ダウンロード数は1億ダウンロード(日本+米国+英国)に達し、出品数は1日100万品以上、流通額(GMV)は月間100億円を突破している。今後もさらなるサービス成長が見込まれることから、SREチームも現在の11人からメンバーを増強し、組織体制を強化する計画だ。

 次に佐々木氏は、メルカリのシステムにおけるデプロイ自動化の取り組みについて紹介した。

 当初、メルカリのシステムは、1週間に1回の定期デプロイを行っていた。しかし、1回にデプロイする内容が増加するのに伴い、ロールバックかデプロイ継続かの判断が難しくなってきた。また、サービスが拡大し、パートナー企業と接続するケースも増えてきたため、定期デプロイでは対応しきれず、毎日のように緊急デプロイが発生する事態になっていた。

 SREチームでは、こうした状況を受け、サーバサイドデプロイの方法を再検討。GitHubのプルリクエストを基にした継続的デリバリーへの変革に取り組んだ。

 まずは、継続的デリバリーのプロセスを手動で運用しつつ、並行してSlack botを活用した自動デプロイの開発を進めた。当初は、1つのSlack botでデプロイ自動化を担う仕組みだったが、社内の開発手法がマイクロサービスベースへ移行するのに伴い、開発者ごとにデプロイ手段が増えることが予想された。そこで、Slack botによるデプロイbotと、GitHub botによるレビューbotに機能を分割。これによって、デプロイに柔軟性を持たせた自動化の仕組みを実現した。

 最後に佐々木氏は、一運用エンジニアの立場から運用管理者にアドバイスを送り講演を締めくくった。

 「急速に変化する環境の中で、立ち止まることは相対的には後退してしまうことになる。生き残るためには変化を続けることが重要だ。また、人との出会いを大切にし、人には親切にすること。そして、チャンスを逃さないよう、常にアンテナを立てておいてほしい。

 運用自動化は、自分の分身を作るつもりで取り組むのがポイント。運用が自動化された後には、別の新しいことや楽しいことにチャレンジできる。例えば、開発者が運用を行う時代では、アドバイザーなどとして運用者の経験や視点が生かせるはずだ。今後も自動化する対象は増え続けることは確実。運用者は常に自動化の開拓者でありたい」

最終更新:2/6(火) 8:15
@IT