TOPICS最新情報

What’s SRE

2019.05.07

Googleが提唱するSRE (Site Reliability Engineering)

SRE (Site Reliability Engineering)とは

Webでサービスを提供する企業のエンジニアの間で注目されているコンセプトがSRE (Site Reliability Engineering)です。米グーグルが提唱した「SRE:サイト信頼性エンジニアリング」は、Webサービス系企業にとって顧客接点となるWebサイトの安定運用を支えるために重要な手法で、SRE担当チームには、アプリケーションの適切な稼動のための可用性の確保、レイテンシの低減、パフォーマンス管理、作業の効率化、変更管理、モニタリング、セキュリティ管理、障害対応、キャパシティ管理、コスト管理といった日常の運用管理業務を担当すると共に、ソフトウェア開発能力が求められます。

運用の自動化、障害対応、各種の管理などの個別項目は決して目新しいものでは無いにもかかわらず、SREが注目されるのは、「Webサイトの質と信頼性向上によって、企業のビジネス(サービス)を向上させる」という考え方です。企業の中核となるサービスが、Webやクラウドを経由して提供される比重が高まる中、Webサイトの安定運用がビジネスに与える影響は飛躍的に高まっています。SREは、単に運用現場の省力化、効率化、コスト削減を目的にしているのではありません。

Webサービスの可用性を高めるためには、アプリケーションの適切な稼動と改善、障害発生時の迅速な復旧などの「スピードと確実性」が求められます。人的ミスを排除し、Webサービスを迅速に提供するために、「Infrastructure as Code」(コードによるITインフラの管理)や、開発部門と運用部門が協働する「DevOps」というアプローチや、システム運用管理の新しい手法も注目されています。

注:Google社のブログ(英文)

国内におけるSREの事例 (メルカリ)

SREは米国だけの取り組みではありません。国内でも既にSREで結果を出している企業もあります。株式会社メルカリにおけるSREの取り組みの一部が公開されています。株式会社メルカの「インフラチーム」は、「SRE(Site Reliability Engineering)チーム」に名称を変更したことが紹介され、さらに、SREチームの役割について、以下のように記載されています。

『取り扱うデータの増加に伴うデータベースサーバの分散、頻繁なリリースにより機能追加の頻度をあげたいというニーズからChatOpsとGoogle カレンダーを連携したデプロイ環境の構築、さらにはログ分析基盤の構築やPUSH配信サーバなどのミドルウェアの開発と検証、サーバの冗長化、APIサーバのパフォーマンス向上にも取り組んでいます。
現在のSREチームの主な業務は次のようになります。APIサーバ、ミドルウェアの可用性の維持・向上、APIサーバ、ミドルウェアのパフォーマンスの向上、ログ収集・分析基盤の構築、運用、サーバプロビジョニング・デプロイの整備、セキュリティの担保、開発環境などの整備』

▼参考リンク:インフラチーム改め Site Reliability Engineering (SRE) チームになりました

SREチームが持てない中堅企業やスタートアップ企業の対応

SREは、決して大企業のための仕組みではありません。むしろ、中堅企業やスタートアップ企業の方が、クラウドやWebサービスへの依存度・重要度が高いと言えます。企業規模が小さいほど、SREのメリットを享受できるのです。

しかし、メルカリ社のように、クラウドやWebの運用やSREに精通した人的リソースを有している企業は限られています。運用を自動化するためにはクラウドやWebに関する専門的なスキルが必要なので、実現は決して容易ではありません。そのため、SREによって運用管理の負荷を軽減したい企業は、運用管理の部分を外部にアウトソーシングするという対策方法を取ることになります。

しかし、中堅企業やスタートアップ企業が、IT全般だけでなくクラウドの運用やアプリケーション開発にも詳しい有能なエンジニアを複数雇用することはコスト面で実現が困難です。フリーランス(個人)と契約するにしても、その人の能力や適性を的確に判断するのは難しいとう問題があります。また、何らかの事情で働くことができない場合のバックアップ体制も必要です。SREを社外に業務委託することを考えても、自社の希望に合い、受託が可能な業者を見つけることは非常に困難です。

このような課題がある中で、中堅企業やスタートアップ企業がSREを活用し、クラウドやWebの運用・管理の負荷とコストを低減し、そのメリットを最大限に享受するためのソリューションが求められます。

課題を抱えるお客様に対して、スプラウトリー(Sproutly)は、中堅企業やスタートアップ企業にフォーカスした低価格のSREサービスを提供します。クラウドに精通したチームが、安定したクラウドの運用・管理を実現しクラウドの運用管理コストの削減を実現します。