2022年3月22日
製品アップデート
SRM
Harness Service Reliability Managementは、新機能のリリースやバグ修正の速度と、本番環境での安 定性・信頼性の要求とを両立させる優れた方法を求めるチームのための製品です。
本日、Harness Software Delivery Platformの新モジュールを発表します。このモジュールは、開発者がアプリケーションサービスの信頼性を継続して改善する一方で速度を維持できるよう支援します。Harness Service Reliability Management(SRM)は、エンジニアリングチームと信頼性チームの間のコラボレーションとガバナンスを改善し、GoogleがSREハンドブックにまとめた、サービスレベル目標(SLO)を用いた最新のSite Reliability Engineering(SRE)プログラムを導入できるよう設計されています。
Harness SRMは、機能リリースやバグフィックスの速度と、本番環境の安定性や信頼性のニーズのバランスを取るための優れた方法を求めるチームのために開発されました。Harness SRMを使えば、もはや速度と信頼性のどちらかを選ぶ必要はありません。最高の開発者が信頼性の高いソフトウェアを高速に提供し続ける一方で、他の開発者や機密性の高いプロジェクトのためにガードレールを置くことができます。
SREモデルを組織で成功させるためには、文化の変化および新しい知識・スキルが必要です。Harness SRMは、あらゆる規模の企業がSREモデルを迅速に導入し、次に挙げたような一般的な課題を回避できるように設計されています。
Harness SRMは、エンジニアリングチームと信頼性チームのためのソリューションです。SRMでは、SLI、SLO、エラーバジェットを定義するためにチームが協働します。また、SRMのユーザーは、CI/CDパイプラインに信頼性ガードレールを作成します。これらの信頼性ガードレールは、パイプラインを次のステージに進めるかどうかを決定します。SLOとエラーバジェットのデータは、信頼性ガードレールの動作を駆動するために使用されます。SLOの違反が頻発すると、エラーバジェットが枯渇し、信頼性ガードレールによってパイプラインの実行が停止されます。パイプラインの実行が停止されると、パイプラインを継続するために明確な承認が必要となります。これは全てSRM監査ログに記録され、コンプライアンスのために使用されます。
より優れた本番環境での信頼性を実現するために、ソフトウェアのデリバリーライフサイクルの全ての段階において、サービスの信頼性チェックが実施されます。これらの信頼性チェックの中には、Harnessのネイティブエラー追跡のように、アプリケーションサービスにエージェントを追加する必要があるものもあります。その他の信頼性チェックは、外部ツール(APM、ログ解析、テストなど)との統合によって実行されます。これらのチェックの目的は、稼動前に信頼性の問題をできるだけ多く特定することです。適切に実施されれば、本番環境の信頼性は継続的に改善されます。
信頼性チームとエンジニアリングチームは互いに対立することを望んでいません。両チームが協調して、信頼性の高いソフトウェアをより速く提供するための新しい協力関係を築くことができます。
Harness Service Reliability Managementの詳細について知りたい、または使い始めたいという方は、詳しくはこちらをご覧ください。
この記事はHarness社のウェブサイトで公開されているものをDigital Stacksが日本語に訳したものです。無断複製を禁じます。原文はこちらです。