2022年11月9日
カオスエンジニアリング
Harness Chaos Engineeringの主要機能、つまりSaaSとセルフホストデプロイメントにわたる統合試験(unified experimentation)機能、CI/CDパイプラインでのカオスオーケストレーション、定常文管理などを深堀りしてみましょう。
カオスエンジニアリングは、企業が予期せぬダウンタイムによって受ける経済的・風評的な影響を最小限に抑えるのに役立ちます。また、開発者は生産現場でのインシデントの消火活動よりも、ソフトウェアのデリバリーに集中できます。カオス試験は、従来の単体テスト、統合テスト、システムテストの枠を超え、実際の生産環境におけるランダムな不具合をより忠実に再現できます。この現実性のある環境は、システムがどう動作するかという深い情報を与え、チーム全体がアプリやインフラの弱点を理解し、コストのかかるダウンタイムを防ぐための弾力性を積極的に生み出せるようにします。このブログでは、この製品の主な機能を詳しく見て、チームが課題を解決するためにどう役立つかを見ていきます。
Harness CEが提供するものは次の通りです。
では、信頼性を高めるためにチームが活用できる機能について、より深く掘り下げてみましょう。
統一された試験プラットフォーム
SaaS、セルフホスティング、オンプレミス、エアギャップ(訳注:外部と接続されていない環境)など、お客様のビジネス要件やセキュリティー要件に合わせて、カオスエンジニアリングを導入できます。Harnessは、複数のプラットフォームや環境への試験投入をサポートしています。Enterprise ChaosHubは、VMware、AWS、GCP、Azure、Kubernetesのカオス試験を網羅した高度な試験のカタログです。カオス試験では、UI内で試験の管理、編集、スケジュール、実行が可能で、コラボレーションを向上させることができます。Harnessは、現在利用可能な最大かつ最も多様なカオス試験を提供し、毎月多くの試験が追加されています。
カオスオーケストレーションと信頼性管理
カオスオーケストレーションにより、組織の知識、プロセス、カオスオーケストレーションにより、組織の知識、プロセス、ツールのギャップをHarnessソリューションが埋めることで、CEプラクティスを迅速に構築できます。Harness CEを使用して、新入社員や既存社員のトレーニングを行い、ソフトウェアの信頼性を向上させます。
チームごとにCEを導入するのに何年も待つ必要はなく、Gitリポジトリーから企業全体にカオスエンジニアリングを展開できます。カオスエンジニアリングの実践を企業全体で開始し、ソフトウェアの信頼性をあらゆるアプリケーションに拡大します。GitOpsとCI/CDの統合を活用して複雑な作業を自動化し、カオス試験用の宣言型YAMLファイルを提供することで開発者の体験を向上させることができます。
GitOps機能により、カオス試験のための単一の真実のソースを構成し、Gitから直接実行でき、CI/CDパイプラインにおける自動化の広大な範囲を可能にします。
チームは、レジリエンススコアを通じて信頼性を管理し、各試験を定義、測定、チューニングして、レジリエンスを経時的に追跡し、試験結果 を自動化できます。
定常状態の測定
開発者が手動で監視ダッシュボードを見たり、複数のブラウザタブを開いて「ガラス越しの目」を持つのではなく、Harness CEは試験の計測を自動化できるプローブを提供します。プローブは、あらゆるカオス試験に対して定義できる編集可能なチェック項目で、試験の成功条件と失敗条件を測定します。Chaos Probeの例としては、アプリのヘルスチェックやシステムの定常状態のメトリックの簡単なクエリーなどがあります
試験制御メソッド
Harnessは、コードリポジトリーでの構成定義、バージョン管理、自動化による編集を行うための宣言的なカオス試験(declarative chaos experiments)を提供します。この宣言的アプローチにより、開発者はコードに信頼性を持たせ、自動化することができます。
Harnessカオスエンジニアリングでは、実世界の事象を模倣して障害(フォールト)を並列に実行できます(CPUフォールト+メモリフォールト)。このアプローチに加えて、カオス試験を並行して実行することで、複数の障害モードに起因することが多い複雑なIT障害をモデル化できます。
異なるターゲットでさまざまな試験を行い、より広範なサービス群にまたがるカスケード障害をシミュレートできます。この機能により、1つのクラウドプロバイダーのアベイラビリティーゾーンにネットワーク障害を発生させ、同時にリソース枯渇試験を実行して、冗長システムに移行するトラフィックをシミュレートできます。
最後に、希望するテストの期待値を超える影響を引き起こすインフライト試験を中止できます。ユーザーは、テスト対象 システムの健全性メトリクスで定義されたプローブを使って、手動または自動で中止条件を設定し、リカバリスクリプトを自動化できます。
観測性と生態系の統合
Harness CEは、カオスメトリクスを一般的な観測機能やアプリケーションパフォーマンス監視(APM)ソリューションに送信できるため、開発者は信頼性の高いエコシステムと統合することができます。Harness CEが彼らのシステムにプラグインできるため、開発者の労力が軽減されます。私たちのリストには、Prometheus、Grafana、Dynatrace、Keptn、その他が含まれています。観測可能性と監視の統合の他に、負荷テストツールとの統合や、カスタムスクリプトによる独自のテストの活用も可能です。
エンタープライズダッシュボード、アナリティクス、レポート
ダッシュボードやレポートに関して、役割に応じて追加のビューを必要とします。経営幹部は、1 つのダッシュボードでハイレベルなリスク評価を行いたいと考えるかもしれません。エンジニアリングマネージャーは、全サービスの信頼性ステータスを確認したいと思うかもしれません。Harness CEは、信頼性の一元化に必要な試験データ、分析機能、レポート作成機能を全て備えています。
エンタープライズグレードの監査証跡とRBAC
Harnessは、詳細な監査証跡ときめ細かいRBACを備えていることで、CI/CD業界において高い評価を得ています。これらの監査証跡により、エンジニアリングチームは迅速かつ容易に監査に合格することができ、多くの場合、何日もかかる作業をわずか数時間に短縮できます。きめ細かいRBACモデルは、どんなに複雑なものでも、組織のニーズを満たす権限システムを実装できます。
エンタープライズサポート
Harnessは、企業がビジネスの要求に応えるために迅速な行動と拡張を必要としていることを認識しており、お客様のカオスエンジニアリングの実践をできるだけ早く安全に開始できるよう、企業向けサポートを提供する体制を整えています。Harness CEは、CNCFのオープンソースプロジェクトであるLitmusChaosを作った専門家チームによって構築されています。このチームは、SaaS、オンプレミス、セルフホスティング、エアギャップなどのインストールをサポートし、導入支援、機能強化、カオスのベストプラクティス、CI/CDや観測可能なプラットフォームのカスタムツールの統合を提供する準備が整っています。
カオスエンジニアリングの導入は、かつてないほど簡単です。カオスエンジニアリングを導入して信頼性を向上させる方法を知りたい方は、今すぐデモをリクエストしてオンプレミス版またはSaaS版にサインアップしてください。
この記事はHarness社のウェブサイトで公開されているものをDigital Stacksが日本語に訳したものです。無断複製を禁じます。原文はこちらです。