Ce livre est simple et bien conçu. Il aborde les thèmes essentiels auxquels il est nécessaire de s’intéresser si l’on veut construire, déployer et opérer des applications à grande échelle. Les voici, je n’invente rien, ce sont les cinq sections du livre:

  • Disponibilité: Comment rendre les systèmes hautement disponibles et comment s’assurer qu’ils le sont via la mise en place de mesures.
  • Gestion des risques: Comment construire une analyse de risques et mener des actions de remédiation.
  • Services et microservices: Prendre conscience de l’intérêt (et des travers) de ce découpage, adapter son organisation en fonction.
  • Scaling: Comment découper les services, leur dépendances et savoir comment s’organiser pour les opérer.
  • Cloud: Quels sont les services offerts dans le cloud, comment sont-ils organisés et opérés quels sont les avantages et les inconvénients.

Lee Atchinson parvient très bien a offrir un panorama de tous ces sujets. Sans rentrer dans les détails, il donne des points essentiels, des incontournables. Il constitue donc une très bonne entrée en matière pour les néophytes, mais il peut aussi être utilisé comme une référence car il fournit des définitions simples et assez bien faites appelant le consensus. Au delà des définitions je m’en suis servi plusieurs fois comme boîte à outil par exemple pour construire une analyse de risques ou pour établir une cartographie des services avec leurs dépendances et leur criticité (notion de Tiers). Dans le cadre de ces figures imposées, il donne toute l’ossature, il n’y a plus qu’à suivre le guide.

Son découpage simple et clair est un grand atout pour la compréhension car le livre progresse par étapes séquentielles. Une très bonne première lecture qui en appelle d’autres comme: Release It!1 – un indispensable – ou Site Reliability Engineering2.

P.-S.: Une version de cet article a également été publiée en anglais sur mon autre blog.


Lee Atchinson, Architecting for Scale: High Availability for Your Growing Applications, O’Reilly, 2016, 230 p, Amazon.


  1. Michael T. Nygard, Release It! Design and Deploy Production–Ready Software, O′Reilly, 2017, 236 p, Amazon↩︎

  2. Betsy Beyer, Chris Jones, Jennifer Petoff et Niall Richard Murphy, Site Reliability Engineering: How Google Runs Production Systems, O’Reilly, 2016, 552 p, Amazon↩︎