Comment exploiter le Cloud pour assurer la résilience de ses systèmes SAP grâce au PRA as Code

Resilience, growing from within

Infrastructures de secours mises en service uniquement en cas de besoin, automatisation maximale, performances linéaires : le Cloud apporte un certain nombre de garanties à la reprise d’activité après incident. Des atouts sur lequel a largement misé PASàPAS pour développer le PRA as Code (plan de reprise d’activité nouvelle génération) au sein de son offre infogérance 4 SAP.

 

Si le Cloud pose de nouveaux défis aux entreprises en matière de continuité d’activités, il amène aussi de nouvelles options dans la construction des PRA, les plans de reprise après incident qui permettent à une entreprise de faire redémarrer son IT après une panne ou un accident ayant mis ses systèmes d’information à l’arrêt ou les ayant rendus inaccessibles. Si le Cloud est un atout dans cette recherche de résilience, encore faut-il adopter des pratiques adaptées aux caractéristiques de ces environnements (lire notre article « le Cloud, faux ami mais surtout meilleur allié de la résilience »). Avec quelques principes forts, comme le dimensionnement des machines au plus juste et le recours exclusif à l’automatisation, via l’infrastructure as code (lire notre article « SAP as Code : peut-on réellement automatiser les environnements SAP ? ») qui permet de piloter des systèmes IT via des API .

 

C’est sur ces bases que PASàPAS a développé sa solution de PRA as Code pour les environnements SAP. « Dès que le Cloud est entré dans l’équation sur les systèmes SAP, nous l’avons identifié comme une excellente manière d’adresser les problématiques de continuité d’activités », se rappelle Brian Passante, le responsable Cloud & Innovation de PASàPAS. L’objectif ? Proposer une solution intégrant à la fois le meilleur de la sécurité du Cloud, en utilisant au mieux les fondations sécurisées des hyperscalers, et des dispositifs complémentaires permettant de sécuriser toutes les couches d’infrastructures et tous les composants logiciels. Tant et si bien qu’aujourd’hui, le PRA sur le Cloud est devenu une composante native de l’offre du spécialiste des systèmes SAP, reposant notamment sur une solution de sauvegarde multicloud adaptée au contexte des environnements progiciels du premier éditeur européen.

 

Pertes de données et temps d’interruption minimaux

Une offre de PRA qui se destine, rappelons-le, à des systèmes très exigeants. Comme l’explique Jérôme Mollier-Pierret, le directeur de l’infogérance SAP chez PASàPAS : « On parle presque systématiquement de systèmes critiques, qu’on ne peut quasiment jamais arrêter et pour lesquels les pertes de données tolérables et les temps d’arrêt acceptables sont nécessairement minimes. » Deux critères qui sont précisément deux paramètres clefs des PRA : le RPO (le Recovery Point Objective, qui définit la quantité de données qu’il est acceptable de perdre, donc la fraicheur des sauvegardes dont on doit en permanence disposer) et le RTO (le Recovery Time Objective, qui matérialise la durée maximale tolérable d’interruption du service). Sans oublier le fait que les systèmes SAP brassent généralement d’importantes quantités de données (couramment plusieurs To) et que les architectures HANA nécessitent des machines certifiées par l’éditeur et renfermant d’importantes quantités de mémoire vive. « C’est une autre spécificité dont il faut tenir compte, rebondit Brian Passante. Seulement environ un dixième des machines à disposition chez les hyperscalers répondent à ces critères. »

Sans oublier les complexités qu’embarquent les systèmes SAP sur le plan logique. « Le poids des interfaces est capital dans la construction du PRA, reprend le responsable Cloud & Innovation de PASàPAS. Car, plus que la mise en œuvre de machines de secours, le PRA a pour réel objectif de rendre les applications accessibles aux utilisateurs, y compris les applications tierces. » Par ailleurs, quand plusieurs applications SAP sont interconnectées, il faudra les restaurer simultanément, à la seconde près et assurer la reconstruction/continuité des flux applicatifs associés en toute sécurité.

 

Remonter une production complète en 4 heures

Autant d’éléments que PASàPAS a intégré dans sa solution de PRA, aujourd’hui disponible et testée avec succès. Notamment auprès d’un de ses clients, qui a fait confiance à PASàPAS pour l’infogérance de ses systèmes SAP sur le Cloud. L’éco-organisme, spécialisé dans la collecte, le réemploi, la réparation, la dépollution et le recyclage des équipements électriques et électroniques, a pu tester l’efficacité de son PRA dans le Cloud : en pratique, la mise à disposition d’une seconde production SAP, composée de 8 applications et de 17 To de données, en moins de 4 heures. « Concrètement, notre solution permet de reconstruire l’intégralité de l’infrastructure du client de manière complètement automatisée et de mettre à dispositions les dernières sauvegardes, avec un RPO inférieur à 30 minutes », détaille Brian Passante.

 

Tester son PRA régulièrement, pour un coût modique

Et, comme le sous-entend l’expert, ce modèle ne met en œuvre aucune infrastructure dormante, contrairement à un PRA traditionnel. La conséquence ? Déclencher un test de ce plan ne coûte que moins de 0,5% de la facture annuelle d’infrastructure, quelques centaines d’euros tout au plus. « Dès lors, le client comprend qu’il peut tester son PRA plus souvent, le rejouer régulièrement, voire automatiquement », lance Brian Passante. Un plus pour des entreprises de plus en plus auditées sur la résilience et la sécurité des systèmes d’information. Une tendance qui risque encore de se renforcer après le récent incendie d’un datacenter chez OVH et les nombreux cas d’attaques de type « cryptolocker ». La cible que vise Brian Passante ? Celle d’une infrastructure totalement résiliente, se réparant automatiquement, quel que soit le composant affecté par un dysfonctionnement. « Notre équipe fonctionne déjà avec cet état d’esprit, glisse-t-il. Même si SAP n’est pas Netflix ! » Façon de dire que les caractéristiques techniques intrinsèques du progiciel ne permettent pas d’aller aussi loin que le service de vidéos à la demande conçus dans le cloud, qui n’hésite pas à faire tourner des logiciels perturbateurs (de type « Chaos Monkey ») sur son système d’information de production afin d’en tester la résilience d’ensemble.

Aujourd’hui déployé auprès des clients infogérés par PASàPAS, le PRA as Code couvre tous les types d’environnements de l’éditeur de Walldorf (ECC 6, S/4HANA en particulier) en utilisant toutes les nouvelles capacités du Cloud. « Une des prochaines étapes consiste à ajouter des spécificités contextuelles au SI hors SAP de nos clients post-redémarrage », note Jérôme Mollier-Pierret. Et de diminuer encore le niveau de dépendance à une infrastructure en particulier, par exemple en hébergeant les systèmes de secours sur un Cloud différent de celui exploité en production. Si la solution logicielle développée par le prestataire est nativement adaptée aux principaux Cloud du marché (Amazon Web Services, Microsoft Azure et Google Cloud), le passage à un PRA multicloud soulève quelques complexités supplémentaires, en termes réseau notamment.

 

Se préparer au déclenchement simultané de plusieurs PRA

Pour l’heure, la solution de PASàPAS n’a pas connu de déclenchement réel de PRA pour un ou plusieurs clients. Mais le prestataire anticipe bel et bien des événements simultanés, touchant potentiellement plusieurs entreprises en même temps. « C’est la raison pour laquelle on a choisi d’automatiser au maximum, afin d’être en mesure d’absorber pareil événement », explique le responsable Cloud & Innovation de PASàPAS. Par ailleurs, les infrastructures alignées par les hyperscalers offrent, dans cette perspective, un certain nombre de garanties. Contrairement aux infrastructures traditionnelles, où la restauration simultanée de gros volumes de données se traduit très souvent par une dégradation des performances observées lors des tests unitaires, mettant en danger le RTO en condition réelle.

 

PASàPAS www.pasapas.com

contact@pasapas.com