I IT sigter en forretningskontinuitetsplan ( BCP ) med at garantere virksomhedens overlevelse i tilfælde af en større katastrofe, der påvirker it-systemet. Det handler om at genstarte virksomheden så hurtigt som muligt med minimalt datatab. Denne plan er et af de væsentlige punkter i en virksomheds it-sikkerhedspolitik .
For at en kontinuitetsplan virkelig skal tilpasses virksomhedens krav, skal den være baseret på en risikoanalyse og en konsekvensanalyse:
En vellykket risikoanalyse er resultatet af kollektiv handling, der involverer alle aktører i informationssystemet: teknikere, brugere og ledere.
Der er flere metoder til at sikre kontinuiteten i et informationssystems service. Nogle er tekniske (valg af værktøjer, metoder til adgangsbeskyttelse og sikkerhedskopiering af data), andre er baseret på brugernes individuelle adfærd (nedlukning af computerstationer efter brug, rimelig brug af kapacitet til informationsoverførsel, overholdelse af sikkerhedsforanstaltninger), på kollektive regler og viden (brandbeskyttelse, sikkerhed for adgang til lokaler, kendskab til virksomhedens interne it-organisation) og i stigende grad om aftaler med tjenesteudbydere (kopi af programmer, levering af nødudstyr, nedbrydningshjælp).
Metoderne skelnes mellem forebyggende (undgå diskontinuitet) og helbredende (genoprette kontinuitet efter en katastrofe). Forebyggende metoder foretrækkes ofte, men det er en nødvendighed at beskrive helbredende metoder, fordi intet system er 100% pålideligt.
Præventive målingerSom en del af hosting af deres infrastruktur og / eller applikationer fremkalder mere end 50% af de organisationer, som MARKESS International stillede spørgsmål til i 2008, et behov for følgende løsninger for at sikre kontinuiteten i servicen af deres forretningsapplikationer og IT- og telekommunikationsinfrastrukturer underliggende:
Dernæst i faldende rækkefølge af citater er replikerings-, spejling- og backup-løsninger på flere websteder eller på et andet fjernt websted (49%), failover på et backup-netværk (47%), analyse af procedurer og strategier. Sikring af forretningskontinuitet (47% ), båndbreddestyring (45%), fysisk og logisk sikkerhed (42%) osv.
Backup af dataDatabevarelse kræver regelmæssige sikkerhedskopier. Det er vigtigt ikke at opbevare disse sikkerhedskopier ved siden af computerudstyr eller endda i samme rum, da de forsvinder sammen med de data, der skal sikkerhedskopieres i tilfælde af brand, vandskade, tyveri osv. Når sikkerhedskopierne sandsynligvis forsvinder med hardwaren, kan det være nødvendigt at opbevare sikkerhedskopierne et andet sted og fjerntliggende.
Konsekvensanalysen har leveret krav udtrykt i maksimal tidsgenopretning efter en katastrofe (RTO: Recovery Time Objective eller maksimal tilladt afbrydelsestid ) og maksimalt datatab ( RPO Recovery Point Objective eller Data Loss maximum allowable ). Strategien skal sikre, at disse krav overholdes.
NødsystemerDet er et spørgsmål om at have et computersystem svarende til det, man vil begrænse utilgængeligheden for: computere, periferiudstyr, operativsystemer, bestemte programmer osv. En af løsningerne er at oprette og vedligeholde et backup-sted , der indeholder et system i funktionsdygtig stand, der kan overtage fra det mislykkede system. Afhængigt af, om back-up system vil blive placeret på driftsstedet eller på et geografisk andet sted, vil vi tale om in situ redning eller fjern redning .
For at reagere på katastrofegendannelsesproblemer bruges flyttede steder oftere og oftere, det vil sige fysisk adskilt fra brugerne, fra et par hundrede meter til flere hundrede kilometer: jo mere fjernt stedet, jo mindre risikerer det at blive ramt af en katastrofe påvirker produktionsstedet. Men løsningen er desto dyrere, fordi båndbredden, der gør det muligt at overføre data fra et sted til et andet, generelt er dyrere og kan være mindre effektiv. Generaliseringen af langdistance-netværk og faldet i transmissionsomkostninger gør imidlertid begrebet distance mindre restriktivt: omkostningerne ved stedet eller operatørernes kompetence (deres evne til hurtigt at starte redningen og give adgang til brugerne) er af stor betydning. andre valg af argumenter.
Redningssteder ( in situ eller remote) er klassificeret efter følgende typer:
Det er også muligt at bruge systemer fordelt på flere steder (reduktion i risikoen for fiasko på grund af ekspansionseffekten ) eller et mobilt backup-site, der svarer til en lastbil, der bærer servere og andre systemer, hvilket gør det muligt kun at have brug for '' et sikkerhedskopieringssystem til flere websteder, der regner med at sandsynligheden for, at en fejl påvirker flere steder samtidigt.
Jo kortere de garanterede restitutionstider er, desto dyrere er strategien. Vi skal derfor vælge den strategi, der giver den bedste balance mellem omkostninger og hurtig inddrivelse.
På den anden side anvendes redundans også til problemer med høj tilgængelighed , men på en mere lokal måde.
Det er også muligt at bruge et sekundært sted med høj tilgængelighed, som generelt er placeret i nærheden af produktionsstedet (mindre end 10 kilometer) for at forbinde dem med optisk fiber og synkronisere dataene fra de to steder i næsten realtid. Synkron eller asynkront afhængigt om de anvendte teknologier, tekniske behov og begrænsninger.
God information og god rollefordelingUanset hvor automatiseret og sikkert et it-system er, forbliver den menneskelige komponent en vigtig faktor. For at begrænse risikoen for fiasko skal aktørerne i en IS (IT-afdeling) anvende den mindst risikable adfærd for systemet og muligvis vide, hvordan de udfører tekniske handlinger.
Afhængig af katastrofens sværhedsgrad og kritikken af det mislykkede system vil genopretningsforanstaltningerne være forskellige.
DataoverførselI dette tilfælde gik kun data tabt. Brug af sikkerhedskopier er nødvendig, og metoden er for enkelheds skyld at flytte det sidste sæt sikkerhedskopier. Dette kan gøres på kort tid (et par timer), hvis vi tydeligt har identificeret de data, der skal tages tilbage, og hvis metoderne og værktøjerne til genimplantation er tilgængelige og kendte.
Genstart af applikationerVed en større fejltærskel er en eller flere applikationer ikke tilgængelige. Brug af et backup-websted er muligt, det er tid til at stille den pågældende applikation til rådighed.
Genstart af maskinerGendannelsesplanen indeholder følgende oplysninger:
Sammensætningen af disse hold skal være kendt og opdateret såvel som udskiftningsfolk og midlerne til at forhindre dem. Teammedlemmer skal modtage træning.
Planen skal prøves regelmæssigt under træning. En øvelse kan være en simpel gennemgang af procedurer, muligvis et rollespil mellem styreteamene. En øvelse kan også udføres i fuld skala, men kan være begrænset til gendannelse af en ressource (for eksempel hovedserveren) eller til en enkelt funktion af planen (for eksempel proceduren for øjeblikkelig intervention). Målet med øvelsen er flere:
En plan bør også gennemgås og opdateres regelmæssigt (mindst en gang om året) for at tage hensyn til skiftende teknologi og forretningsmål. Den eneste effektive måde at opdatere BCP på er at outsource vedligeholdelse til forretningsområderne, så den opdateres ved hvert månedlige servicemøde.
Den forretningskontinuitetsplan, der er beskrevet i denne artikel, er egentlig bare it-delen af en omfattende forretningskontinuitetsplan. Det svarer derfor til en plan for sikkerhedskopiering af computere. En forretningskontinuitetsplan (eller "Business Continuity Plan") er ikke begrænset til informationssystemets kontinuitet, den tager også højde for tilbagetrækning af brugere, sundhedsrisikoen (epidemi, pandemi), den organisation, der muliggør krisestyring (on- vagttjeneste, kriseenheder osv.), krisekommunikation, bypass-foranstaltninger for virksomheder, tværfunktionelle funktioner ( HR , logistik osv.).
Hvis vi tager eksemplet med en bank, hvis it er hostet på et fjernt websted, og som ser dets handelsværelse ødelagt af en brand, vil den udløse sin forretningskontinuitetsplan ved at trække sine teams tilbage til et backup-sted. Dette backup-site består af arbejdspositioner (udtrykket "position" repræsenterer et skrivebord, en eller to skærme, en central enhed, en telefon), hvorpå brugere kan fortsætte deres aktivitet: deres telefonnummer overføres til deres backup position, vil billedet af deres computerstation være blevet rekonstrueret, de vil have de nødvendige kommunikationslinjer (internt og eksternt netværk), brugerbackupsiden er selv linket til computerhostingstedet (eller til hjælp, hvis sidstnævnte også er berørt af hændelsen). For at genstart af computeren skal kunne udnyttes af brugerne af systemet, skal de tekniske aspekter krydses med den menneskelige organisation.