Rogers e l’interruzione di rete in Canada: tre lezioni per i CIO di tutto il mondo
L’8 luglio 2022 un aggiornamento di manutenzione sulla rete ISP Rogers in Canada ha interrotto l’accesso a Internet in tutto il Paese per almeno 12 ore, causando problemi e ripercussioni nei giorni successivi. L’impatto è stato profondo. L’interruzione a livello nazionale ha interessato il servizio telefonico e Internet per circa 12,2 milioni di clienti – circa un quarto delle connessioni Internet del Canada – impedendo pagamenti online, transazioni sulla rete interbancaria canadese Interac, l’accesso ai servizi di emergenza per gli utenti Rogers e provocando anche malfunzionamenti dei segnali stradali di Toronto che dipendono da reti GSM.
Per Rogers Communications al danno si è aggiunta la beffa: l’interruzione ha costretto il musicista canadese The Weeknd a posticipare la prima tappa del suo tour mondiale, che si sarebbe tenuta al Rogers Centre di Toronto.
La causa di tutto ciò? Come ha successivamente spiegato Rogers alle autorità canadesi, l’aggiornamento “ha eliminato un filtro di routing e ha consentito a tutti i possibili percorsi verso Internet di passare attraverso i router […] Alcune apparecchiature di instradamento di rete hanno superato i loro livelli di capacità e quindi non sono state in grado di instradare il traffico, causando l’interruzione dell’elaborazione del traffico da parte della rete centrale comune”.
Sebbene Rogers, uno dei principali provider canadesi, abbia ripristinato il servizio in un giorno per la maggior parte dei clienti, la catastrofica interruzione ha spaventato le imprese canadesi.
Alcuni, come i circa 100 punti vendita gestiti dal rivenditore di forniture per l’agricoltura Peavey Mart, avevano un accesso ridondante ad altri provider Internet già attivi. Di conseguenza, “solo due negozi sono stati colpiti direttamente dall’assenza di connettività Internet“, afferma Shaun Guthrie, Senior VP of Information Technology dell’azienda e VP della CIO Association of Canada. “Tuttavia, ci affidiamo ai servizi Interac per le transazioni dei nostri clienti, che si basano esclusivamente su Rogers, quindi abbiamo perso la possibilità di effettuare pagamenti con carte di debito“.
Non solo una questione nazionale
“Per un paio di giorni alcune delle organizzazioni non profit che servo hanno perso la capacità di registrare la soddisfazione dei bisogni delle persone vulnerabili“, afferma Helen Knight, Virtual CIO e Strategic Technology Consultant per le organizzazioni non profit canadesi. “Personalmente, non riuscivo a comunicare con i miei figli ed ero preoccupata per loro“.
Altri non sono stati altrettanto fortunati. “In qualità di azienda globale che produce acquascivoli e attrazioni per parchi acquatici, l’interruzione della rete Rogers ci ha colpito più di quanto pensassimo inizialmente“, afferma Chris Palsenbarg, Manager delle operazioni IT e supporto dell’help desk di WhiteWater West Industries. “Il personale che viaggiava all’estero non poteva nemmeno usare i propri telefoni“.
Sapper Labs Group è un’azienda canadese di cybersecurity/cyberintelligence. “Sebbene la nostra azienda non sia stata colpita dall’interruzione di Rogers, molti dei nostri partner, clienti e concorrenti lo sono stati“, afferma Dave McMahon, Chief Intelligence Officer di Sapper Labs. “Alcune organizzazioni devono ancora riprendersi completamente. Questo ha avuto un effetto a catena sul mercato”.
Sulla scia di questo episodio i CIO, i dirigenti e gli esperti IT canadesi stanno valutando la loro disponibilità a far fronte a tali eventi in futuro. Le loro conclusioni possono interessare i CIO di tutto il mondo: tutti rischiano di sperimentare simili interruzioni del servizio nei propri Paesi a causa di problemi di sistema, intrusioni o interruzioni di alimentazione dovute a cause ambientali o di altro tipo.
Creare ridondanza
L’interruzione di Rogers ha sottolineato il valore di avere un accesso ISP ridondante, anche se costa più che fare affidamento su uno solo. Sebbene alcune società si oppongano a questa spesa aggiuntiva, Peavey Mart riconosce il valore di pagare per un accesso a Internet ridondante ove possibile. L’8 luglio 2022 l’azienda è stata premiata per la sua lungimiranza.
La caduta della rete non ha preso alla sprovvista l’azienda, perché “monitoriamo in modo proattivo lo stato delle nostre comunicazioni dati“, afferma Guthrie. “Di conseguenza, una volta che i negozi sono stati colpiti dall’interruzione, sono passati automaticamente ai loro ISP secondari attraverso la nostra infrastruttura abilitata SD-WAN“.
Le organizzazioni senza scopo di lucro come l’Esercito della Salvezza canadese non possono permettersi il tipo di infrastruttura utilizzata da Peavey Mart. Ma i loro CIO sono esperti determinati, abituati a “realizzare imprese straordinarie utilizzando software gratuito e hardware donato“, afferma Knight. “Sono abituati ai guasti della loro vecchia infrastruttura IT, quindi di solito hanno un processo manuale su cui fare affidamento“.
Di conseguenza, possono far fronte a questo tipo di problemi nel momento in cui si verificano. “I dati persi a causa dell’interruzione avranno un impatto su di loro in seguito, quando non avranno record corretti che mostrano quante persone hanno servito per mostrare i loro donatori, con un potenziale impatto sulle sovvenzioni future“, aggiunge Knight.
Stando così le cose, Knight ritiene che l’interruzione di Rogers potrebbe cambiare in meglio gli atteggiamenti delle organizzazioni non profit nei confronti degli accessi ridondanti. “Dopotutto, è stata pratica comune per anni avere una connessione ridondante per tutti i componenti aziendali critici, quindi il lato positivo è che ora le organizzazioni non profit comprendono una nuova area di rischio che potrebbero non aver considerato”.
Verificare i piani di backup dei propri fornitori
Per Sapper Labs, “l’interruzione di Rogers ha rafforzato la nostra fiducia nella nostra architettura e modalità operativa“, afferma McMahon. Ma questo senso di fiducia ha rafforzato la convinzione che l’infrastruttura IT di un’azienda non è mai isolata. Al contrario, è un anello di una catena di provider, piattaforme cloud e altre parti che si connettono all’azienda tramite Internet.
Pertanto, “la lezione imparata è garantire che la propria supply chain, i partner e i clienti siano egualmente preparati e che abbiano piano di emergenza per mantenere le operazioni aziendali“, afferma. “Ciò che è stato illuminante è che l’interruzione ha immediatamente rivelato chi era un cliente Rogers, se disponeva di mezzi di comunicazione alternativi, il livello di maturità della sicurezza informatica e le interdipendenze critiche nell’ecosistema“.
Peavey Mart è altrettanto diligente nel controllare le vulnerabilità nella sua supply chain dei dati. “Chiediamo a tutti i nostri fornitori cloud se hanno ridondanza”, spiega Guthrie, “se i loro sistemi dispongono di failover per i sistemi di backup integrati e dispongono di cose come piani di continuità aziendale in modo che, quando si verifica un problema, il personale sappia cosa fare. E poniamo queste domande in anticipo”.
Sfortunatamente, rivenditori come Peavey Mart non hanno il potere di chiedere tali risposte a gruppi come Interac. “Di conseguenza, non abbiamo altra scelta che presumere che Interac disponga di tali misure di backup, cosa che chiaramente non aveva“, sottolinea Guthrie.
Prevedere altre interruzioni nel prossimo futuro
L’interruzione dei servizi di telecomunicazione offerti da Rogers in Canada è stata seguita da indagini governative, resoconti negativi dei media e, prevedibilmente, indignazione pubblica. Ma nessuna di queste reazioni può cambiare un fatto molto semplice: le reti ISP sono sistemi vasti e complessi, composti da molte parti la cui risposta agli aggiornamenti di manutenzione non può essere completamente prevista nelle simulazioni.
Di conseguenza, anche dopo tutti i miglioramenti che Rogers ha promesso di apportare e che altri ISP canadesi potrebbero adottare, per prudenza, “non so a chi toccherà, ma non ho dubbi che si verificheranno ulteriori interruzioni di servizio nei prossimi dodici mesi“, afferma Guthrie.
Stando così le cose, i CIO le cui aziende si affidano all’accesso ISP devono adottare misure per proteggere le proprie aziende da tali interruzioni. Secondo Dave McMahon, il percorso da seguire è chiaro: “doppio provider e sistemi indipendenti ridondanti sono le migliori pratiche nel settore“.
“È la definizione stessa di un sistema ad alta disponibilità. Questo è il motivo per cui tutti i dipendenti di Sapper Labs dispongono già di molteplici mezzi di comunicazione sicura e capacità di collaborazione online. Attualmente stiamo valutando il modo migliore per estendere simili soluzioni ai nostri clienti e partner“.
Allo stesso tempo, i CIO devono essere umili e non sopravvalutare la loro capacità di pianificare in anticipo tali eventi.
“Ogni persona e ogni organizzazione ha affrontato sfide tecniche nuove e complesse negli ultimi due anni. La tecnologia è così onnipresente e così complessa che, sebbene sia possibile proteggere le aziende dalle interruzioni in stile Rogers, non è possibile o conveniente proteggersi da tutti i rischi“, afferma Knight. “Si tratta invece di quantificare l’impatto e l’urgenza di ciascun rischio e di dare priorità ai piani di continuità organizzativa per le aree operative più critiche”.
Un’interruzione come quella avvenuta a luglio in Canada è una crisi che potrebbero dover affrontare i CIO delle aziende di tutto il mondo negli anni a venire. Questo è il motivo per cui è necessario potenziare ora i sistemi ridondanti e preparare piani di emergenza per ridurre al minimo e mitigare l’impatto inevitabile di questi eventi sull’azienda.
James Careless