Dopo il black out di quasi 2 giorni che ha coivolto 220 milioni di utenti, va in tilt anche la comunicazione in casa Skype. Si inizia il 18 quando il fantomatico Villu Arak dal blog ufficiale “ci tranquillizza” avvertendoci che la spiegazione arriverà solo dopo il week end (il capo delle PR era in ferie ?); oggi lo stesso Arak prima pubblica un post alle 5:35 AM GTM con questa spiegazione:
On Thursday, 16th August 2007, the Skype peer-to-peer network became unstable and suffered a critical disruption. The disruption was initiated by a massive restart of our user’s computers across the globe within a very short timeframe as they re-booted after receiving a routine software update. The abnormally high number of restarts affected Skype’s network resources. This caused a flood of log-in requests, which, combined with the lack of peer-to-peer network resources, prompted a chain reaction that had a critical impact.
Poi alle 11:45 AM GTM si decide di accusare esplicitamente gli utenti di Windows (ho evidenziato le parti modificate):
On Thursday, 16th August 2007, the Skype peer-to-peer network became unstable and suffered a critical disruption. The disruption was triggered by a massive restart of our users’ computers across the globe within a very short timeframe as they re-booted after receiving a routine set of patches through Windows Update.The high number of restarts affected Skype’s network resources. This caused a flood of log-in requests, which, combined with the lack of peer-to-peer network resources, prompted a chain reaction that had a critical impact.
Prendere per buona la spiegazione di un sistema messo in ginocchio dagli aggiornamenti degli utenti, ci dovrebbe quantomeno far considerare delle alternative a Skype. Ma vedere un azienda che scarica, almeno parzialmente, la colpa di un disservizio sui suoi utenti, è sconfortante.
E in questa gestione quantomeno approssimativa della crisi che fine ha fatto il top management di Skype o di eBay ?
Update: quelli del blog italiano ancora non si sono accorti della modifica
Update 2: Villu ha “sentito il bisogno” di chiarire che Microsoft non c’entra nulla col problema avuto e che, anzi, ha fornito il massimo supporto. Ennesima riprova del cattivo lavoro di PR svolto.
Però devi riportare per intero quanto dicono, non solo quello che serve per far polemica 🙂
“this event revealed a previously unseen software bug within the network resource allocation algorithm which prevented the self-healing function from working quickly”
il che completa quanto riporti, che sommariamente può essere tradotto in “il riavvio in massa dei PC con Windows a seguito di un update ha svelato un bug che ha impedito alla rete di ristabilirsi”.
Grazie per il tuo contributo gp. Per chiarire: non ho riportato solo quello che serve per far polemica, ma il fulcro del messaggio.
Mi pare che la polemica l’ha innescata skype, altrimenti perchè cambiare il testo del post esplicitando “Windows” ?
A me non sembra di vedere questo intento accusatorio, anzi, se c’era, era più nella prima versione che nella seconda. E’ vero che solo nella seconda versione è nominato esplicitamente Windows, ma del resto l’unico ‘software update’ che può portare a un riavvio più o meno contemporaneo di tante mecchine è relativo a Windows. Non ci voleva quindi un grande acume per arrivare lo stesso al responsabile, a meno che non si voglia dire che la base di utenti OSX (o Linux) sia così ampia da giustificare un simile fenomeno, ma è anche vero che questi sistemi in genere non hanno bisogno di riavviarsi 😉
Nella seconda versione, il termine “initiated” è stato sostituito con “triggered”: IMHO un trigger, o innesco, è qualcosa che fa partire un certo fenomeno senza farne parte, e da solo non è sufficiente a far nulla, i.e. un innesco e basta senza esplosivo non fa esplodere alcunché. Un fenomeno “iniziato” da qualcosa invece indica che quel qualcosa è parte del fenomeno, ha una relazione più stretta. Infine, nella prima versione di parlava di numero di riavii “anormalmente alto”, nella seconda solo di numero elevato di riavvii, e questo mi pare giusto perché Skype non ha alcun titolo per definire la cosa “anormale”.
Io abbandonerei Skype come dici tu (anzi, non l’ho mai usato), ma per motivi completamente diversi:
1) Skype ha un protocollo chiuso, non documentato e segreto, è impossibile creare client alternativi.
2) Una rete P2P funziona bene per scambiare file, ma per applicazioni realtime potrebbe avere qualche problema in più, non dimentichiamoci che un pacchetto VOIP che arriva in ritardo è come se non fosse arrivato. Per questo motivo, l’unico modo che vedo per gestire senza intoppi la sparizione di un nodo P2P che veicoli pacchetti voce è quello di ridondare tutto e far sì che ogni pacchetto passi per almeno due percorsi indipendenti, in modo che se uno cade rimanga l’altro. Ammesso e non concesso che questo sia fattibile, occorre come minimo raddoppiare il traffico sulla rete, per così dire… un affare. 😛
grazie