Netflixin Chaos Monkey ja Supply Chain

Keskustelin äskettäin Zaran emoyhtiön Inditexin operatiivisen johtajan Carlos Crespon kanssa, jossa hän mainitsi Netflixin yli vuosikymmen sitten luoman ohjelmistotyökalun järjestelmän kestävyyden vakiinnuttamiseksi. Nimi on tarttuva, ja toimitusketjun johtajille, jotka yrittävät keksiä toimitusverkostonsa uudelleen myrskyisiä aikoja varten, se on vastustamaton. Ja silti GoogleGOOG
Haku "toimitusketjun kaaosapina" tuotti täsmälleen yksi lainaus, vuodesta 2012.

Miksi emme sovella tätä ideaa toimitusketjun kestävyyteen?

Mikä on Chaos Monkey?

On ohjelmistotyökaluja laajemminkin suunnitteluperiaate, joka satunnaisesti sammuttaa monimutkaisen järjestelmän osia ja pakottaa operaattorit palautumaan. Ikään kuin yllätyspaloharjoitus, mutta päivittäin ja satunnaisesti ja satunnaisesti. Ajatuksena on, että järjestelmäongelmien nopea ratkaiseminen on oppimisprosessi, jonka pitäisi hyötyä jyrkkenevästä oppimiskäyrästä.

Taustatarina kertoo siitä, kuinka Netflix laajensi suoratoistoliiketoimintaansa Amazon Web Services -palvelussa siirtyessään DVD-levyjen toimituksesta asiakkaiden ovelle. Ensi silmäyksellä se on looginen lähestymistapa järjestelmän redundanssin suunnitteluun, kuten NASAlta voi odottaa, mutta käytännössä se hyödyntää Netflixin kulttuurista normia, jonka mukaan yksittäiset osallistujat voivat ratkaista omat ongelmansa. Kuten kirjassa "Kaaossuunnittelu” Netflixin käytännön edelläkävijöiden Casey Rosenthalin ja Nora Jonesin vuoden 2020 kirja, joka tiivistyy viiteen periaatteeseen:

  • Rakenna hypoteesi vakaan tilan käyttäytymisestä
  • Vaihtele tosielämän tapahtumia
  • Suorita kokeita tuotannossa
  • Automatisoi kokeet suoritettavaksi jatkuvasti
  • Minimoi räjähdyksen säde

Kulttuurin ja prosessin sekoitus Netflixissä on tärkeä, koska se edisti ja valjasti avoimen lähdekoodin ongelmanratkaisua, samalla kun satunnaisten sammutusten järjestelmällinen kääntäminen nopeuttaa oppimista laajennetun tiimin kesken.

Supply Chain Resilience and Chaos Engineering

Digitaalinen muunnos toimitusketjussa on ollut kuuma tänä vuonna, koska se auttaa toimitusketjuja tukemaan uusia liiketoimintamalleja ja ajamaan kohti kestävää toimintaa (katso BCG X -tutkimus), mutta myös siksi, että se lupaa "resilienssiä". Valitettavasti digitaalisen muuntamisen käytännön sovellukset toimitusketjun kestävyyden parantamiseksi tiivistyvät edelleen yleensä alustoihin paremman "näkyvyyden" saamiseksi, jota tukevat joukko perinteisiä taktiikoita, kuten varastopuskurointi ja kaksoislähde. Tämän lähestymistavan taustalla on toinen analyyttisen työn kerros toipumisaikaa David Simchi-Levi MIT:stä ja simulaatioaalto digitaalisia kaksosia käyttäen. Tämä kaikki kuulostaa hienolta, mutta puuttuu järjestelmällinen tapa kokeilla todellista toimitusketjun epäonnistumista, jotta voidaan oppia parhaiten toipumaan käytännössä.

Chaos Monkeyn soveltaminen toimitusketjuihin

Lääkärit vannovat Hippokrateen valan ennen kuin avaavat meidät, mukaan lukien tunnetusti "ensimmäisenä älä vahingoita". Ei huono idea kenellekään, joka soveltaa Chaos Monkey -periaatteita toimitusketjuihin, mikä tarkoittaa oikean koneen satunnaista sammuttamista jossain. Tämä ei ole triviaalia, eikä tietääkseni tapahdu vielä missään.

  • Ensimmäinen edellä mainittu periaate sanoo, että keskitytään järjestelmän ulostuloihin sisäisten ominaisuuksien sijaan. Varmista, että järjestelmä toimii sen sijaan, että yrität ymmärtää, miksi se toimii.
  • Toinen periaate käskee rikkoa erilaisia ​​asioita realistisilla tavoilla. Ei tarvitse simuloida globaalia lämpöydinsotaa, vain sammuta kytkin tai menetä tilaus ja opi, mikä ratkaisu toimii parhaiten.
  • Kolmas periaate sanoo, että paras paikka oppia on tuotanto. Tekemällä oppiminen on parempi kuin simulaatiolla oppiminen – eli digitaaliset kaksoset ovat hienoja, mutta ne eivät välttämättä riitä rakentamaan sietokykykulttuuria.
  • Neljäs periaate institutionalisoi kaaosapinaperiaatteet, koska se mahdollistaa kokeiluprosessin skaalauksen, mikä vie sinut jyrkempään oppimiskäyrään. Käytä tietotekniikkaa palontorjunnassa.
  • Lopuksi minimoi räjähdyksen säde. Tämä tarkoittaa "älä vahingoita" ja tarkoittaa jonkinlaista puskurointia (varasto, toimitusaika, nopeutettu toimitus), joka suojaa asiakkaita kokemastasi. Opi hallitsemaan hallittuja räjähdyksiä.

Voidaan väittää, että viimeiset kolme vuotta Covid, sota, työvoiman levottomuutta, ja taloudellinen myllerrys on ollut yksi suuri kaaos-apina-aina kaikille. Netflixin opetus oli, että tällainen kriisi ei ole vain suunniteltava asia, vaan se on hallittava pysyvänä tosiasiana.

Täydellinen myrsky ei ehkä koskaan lopu, joten ehkä meidän pitäisi oppia elämään sen kanssa.

Lähde: https://www.forbes.com/sites/kevinomarah/2022/12/22/netflix-chaos-monkey-and-supply-chain/