Sistemes autònoms i elevats humans de ser Middleware: Q&A amb Ben Nye, CEO de Turbonomic

Content

Sense errors, sense estrès: la vostra guia pas a pas per crear programes que canvien la vida sense destruir la vida

Emportar:

La nostra conversa amb Ben Nye, director general de Turbonomic.

Potser heu sentit parlar de computació autònoma. Es refereix a la capacitat d’un ordinador o sistemes d’autoorganitzar-se i autogestionar-se. I, fins fa poc, encara era una mica un somni futurista. Volíem aprendre una mica més sobre el funcionament d’un sistema autonòmic, de manera que vam parlar amb Ben Nye, el conseller delegat de Turbonomic i el director gerent de Bain Capital Ventures. Turbonomic (abans VMTurbo) recentment es va sotmetre a una nova marca per tal de descriure amb més precisió el que fa el seu programari. El nou nom incorpora els temes bàsics de Turbonomic a la seva plataforma de gestió d'aplicacions: Turbo (rendiment en temps real), control autònom (autoorganització i gestió de càrregues de treball) i principis econòmics (oferta i demanda). Aquí, Ben parla dels sistemes autònoms i la importància de l'automatització en entorns cada cop més complexos i basats en dades.

Techopedia: Has aparegut diverses vegades a la llista de Forbes Midas per a capitalistes més alts (VC). Com a circuit virtual, teniu un punt de vista interessant per veure tot el panorama tecnològic amb la quantitat que ha canviat el món al llarg dels anys. Què et sorprèn a la vista de la quantitat de coses que han canviat al centre de dades?

Ben Nye: La resposta breu és que crec que el ritme de canvi del centre de dades s’ha accelerat realment més enllà de tot allò que la gent va veure. El que va passar va ser aquest desenvolupament del centre de dades definit per programari i fonamentalment l'abstracció fora del maquinari. Això va obrir tot un impuls de creixement dins dels elements del programari.

Ara, en comptes de tractar els cicles d’actualització dels venedors de maquinari (que durant molt de temps gairebé van servir com a portador de portes al centre de dades), ara s’ha obert literalment a l’element de la rapidesa amb què es poden crear idees, perquè el programari, realment, són idees. Sense les limitacions en la generació d’idees, ha estat un moment molt emocionant i divertit, però el ritme de canvi del centre de dades i fins i tot la definició del centre de dades ha evolucionat materialment i amb més rapidesa que mai.

Una cosa que trobo molt interessant és quan vam anar a un centre de dades definit per programari, tots els controladors i API i botons del món del maquinari es van redefinir en programari. El que vam fer va ser pensar en això en termes d’una nova manera d’executar el rendiment i la productivitat, que seria l’aplicació i el canvi de demanda d’aquesta aplicació i lligar-los als controladors redefinits del programari perquè, en definitiva, és un programari per programari.

En fer-ho, ara podeu treure el middleware humà entre la capa d’aplicació i la capa d’infraestructura perquè ara, per primera vegada, podeu vincular-los directament entre ells, aquí hi ha una paraula important - de manera autònoma, és a dir, permeten literalment que les aplicacions es puguin autogestionar i autoorganitzar.

També fa que sigui econòmic en el sentit que ara la demanda busca oferta i ens centrem en un model de consum d’informàtica, un model econòmic en lloc d’un model basat en assignació o un model basat en l’oferta. Es tracta d'un aspecte força fonamental en la història de com hauria de funcionar la informàtica o el model de gestió de la indústria tecnològica. I es va produir un millor rendiment i una major eficiència en termes de cost. A més, fa que els clients siguin molt més àgils i resistents, i fa un millor ús de la mà d’obra al mercat

Heus aquí què és tan irònic el que va passar el 2016 amb cadascun dels centres de dades definits pel programari. Primer, feu un seguiment del vostre maquinari per saber quan es trenquen les aplicacions, per la qual cosa incomplien una qualitat del servei o un SLA, però mentre utilitzem el programari per trobar l’error, tornem al maquinari per a les alertes generades per màquina. . La segona pista és que permetem que les aplicacions que executin el negoci es trenquin, i la tercera és que agafem les alertes generades per màquina i que enviem aquestes alertes a la gent.

Sense errors, sense estrès: la vostra guia pas a pas per crear programes que canvien la vida sense destruir la vida

No podeu millorar les vostres habilitats de programació quan ningú es preocupa per la qualitat del programari.

Això ha de ser endarrerit.

I és aquí on volíem canviar el model de gestió de TI al marge de les assignacions o endevinar-nos i tornar a un model basat en la demanda basat en el consum.
Llegiu: Centre de dades impulsat per la demanda: què poden aprendre els administradors del sistema a Wall Street

Techopedia: Ara que ho esmentes, sí, estem fent qualsevol cosa definida pel programari, però només s’envien les alertes a la part lenta del procés, que és, com has dit, el middleware humà.

Heu esmentat el terme autonòmic. Potser es pot parlar una mica més de la importància dels sistemes autonòmics en informàtica? Tenint en compte que canvia el nom de VMTurbo a Turbonomic, suposo que és més important del que la majoria de la gent s’adona.

Ben Nye: Absolutament. En primer lloc, la definició de autonòmic, quan s'aplica a la informàtica, està al voltant de sistemes que poden autogestionar-se, autoorganitzar-se.

Així que penseu en les xarxes bayesianes, penseu en algorismes de cerca, penseu en dades grans, que ara la gent diu "aprenentatge profund". Són formes d’intel·ligència artificial. El que crec que és més interessant sobre Turbonomic és que és la forma definitiva d’intel·ligència artificial perquè les càrregues de treball de l’aplicació prenen decisions de forma autònoma en programari sobre quins elements d’infraestructura haurien d’executar i quan s’han de moure, dimensionar-se, començar i parar-se, clonar-se. Això és realment, realment interessant, i ho fem aprofitant l’abstracció i la liquiditat que es pot oferir mitjançant virtualització, contenidors o núvols.

Aleshores, tenint una abstracció similar de totes les diferents formes de demandes, de manera que pugueu tenir els VM, tenir els contenidors, tenir les JVM, estem mirant totes aquestes formes de demanda i totes aquestes formes de subministrament i se n’extreuen. Per tant, anem a deixar la demanda i, a continuació, coincidim amb l’oferta. I llavors si són en un amfitrió físic i comença a congestionar-se, en lloc de començar a deixar-lo fallar i generar una alerta i tenir l'aplicació, ja ho sabeu, per què no simplement permetre que es prengui la decisió de moure's. en si? Sempre que tingueu un preu en la vostra decisió (la mudança i el cost del retorn), aleshores podeu prendre decisions d’assignació de recursos molt més interessants.

Techopedia: M'encanta l'analogia de l'oferta i la demanda. En teoria econòmica, les fonts d’oferta s’arreglen a curt termini i només poden canviar durant un llarg període de temps. En el que estàs descrivint, si manteniu aquesta analogia econòmica, canvieu tot el paradigma. És a dir, podeu canviar d’oferta a curt termini, oi? Tens una flexibilitat completa per ser més eficaç i, pensant en la utilització dels recursos com a mercat, tens un mercat gairebé eficient en temps real?

Ben Nye: Teniu tota la raó. Es tracta d’un model econòmic que es converteix en el principi al voltant del qual la demanda troba oferta, però que la gestió de les TI es basa en els principis econòmics. I com va dir John Maynard Keynes, "A la llarga estem tots morts".

Techopedia: No crec que hagueu topat amb cap CIO en aquest moment que no s'hagi mogut o que no tingui en compte seriosament una mesura per posar més recursos al núvol. Cap a on veieu la indústria en els propers anys?

Ben Nye: Crec que veureu diversos canvis. Està bastant clar que no serà una replatformació completa de la tecnologia. De la mateixa manera que el fotograma principal encara hi és aquí, no crec que mai veieu un format de replicació 100%. Molt probablement veureu un món híbrid. Tindreu privats i públics, però crec que públic seria un núvol públic multi-núvol, no un núvol públic públic. A la vista dels jugadors més grans aquí només n’hi ha un bon grapat. Però quan aneu a Europa o a la resta del món, veieu molts operadors que també són núvols i, per tant, no crec que sigui un salt important, oi? La veritable pregunta, però, és com pot ser que els clients facin els núvols adequats per a la seva càrrega de treball? La nostra teoria darrere de l’empresa és que qualsevol càrrega de treball hauria de ser capaç de continuar qualsevol infraestructura, on sigui. Significat pre-prem o desactivat i en qualsevol moment perquè, recordeu, el temps és suposat per a la demanda.

Per tant, quan canviï la demanda, potser voldreu fer brots al núvol. O si traslladeu aquestes càrregues de treball al núvol de manera permanent, quines càrregues de treball heu de retirar? Perquè ara teniu capacitat al vostre centre de dades. Per què pagar dues vegades? Així, una de les coses que fem avui juntament amb Verizon Intelligent Cloud Control, però també amb altres entorns, és permetre als clients fonamentar la seva decisió sobre on executar aquestes càrregues de treball, no només pel preu perquè el preu us pot bloquejar, sinó també més important. sobre el rendiment de l'aplicació. Aleshores, podeu tenir altres consideracions com ara el preu, el compliment o la sobirania de les dades o la seguretat i altres recursos que són només recursos bàsicament comercials en aquest mercat que us estem descrivint.

Techopedia: Aquest és el model econòmic?

Ben Nye: Sí. Per tant, tot torna al model econòmic. Només cal pensar en com és de lògic. No és només una analogia, per cert, sinó el funcionament del model. Les càrregues de treball tenen un pressupost i les càrregues de treball tenen en compte la teoria i la congestió de les cues, i per tant, està molt més expandida. No és un augment lineal del preu quan comença a congestionar-se; puja de manera exponencial obligant a afectar el pressupost i, per tant, la càrrega de treball per prendre una decisió de moviment.

Sempre que hàgiu abstret totes les complexitats del centre de dades, ara podeu canviar IOPS d’una caixa XtremIO, una caixa d’emmagatzematge pur i una caixa Compellent i una caixa 3Par, ja que totes tenen diferents característiques IOPS, però l’aplicació pot Per tant, compra aquests recursos a la seva elecció. No és diferent que mirar CPU o vCPU, MEM o vMEM, oi? Totes són comerciables, per la qual cosa hauria de córrer aquí o aquí? No importa. La mercaderia comuna aquí és el subministrament d’infraestructures.

La mercaderia comuna aquí és el subministrament d’infraestructura i la raó que té importància és: faré servir una analogia - si recordeu

el 1978 vam desregular les companyies aèries. Abans, tots els seients eren els mateixos, els posàvem tots els preus i, tot i que era lògic, no era correcte, ja que, per la banda del consum, es diferenciava molt la voluntat de pagar. Per tant, els seients eren una mercaderia, però canviant l’atenció a la demanda, el preu per seient –tot i que els seients fossin els mateixos–, podríeu constatar la voluntat de pagar diferent. El que vam fer és que vam agafar el recurs que representava la mercaderia comuna, la vam publicar a la xarxa: primer va ser Saber i Apollo, però després es va convertir en Travelocity, Kayak i Priceline.

Tot d’una, quan deixeu que la demanda recollís l’oferta, veieu que tota la indústria va canviar. Els factors de càrrega van augmentar, però el cost del vol va disminuir i es va modernitzar tota la infraestructura aèria que tenim en aquest país. Va ser un gran avenç. Ah, i per cert, si ens fixem en Priceline, val ara 70.000 milions de dòlars. Això és més que qualsevol companyia aèria i no tenen un avió.

Techopedia: Interessant. Mai no ho he pensat així ...

Ben Nye: No tenen un avió, no tenen una porta, no tenen un seient, no utilitzen un pilot, oi? I després dius: “Però, quins altres exemples tenim d’economia centrada en l’oferta?” Canviem. Els hotels estan basats en l’oferta, no? Teniu un hotel, no el podeu moure. Teniu aquestes habitacions. però, com penseu les habitacions? Alhora, Hotels.com, Expedia i Travelclick, etc. I el mateix va passar. Consulteu restaurants i teniu OpenTable. Mireu Pàgines Grogues. Veieu els anuncis classificats als diaris i foren substituïts per eBay o Craigslist.

Un dels exemples preferits és Uber. Si passegeu per una ciutat, veureu una línia de taxi que espera gent i, després, aneu a una altra part de la mateixa ciutat i hi haurà una línia de gent que espera els taxis. I penses, això no pot ser correcte. A continuació, arriba Uber, que utilitza el telèfon intel·ligent per permetre el subministrament de la demanda. Ara, amb Uber, teniu el 90% de la demanda en 10 minuts, mentre que, al món dels taxis, el 90% de la demanda no es compleix en els deu minuts i, per això, l’última ronda d’Uber va ser de 62 mil milions de dòlars. I recordeu, no tenen ni un taxi ni un cotxe.

Techopedia: Aleshores, en un centre de dades típic, fem essencialment el mateix que transportar un taxi, no?

Ben Nye: Penseu-hi d'aquesta manera: Les càrregues de treball són del pressupost, perquè és per això que hem creat el centre de dades. Per tant, són els vostres humans efectivament en aquest exemple. Aleshores tinc aquest recurs, aquest recurs comú, tot plegat abstracte. Es diu subministrament i es pot trobar a tot arreu, tot per sota de les necessitats de l’aplicació, des de l’entorn del servidor i l’ordinador fins a la xarxa, fins a l’emmagatzematge. Ara el que volem és assegurar-nos que es tracta d’un mercat eficient. Per tant, els titulars del pressupost han de poder actuar de forma autònoma, és a dir, de manera autònoma i en temps real donada la quantitat de canvi de la demanda en la càrrega de treball o, en aquest cas, en l'aplicació. És per això que és molt analògic a la demanda de cerca d’oferta. Amb aquest sistema, obteniu un rendiment molt millor de l’aplicació perquè no espereu en un coll d’ampolla de mà d’obra humana per respondre a una alerta generada per màquina per prendre una decisió de cura i alimentació de l’aplicació. En lloc de fer-ho en temps real. I ho fas a escala perquè aquestes institucions, aquests clients, executen milers d’aplicacions al dia i han de fer-ho.

Per tant, en primer lloc obtindreu una experiència de rendiment molt millor. A més, no teniu persones que passin els dies fent-se. En canvi, tornaran a ser pensadors i no solament reben alertes generades per màquina, sinó que pensen en què poden ajudar els negocis. Estan pensant en l'estratègia de micro serveis i l'estratègia híbrida i multi-núvol i en xarxes i funcions de xarxa i virtualització definides pel programari, tot això que avancen el negoci i els treuen del món de l'aplicació de solucions de reparació i de l'alimentació, o alerta que respon.

En realitat estem trobant que entre el 40% i el 60% del capital del centre de dades s’ha excedit de provisió i podem permetre’ns una gran quantitat que es pugui reapropiar, per tant, evitant la compra de maquinari nou, o que s’encomani i la raó que tant importa és -

Techopedia: Ho sento, deixa'm comprovar això, un 40-60%? Ho sento, aquest número és sorprenent.

Ben Nye: Sí. I el que és més important és que el 14% de l’electricitat d’aquest país es consumeix en centres de dades.

Techopedia: Per tant, podríem estalviar un 5-8% del consum elèctric íntegre del país si no poguéssim sobreexplotar els nostres centres de dades?

Ben Nye: Permeteu-me donar una còpia de seguretat per explicar-vos per què, d'acord? Es remunta al món d’una economia basada en l’oferta. Primer, quan teniu una aplicació nova i publiqueu una botiga d’informàtica, com la mida?

Techopedia: Sí, aneu a l’arquitecte i ho suposen, no? I després esperen fins que es trenqui.

Ben: Exactament. Vés a la línia de negoci i manté una conversa i no saben res que no saps. Així que endevineu i endevineu, i junts intentem endevinar quina ha de ser la mida.

Per tant, vau assignar quatre o vuit VCPU. Ara, el que és interessant és que l'assignació inclogui un peu físic o el peu virtual en un servidor físic. Cada vegada que una sol·licitud prové d'aquesta aplicació, es farà una cua de quatre o vuit VCPU. Es tracta essencialment d’anar a un restaurant i dir que ets una festa de quatre o vuit, tot i que només pot ser una festa d’un. No sereu mai asseguts.

Ens assimilem amb excés, i això significa que obtenim el pitjor rendiment i que és molt car. Aquest és el problema número u. El problema número dos és que ara no podeu dimensionar amb precisió l’aplicació, la qual cosa planteja la pregunta: com es pot col·locar si no es pot dimensionar?

Torneu a endevinar. D’acord, així que ara endevinem la primera cosa, endevinem la segona cosa, hi ha això que es diu VM sprawl o una màquina virtual sense exigència. Es deixa en el seu estat en lloc de ser eliminat i que també reserva el maquinari. Aleshores, el que fem és intentar unir totes aquestes coses en un model de capacitat històrica basat en humans i perquè només funcionem una o dues vegades a l'any, hem de construir una altra tanca, de manera que es parlava d'un 20-30%. cobertura perquè la demanda potser augmentarà en totes aquestes aplicacions i, després, anem a "tancar el clúster", perquè considerarem que aquest grup d'amfitrions està "ple". Allà ja teniu bloquejat fins a la meitat de la capacitat del vostre centre de dades i teniu un subministrament excessiu.

Techopedia: És com si us hagués configurat amb un error, com si no hi ha cap manera possible en l'antic paradigma de no haver-hi un subministrament o no tenir un programa de distribució ...

Ben Nye: Si el que només veus i gestiona és el subministrament d’infraestructura, com en el món saps si tens prou oferta per ser resistent si no ho veus i ho entens i que en temps real hi ha la demanda? Si tot el que veus és subministrament, com saps si en tens prou? Com saps si en tens massa?

Techopedia: Bé, probablement contracteu uns quants caps més per endevinar-ne més. Esteu gastant més diners per investigar aquest problema, no?

Ben Nye: I encara acabes fonamentalment sobre-subministrat segons l’ordre, truqueu-lo a la meitat i compreu maquinari innecessàriament. Tot el concepte que hi havia darrere de la virtualització en la seva primera instantània era en lloc de tenir una pila de maquinari dedicada per a cada aplicació, podré moure aquestes càrregues de treball entre piles dedicades i, per tant, tota la idea era subministrar maquinari. a la mitjana dels cims en lloc de la suma de les màximes de tot el capital de maquinari.

Tanmateix, quan ara feu un control autònom en temps real, control de rendiment, el costat de consum de la màquina virtual o contenidor o núvol, i us sembla el mateix; Què fem? Sortim i fem estrès de prova a cada aplicació i n’hi ha milers (hi ha entre centenars i milers d’aplicacions en un entorn segons la mida del client) i, per tant, fem proves d’estrès per a CPU, per a vCPU, per a MEM, per vMEM i així tots els diferents elements o recursos, no? A continuació, tornem a proveir-nos en funció de la suma dels pics de nou. La diferència és que si no teniu un retard o un coll d’ampolla associats a la mà d’obra i ara podeu proporcionar la mitjana dels cims, suposa què podem fer? Podem gestionar aquest entorn de manera activa perquè totes les aplicacions no ho han vist mai alhora.

Techopedia: Uau. Això és realment tornar a la virtualitat en primer lloc.

Ben: Es tracta de virtualització o containerització 2.0: control de rendiment autònom en temps real.

Techopedia: Per tant, si el vell bucle de correcció de solucions és una forma obsoleta de pensar, com s'explica això al tipus mitjà de primera línia?

Ben Nye: Permeteu-me fer una pregunta senzilla: Per què fa un monitor?

Techopedia: Voleu saber què està malament o quan alguna cosa va malament, oi?

Ben Nye: D'ACORD. Sí. Voleu saber quan es trenca. Però, per què voleu deixar-lo trencar? Aquesta és tota la pregunta. Mireu, inevitablement haureu de fer un seguiment d'algunes divisions o parts del vostre centre de dades, però fonamentalment, si puc assegurar que les meves aplicacions funcionen de manera eficient en el que anomenem estat desitjat, és la quantitat adequada de recursos per suporteu-los en temps real, és un món molt millor que esperar el seguiment i les alertes i intentar respondre a això.

Quan la virtualització va donar lloc als centres de dades definits pel programari, va ser un avenç realment interessant, però van fer un pas massa lluny perquè es van anomenar el sistema operatiu del centre de dades del futur i estava directament des del quadre, oi? Però si realment aneu a buscar les cinc coses que suposa fer un sistema operatiu, el primer és la gestió del rendiment. Per tant, deixeu-me que us pregunti, un hipervisor fa gestió de rendiment?

Techopedia: És clar que no.

Ben Nye: No. Aleshores, el segon que ha de fer és l'assignació de recursos. Llavors, l’hipervisor fa assignació de recursos? No.

Què passa amb la programació de treballs? Què passa amb les reserves? Què passa amb la planificació? No, no, i no. De manera sobtada, t’adones de la manera en què ho han aconseguit, és que generen alertes i el nombre d’alertes creix i creix a mesura que utilitzem els recursos a un nivell més alt, però també a mesura que creem més aplicacions i més formes de càrrega de treball i més llocs. en què poden córrer. De cop i volta, estem aixafant la gent amb totes aquestes alertes.

Però el més important és que el que fem fent que els humans perseguim aquestes alertes s'estan convertint la gent als sistemes operatius dels centres de dades moderns i això és estrany perquè, segons resulta, la gent dorm. La gent té famílies, la gent pren vacances i, per tant, la gent no pot ser sistema operatiu i és per això que hem fet és que hem creat aquest sistema de control de rendiment de l'aplicació, Turbonomic, per poder fer exactament aquestes cinc coses. Estem d’acord que l’hipervisor és un gran invent i contenidors i núvols, però els considerem proveïdors de liquiditat; no són un sistema operatiu. La resta del sistema operatiu prové de tenir un sistema de control de rendiment de l'aplicació. Fa aquestes coses, fa gestió de rendiment, assignació de recursos, programació de treballs, reserves i planificació, tot això és el que tenim. És per això que existim al mercat.

Techopedia: Digueu-me quin és el paper que creieu l’aprenentatge automàtic o l’IA en els pròxims, ja sabeu, de dos a cinc anys? Com canvia Turbonomic amb IA el centre de dades?

Ben Nye: Hi ha algunes referències interessants i increïbles que es poden fer en tot tipus d’ambients diferents. Diria que el que feien és molt més precís que això. Recordeu que un dels problemes amb grans conjunts de dades grans és que necessiteu temps per desenvolupar aquestes dades i, a continuació, per correlacionar-les i obtenir les inferències sobre aquestes dades.

De vegades, obtindreu una inferència errònia i és molt difícil saber el temps que triga el conjunt de dades gran per obtenir aquesta inferència, ja sigui correcta o incorrecta. Al final, la seva forma endarrerida amb un humà o alguna forma de component de treball estàtic humà per prendre una acció real. En el nostre cas, es tracta d’intel·ligència autònoma. No només la seva intel·ligència artificial i aquestes càrregues de treball estan realment prenent decisions per si mateixes en el model, sinó que ho esteu fent amb un grau de precisió. És molt superior al que es pot fer amb un conjunt de dades de dades senzilles.

Techopedia: Si podríeu deixar-ne un amb l'administrador mitjà del sistema, o l'arquitecte mitjà del centre de dades, o el CIO mitjà, on hauran de ser els propers anys o dos anys següents? Què és que la gent no s'adona ara que necessita saber sobre els anys 2017, 2018 i posteriors?

Ben Nye: Crec que el més important és recordar per què vam entrar en l’àmbit tecnològic; perquè som fonamentalment curiosos i volem permetre que l’economia dels Estats Units (o qualsevol economia) faci més coses amb menys. Així és com les empreses funcionen i funcionen. No es pot encertar amb l’enfocament d’ahir d’un model basat en assignació o en oferta, quan ens requereix que siguem a l’ordre d’aprovisionar-se aproximadament del 50% i en un món d’aplicacions de reparació, i cap a on hem convertit el nostre mà d’obra des dels pensadors fins als practicants.

Hi ha una manera millor. La millor manera és abastar noves idees i noves tecnologies de nous proveïdors que us permetin mirar el costat de la demanda de l’equació, el costat del consum d’una VM, d’un contenidor, d’un núvol i de funcionar amb més eficàcia a més escala, amb mà d’obra més intel·ligent i millors eficiències al vostre capital, i flexibilitat en termes d’agilitat i resiliència a les vostres operacions ..

És per això que vaig trobar aquesta oportunitat tan convincent que vaig voler executar-la i per què hi crec tan plenament.

Si voleu una plataforma de control d'aplicació de rendiment d'aplicacions Turbonomic gratuïta, podeu descarregar-la aquí.