Endavant Momentum: Avançar relacional més enllà del tradicional

Emportar: L’amfitrió Eric Kavanaugh parla de les novetats en la tecnologia de bases de dades amb els experts Dez Blanchfield, Robin Bloor i Bert Scalzo.

Actualment no teniu la sessió iniciada. Inicieu la sessió o registreu-vos per veure el vídeo.

Eric Kavanagh: Senyores i senyors, és dimecres, a les quatre de l'est. Sóc a Nova Orleans, l’estiu s’acosta, vol dir que fa calor És el moment de Hot Technologies, sí, de fet, sí. Em dic Eric Kavanagh, seré el vostre amfitrió. Vaig a donar la pilota aquí per Hot Technologies. El tema d'avui és "Endavant Momentum: Moving Relational Beyond tradizional". Persones actuals, tenim tres experts en bases de dades al telèfon, de manera que les preguntes que tingueu, les més dures, no seran tímides. Avui us oferim un munt de bons continguts. Hi ha un lloc sobre el vostre veritablement, prou sobre mi. Per descomptat, aquest any fa calor. Parlem de tecnologies calentes en aquest saló, que és una col·laboració amb els nostres amics de Techopedia. I anem tot seguit fins al fonament de la gestió de la informació que, per descomptat, és la base de dades. Parlarem de com hem arribat fins aquí, de què passa avui, i de què passa? Hi ha moltes coses molt interessants.

Evidentment, tenim una seriosa innovació en l’espai de bases de dades. Va estar una estona tranquil·la; si parleu amb alguns analistes del negoci, diria que probablement des de l'any com el 2005 fins al 2009 o el '10 'no semblaria que passés massa a la innovació.De sobte, només va esclatar, com un jailbreak o alguna cosa, i ara estan passant tot tipus de coses interessants. Molt d’això es deu a l’escala de la web i a totes les excel·lents propietats web que fan diferents coses interessants. D’aquí va sorgir el concepte NoSQL. I això vol dir dues coses diferents: no vol dir SQL, ja que no és compatible amb SQL, sinó que no només és SQL. Hi ha un terme "NewSQL" que han utilitzat algunes persones. Però, òbviament, el llenguatge de SQL –el llenguatge de consulta estructurada– és realment el fonament, és la base de la consulta.

I és interessant que tots aquests motors NoSQL, què va passar? Bé, van sortir, hi havia molta il·lusió, i uns quants anys després, què vam començar a sentir? Oh, SQL a Hadoop. Doncs bé, totes aquestes empreses van començar a escorcollar les interfícies SQL a les seves eines NoSQL, i qualsevol que estigui al món de la programació sap que això comportarà alguns reptes i algunes dificultats, i alguns cables creuats, etc. Així que avui descobrirem moltes coses sobre aquestes coses.

Hi ha els tres presentadors: hem rebut a Dez Blanchfield una trucada de Sydney, el nostre propi Robin Bloor, que és a Texas, i també Bert Scalzo, també a Texas. Aleshores, primer de tot, escoltarem a Dez Blanchfield. Persones populars, anirem a tuitejar el hashtag de #HotTech, així que no dubteu en els vostres comentaris o les vostres preguntes a través del component de Q&A de la consola de transmissió web o fins i tot a través de la finestra de xat. I amb això, Dez Blanchfield, treu-ho.

Dez Blanchfield: Gràcies, Eric. Hola a tothom. Així doncs, vaig a intentar fixar l'escena en un punt de vista de 30.000 peus de tipus d'allò que ha passat en l'última dècada i els canvis importants que hem vist, o almenys una dècada i mitja, de totes maneres. els sistemes de gestió de bases de dades i alguns dels impactes des del punt de vista comercial o tècnic i algunes de les tendències que hem suportat fins a finalitats i ens condueixen a la conversa que hem de tenir avui al voltant del tema.

La meva imatge de portada aquí és una duna de sorra i hi ha un vent que bufa petites parts de sorra a la part superior d'ella. Com a resultat d'això, el que passa és que la duna de sorra camina lentament d'un espai a un altre. I és un fenomen sorprenent, on aquestes masses muntanyes de sorra de 40 i 50 peus d'altura, efectivament, es mouen. I es mouen molt lentament, però es mouen segurament i, a mesura que es mouen, canvien el paisatge. I cal observar si passa alguna estona en una zona on les dunes són cosa natural. Perquè un dia podeu mirar per la finestra i adonar-vos que aquesta muntanya massiva de sorra, petits grans petits s’han mogut tot sol, en efecte, i que el vent la mou lentament d’un lloc a l’altre.

I crec que de moltes maneres, aquest és el món dels sistemes de bases de dades des de fa temps. Fins fa molt, molt recentment, aquell canvi molt reduït en forma de grans de sorra desplaçava una muntanya gegant de sorra en forma de duna de sorra. Al llarg dels anys, a les plataformes de bases de dades hi ha hagut pocs canvis i ha estat un entorn prou estable i sòlid al voltant dels sistemes i plataformes de bases de dades, a través del fotograma de l'era de gamma mitjana. Però, fins al final, hem tingut algunes coses força significatives a les nostres necessitats comercials i als nostres conductors tècnics. Vaig a visitar-nos.

Tinc la visió que el concepte bàsic d’una base de dades, tal i com el coneixíem durant molts, molts anys i, com heu pogut escoltar en el banter pre-show, els nostres dos experts que avui estan a la trucada van tenir tota la vida aquest espai i tenen tota la raó de compartir els drets de presumptesa d’estar-hi quan tot va començar a principis dels anys 80. Però hem vist aquest canvi massiu durant l’última dècada i una mica i passaré ràpidament abans de lliurar-lo al doctor Robin Bloor.

Passem per això el que jo anomeno, experiència "més gran, millor, més ràpida, més barata". Com he dit, la definició d’una base de dades ha canviat. El paisatge en què les plataformes de bases de dades han hagut de fer front al rendiment i els requisits tècnics i comercials també s’han canviat. Hem vist aquest augment de la demanda de solucions per fer front a requeriments comercials més complexos o a requisits tècnics més complexos. I, per tant, una mirada realment ràpida a través del que això suposa, en realitat, és que vam arribar a fer una classe dels anys 90, i vam veure que la tecnologia de bases de dades va afectar la introducció d’Internet i una mena d’allò que vam anomenar llavors Internet. escala. No parlàvem només de persones que s’asseguessin davant dels terminals, originàriament els agraden els terminals de teletip amb les seves físiques incorporades i 132 columnes de sortir al paper. A continuació, els primers terminals de la pantalla verda, perforant amb els teclats.

Però ja sabeu, el nostre món era terminals i cables en sèrie o en xarxa parlant amb ordinadors durant molt de temps. Aleshores va arribar internet i aquest creixement explosiu de connectivitat que ja no havíeu d’estar connectat a l’ordinador. Per arribar a un sistema de bases de dades només necessitava un navegador web. De manera que la tecnologia de bases de dades va haver de canviar dràsticament, per fer front a l’escala de tot, des de les tecnologies bàsiques dels motors de cerca que s’utilitzaven per indexar el món, i emmagatzemar un índex d’informació, com a exemple de l’escala de format de base de dades. I gent com Google i altres van proporcionar una plataforma per fer-ho. I es van produir tots els nous tipus d’emmagatzematge de bases de dades, la consulta i la indexació. Després vam tenir llocs de música i llocs de pel·lícules.

A la dècada de 2000, es va observar el boom punt-com, i això va produir una explosió encara més dramàtica en el nombre de persones que utilitzaven sistemes que eren alimentats invariablement per una base de dades d'alguna forma. En aquesta fase, les bases de dades relacionals encara cobrien la major part de la càrrega, només les vam posar en un estany més gran i vam passar als sistemes de gamma mitjana, molt, molt grans, que utilitzaven plataformes Unix de persones com IBM i Sun, etc. . El boom dot-com només va fer que les coses fossin més grans i més ràpides des del punt de vista del maquinari, i es van produir alguns canvis importants en els motors de la base de dades, però, per a la millor part, seguia essent el mateix que teníem vist per a una llarg temps.

I aleshores vam aconseguir aquesta era de la web 2.0, com ens referim. Aquest va ser un canvi monstruós, perquè de sobte necessitàvem plataformes de bases de dades molt més senzilles, i hi havia d’haver una escala a una forma horitzontal. I això va suposar un canvi tan important en la manera que ens vam apropar a la idea del que era una base de dades. Segons el meu parer, encara estem al capdavall. I ara tractem tot aquest quagmire, i dic que amb un gir positiu, no una connotació negativa, aquest quagmire del que anomenem big data i una enorme explosió, i vull dir explosió. Aquest desplaçament indignant és vertical del gràfic del nombre d’opcions que tenim quan parlem d’una base de dades i d’alguna forma de capacitat de consulta relacional.

I, prou interessant, sóc personalment del parer que crec que les dades grans són només la punta de l’iceberg. Tenim la il·lusió poc de l’impacte de les dades grans i dels tipus d’opcions que tenim disponibles ara. Tenim tot de motors NoSQL, tenim motors gràfics, disposem de tots aquests tipus de plataformes diferents, on podem tirar dades i fer coses. Fins i tot fins al punt que, de fet, una de les primeres converses que vaig mantenir amb Eric Kavanagh, que avui està aquí amb nosaltres, va estar al voltant d’una conversa relacionada amb una cosa anomenada Apache Drill, que és un projecte de codi obert que permet consultar. les dades del model de diferents tipus de dades: tot, des de fitxers CSE en brut que es troben en un disc dur, passant per sistemes de fitxers HDFS a escala de petabyte. I ja ho sabeu, us permet fer aquestes consultes a l'estil SQL de dades estructurades i no estructurades de tot tipus de plantes emocionants.

Estem a punt de veure que "edifici intel·ligent" es converteix en una cosa i ens agradaria pensar que tenim edificis intel·ligents de seguretat i gestió de calor, però estic parlant d'edificis intel·ligents que saben molt més sobre qui ets i on esteu quan entreu i feu tot tipus de coses netes a aquest nivell, passant per ciutats intel·ligents (ecosistemes sencers a nivell de ciutat) que sàpiguen fer les coses de manera intel·ligent. I, més enllà d’això, hem obtingut aquesta cosa increïble que no crec que ningú del món hagi entès de ple, i que sigui la forma d’Internet de les coses. Hi ha hagut tots aquests canvis diferents durant la darrera dècada i una mica, potser dues dècades aproximadament, si ho completem, han afectat al món allò que considerem bases de dades.

Hi ha hagut un parell de coses significatives que ho han fet possible. El cost dels discs durs s’ha reduït de forma espectacular i, en molts aspectes, és el que ha permès conduir algunes de les arquitectures de referència com el model Hadoop, ja que agafem moltes dades i les difonem en molts discs durs i fer coses intel·ligents amb ell. I, de fet, el que es va aguditzar, segons el meu parer, de la base de dades relacional o del model tradicional d’unitat de DB. I la RAM va obtenir molt, molt barat, i això ens va oferir una oportunitat totalment nova per jugar amb diferents arquitectures de referència com ara la memòria, i fer coses com ara particionar un volum molt gran de dades.

I això ens va donar aquesta petita imatge que veiem ara, que és un diagrama que mostra els tipus de plataformes disponibles si esteu dins del panorama de dades grans. I és molt difícil de llegir i, per això, hi ha massa informació al respecte. Hi ha moltes opcions de fer, modelar i fabricar formes de posar dades en sistemes de bases de dades de qualsevol forma i consultar-les i fer les tradicionals lectures. I no tots compleixen, de fet, molt pocs, fins i tot, compleixen qualsevol estàndard d'estil bàsic, però es consideren una base de dades. I us mostraré un parell de pantalles en un segon per donar-vos una mica de connexió al voltant del que vull dir amb el pas dels anys 90 i l'escala d'Internet, a la web 2.0, i tot seguit al creixement a través de dades grans. Si pensem que aquest gràfic de paisatge de tecnologia de dades gran és emocionant, perquè hi ha moltes opcions, només fem una ullada a una de les claus verticals.

Vegem la tecnologia de màrqueting. A continuació, es mostren les opcions per als sistemes de gestió de bases de dades o la gestió de dades només dins de l’espai mar-tech, de manera que la tecnologia relacionada amb el màrqueting. Ara era el 2011, per tant fa uns anys; fa cinc anys, això era el que semblava el paisatge. Si només torno a fer una diapositiva breument, aquest és el aspecte actual del panorama actual de les diferents marques i ofertes que tenim en tecnologies de bases de dades. Això és el que semblava vertical fa cinc anys, només en tecnologia de màrqueting.

Ara, si vaig a la visió d’avui, és el que sembla, i és completament impenetrable. Només per aquest tipus de marques i opcions, milers i milers de combinacions de programari que es consideren a la classe de bases de dades poden capturar, crear o emmagatzemar i recuperar dades de diverses formes. I crec que ara entrem en un moment molt, molt interessant i valent, on abans hi podríeu conèixer les grans marques, podríeu conèixer les cinc o sis plataformes diferents d'Oracle i Informix, DB2, etc., i ser gairebé un expert en totes les marques disponibles fa uns vint anys. Fa deu anys, es va fer una mica més fàcil perquè algunes de les marques van caure i no totes les marques van poder fer front a la magnitud del boom punt-com, i algunes empreses només es van trencar.

Avui és absolutament impossible ser expert en tota la tecnologia de bases de dades existent, ja sigui en bases de dades relacionals o en plataformes de gestió de bases de dades estàndard que hem conegut durant les últimes dues dècades. O potser el cas, els motors més moderns com Neo4j i d’aquest tipus. Així doncs, crec que estem entrant en un món molt valent, on hi ha moltes opcions disponibles i que ara tenim plataformes a escala, ja sigui a la memòria o al disc. Però crec que és un moment difícil per als responsables de la tecnologia i els negocis, perquè necessiten prendre decisions molt grans sobre piles tecnològiques, que en alguns casos només han estat durant uns mesos essencialment. L'edat de divuit mesos no és una cosa espantosa per a algunes de les plataformes de bases de dades de codi obert més interessants i noves. I comencen a fusionar plataformes i es tornen encara més noves i emocionants.

Crec que avui tindrem una gran conversa sobre com ha afectat tot això a les plataformes tradicionals de bases de dades i com s’hi responen i als tipus de tecnologies que s’hi estan llançant. I amb això en compte, passaré ara al doctor Robin Bloor i explicaré els seus coneixements. Robin, a sobre.

Robin Bloor: D'acord, gràcies per això. Sí, aquest és un tema massa gran. Vull dir, si només prengueu una tirada d’una de les il·lustracions que Dez acabava mostrant, podríeu mantenir una conversa llarga sobre una de les fulles. Però ja sabeu, podeu anar a una base de dades. He estat buscant bases de dades, no ho sé des de la dècada de 1980, i podeu mirar la base de dades de maneres diferents. I una de les coses que pensava que faria, només llançar-me a la conversa avui, era parlar de la raó per la qual han ocorregut coses pertorbadores a nivell de maquinari. I heu de tenir en compte, també han passat moltes coses pertorbadores a nivell de programari, de manera que aquesta no és la imatge completa de res, només és una cosa de maquinari.

Tampoc vaig a parlar gaire, només volia donar-vos la imatge del maquinari. Una base de dades era la capacitat de recuperació de dades que abasta la CPU, la memòria i el disc, i que està canviant notablement. I la raó per la qual dic això, és que vaig aprendre a comprendre la base de dades des de la perspectiva del que realment vau fer. Ja sabeu, hi ha una diferència de latència entre les dades realment de la CPU i les dades que es treuen de la memòria a la CPU i les dades que es treuen del disc a la memòria i de la CPU. I les antigues arquitectures de bases de dades només intentaven equilibrar-ho. Ja sabeu, deien: "Bé, això va molt lent, caché les dades del disc perquè quedin a la memòria. Intentarem fer-ho d’una manera realment precisa de manera que una bona part de les dades que sol·licitem ja quedi a la memòria. I marcarem les dades a la CPU tan ràpidament com realment puguem. "

I les bases de dades es van escriure a les antigues màquines s’escriuen per a petits clústers. I ara, per l’ignorant del paral·lelisme. Perquè si treureu un rendiment fora d’un clúster, haureu de fer diverses coses en paral·lel. El paral·lelisme és una part del joc, res semblant a la forma actual. Només recorreré el que ha passat.

En primer lloc, el disc. Doncs s’ha acabat el disc, de veritat. Ha estat pràcticament acabat pel que fa a bases de dades Crec que hi ha diversos consells per arxivar dades, i fins i tot llacs de dades molt grans que s’executen a Hadoop, el pitjor disc de filar és probablement viable avui dia. El problema del disc girant realment era que la velocitat de lectura no millorava especialment. I quan la CPU va anar augmentant la velocitat de la llei de Moore, un tipus d’ordre de magnitud, cada sis anys més ràpid. I la memòria va seguir com a conseqüència, llavors aquests dos van mantenir raonablement el ritme entre ells, no va ser del tot suau, però sí.

Però la lectura aleatòria a un disc on el cap vola sobre el disc, vull dir que, a part de qualsevol altra cosa, és un moviment físic. I si feu lectures aleatòries d’un disc, és molt lent en comparació amb la lectura de la memòria, és com 100.000 vegades més lent. I fa relativament poc, la majoria de les arquitectures de bases de dades que he vist en qualsevol profunditat només han estat llegint en sèrie des dels discos. Realment voleu, d’una manera o altra, emmagatzemar la memòria cau del màxim possible del disc i traure’l del dispositiu lent i posar-lo a un dispositiu ràpid. I hi ha moltes coses intel·ligents que podeu fer amb això, però ha acabat.

I els discos d’estat sòlid, o unitats flash, realment, és el que són, substitueixen molt ràpidament el disc de filatura. I això canvia de nou completament, perquè la forma d’organitzar les dades en un disc està organitzada segons la forma de funcionament del disc. Es tracta, en realitat, d’un cap que es mou per una superfície de filar, en realitat de diversos caps que es mouen per diverses superfícies de filar i de recollir les dades a mesura que passen. Una unitat d’estat sòlid és només un bloc de coses que podeu llegir. Vull dir, el primer és que totes les bases de dades tradicionals han estat dissenyades per a filar disc, i ara se’ls reelabora per SSD. Probablement les noves bases de dades poden ser probables: qualsevol persona que estigui escrivint una nova base de dades ara pot ignorar el disc de filatura, no pensar-hi en absolut. Però Samsung, el principal fabricant de discs SSD, ens diu que les SSD estan realment a la corba de la llei de Moore.

Ja crec, unes tres o quatre vegades més ràpides que filant el disc, però ara seran molt més ràpids cada 18 mesos, bàsicament. El doble de velocitat i la velocitat de deu vegades fins a uns sis anys. Però, però, no ho és, com ho diré en un moment. El disc de filatura, per descomptat, s'està convertint en un mitjà d'arxiu.

Quant a la memòria. Primeres coses primer, RAM. La relació de CPU entre RAM per CPU acaba d’augmentar tot el temps. I, per descomptat, en certa manera, proporciona molta més velocitat, perquè les memòries que es poden tenir ara poden emmagatzemar molt més. En realitat això és que redueix la pressió sobre les aplicacions MLTP o les aplicacions de lectura aleatòria, perquè és més fàcil atendre-les, ja que ara teniu molta memòria i, d'aquesta manera, podeu emmagatzemar en memòria cau qualsevol cosa. és probable que es pugui llegir a la memòria. Però teniu problemes amb un munt de dades més gran, de manera que les dades grans en realitat no són tan senzilles.

I després tenim Intel amb 3D Xpoint, i IBM amb el que anomenen PCM, que és memòria de canvi de fase, estan oferint una cosa que creuen que és, bé, és almenys 10 vegades més ràpida que els SSD actuals, i creuen que obtindrà. molt a prop de tenir la mateixa velocitat que la RAM. I, per descomptat, és menys costós. Abans, teníeu aquesta estructura de base de dades de CPU, memòria i disc, i ara ens dirigim cap a una estructura que té quatre capes. Tenen CPU, memòria o memòria RAM, i després aquest tipus de memòria més ràpida que SSD, que no és volàtil, i després SSD. I aquestes noves tecnologies no són volàtils.

I hi ha el memristor d'HP, que encara no ho és, perquè ja es va anunciar fa uns set anys, però encara no apareix. Però els rumors que sento és que HP també canviarà el joc una mica amb un memristor, de manera que només tindreu una nova situació de memòria. No és com si haguéssim obtingut coses més ràpides, com si tinguéssim una capa totalment nova. I llavors hem aconseguit que l'accés SSD, es pot llegir en paral·lel. No podeu llegir el disc de filatura en paral·lel, tret que tingueu molts discs giratoris diferents. Però, un bloc de disc SSD, es pot llegir en paral·lel. I perquè podeu llegir-ho en paral·lel, va molt més ràpid que les seves velocitats de lectura senzilles, si realment configureu diversos processos a través dels diversos processos d’una sola CPU i només teniu amb SSD.

S’estima que podeu fer gairebé fins a velocitats de RAM. I tot el que està dient, el futur de l’arquitectura de la memòria no està clar. Vull dir, la realitat és que els diferents venedors dominants, que siguin els que siguin, probablement determinaran la direcció del maquinari. Però ningú no sap on va en aquest moment. He parlat amb alguns enginyers de bases de dades que diuen: "No tinc por del que passa", però no saben com optimitzar-ho a partir del primer moment. I sempre ho heu fet, així que és interessant.

I després hi ha la CPU. Bé, les CPU multicore no són només CPU multicor. També tenim volums significatius de memòria cau L1, L2 i L3, en particular L3, que fins a, no sé, desenes de megabytes. Podeu posar-hi molt, ja ho sabeu. I, per tant, realment podeu utilitzar el xip com a mitjà d’emmagatzematge en memòria cau. Així que això va canviar el joc. I, certament, el processament de vector i la compressió de dades, diversos proveïdors ho han fet realment, arrosseguen aquestes coses a la CPU per fer que tot vagi molt més ràpid a la CPU. A continuació, s'obté el fet que, bé, les CPU amb GPU són molt bones per accelerar les analítiques. I realment són molt bones en determinats tipus de consultes, només depèn de quina sigui la vostra consulta.

Podeu crear taulers amb CPUs i GPUs o, com fa AMD en aquest moment, produiu una cosa anomenada APU, que és una mena de matrimoni entre una CPU i una GPU; hi té tots dos tipus de capacitat. Per tant, aquest és un tipus de processador diferent. I el recent anunci d’Intel que anirà a posar un FPGA al xip, aquest tipus de cap em va entrar. Vaig pensar: "Com va a succeir?" Perquè si teniu la possibilitat de CPU, GPU i teniu la possibilitat de CPU, FPGA, i, per cert, si voleu, al mateix tauler podríeu posar una CPU, una GPU i una FPGA. No tinc ni idea de com realitzaria alguna cosa d'aquesta manera, però sé que són empreses que fan coses així, i reben respostes de consulta molt ràpides. No es passa per alt, no és una cosa, això és una cosa que faran servir els venedors establerts i, potser, els venedors nous. Els SGBD sempre eren paral·lels, però ara les possibilitats paral·leles acaben de explotar, perquè això permet paral·lelitzar-ho amb això, amb això, amb això de diverses maneres.

Finalment, escalar o ampliar? Realment augmentar és la millor solució, però per a una cosa. Obteniu un rendiment molt millor del node si només podeu optimitzar absolutament el rendiment de la CPU i la memòria del disc en un mateix node. I fareu servir menys nodes, així que serà més barat, oi? I serà més fàcil de gestionar. Malauradament, és un disseny que depèn del maquinari i, a mesura que el maquinari canvia, és cada vegada menys possible fer-ho, tret que els vostres enginyers puguin funcionar tan ràpidament a mesura que el maquinari canviï. I obteniu problemes de càrrega de treball, ja que quan esteu fent escala, feu diversos supòsits sobre la càrrega de treball que feu.

Si realitzes una escala, és a dir, si la teva arquitectura posa èmfasi en la escala abans de la seva escala, en realitat, has de fer-los tots dos, només en destacaràs un. Aleshores, obtindreu un millor rendiment de xarxa, perquè l'arquitectura s'ocuparà. Serà més car en termes de maquinari perquè hi haurà més nodes, però hi haurà menys problemes de càrrega de treball i hi haurà un disseny més flexible.

I només pensava que ho llençaria, perquè, si realment penses en tots els canvis de maquinari, només vaig apuntar el dit i, després, hi penses, com vas a ampliar i ampliar aquestes coses? Aleshores, t’adones que els enginyers de bases de dades són, al meu parer, com a mínim, ben remunerats. Per tant, si només contempleu la capa de maquinari, els reptes de la base de dades són clars. Ara li transmeto a Bert, que ens farà educar a tots.

Eric Kavanagh: Això és! Bert?

Bert Scalzo: Moltes gràcies. Permetin-me entrar directament en aquestes diapositives. Tinc moltes diapositives per recórrer, així que en puc algunes de les que puc passar més aviat. Parlarem sobre aquest "Moment endavant: moure la relació més enllà del tradicional". Ja no és la base de dades del vostre pare. Les coses han canviat i, com va dir un orador anterior, els darrers sis a set anys, el paisatge ha canviat radicalment.

Jo mateix, faig bases de dades des de mitjan anys 80. Escric llibres sobre Oracle, SQL Server, comparatives i moltes altres coses. “El món canvia molt ràpidament. El gran ja no bategarà als petits. Serà el ràpid batre el lent ”. Vaig afegir“ per adaptar-nos ”. Això era de Rupert Murdoch. Realment crec que això serà cert. No podreu fer coses de bases de dades tal com ho vau fer fa 10, 15, 20 anys. Haureu de fer-ho tal com el negoci ho desitgi ara.

Intentaré mantenir una mica genèric en allò que us presento, però la majoria de les funcions de què parlo les trobareu a Oracle, les trobareu a SQL Server, MySQL, MariaDB i algunes de les altres grans jugadors. La revolució relacional de bases de dades, estic d'acord amb els altaveus anteriors. Si us veieu bé al voltant del 2010, passàvem del cotxe de la cursa vermella al cotxe groc. Es va produir un canvi significatiu i, a prop del 2020, crec que veureu un altre canvi radical. Ens trobem en un moment molt interessant.

Ara, aquesta diapositiva és clau, és per això que hi poso una clau. Hi ha tot aquest canvi, i a la part esquerra tinc tecnologia i, a la part dreta, tinc negoci. I la pregunta és, quina causa la qual, i quina suporta? Tenim tots aquests canvis de maquinari: discs baixant, mida de disc a la pujada, nous tipus de discos, de manera que quedaven coberts pels altaveus anteriors. El preu de la memòria caient, totes aquestes versions més recents de bases de dades. Però, a la banda dreta, tenim protecció i compliment de dades, magatzem de dades, intel·ligència empresarial, analítica, retenció de dades obligatòria. Les dues cares de l’equació es dirigeixen i les dues cares de l’equació faran ús de totes aquestes novetats.

En primer lloc, tenim el nostre disc de filat de SAS típic, ara són fins a 10 terabytes. Si no ho veieu, Western Digital, HGST té el que anomenen unitat d’heli, que puja fins a uns 10 terabytes en aquest moment. Els costos del disc de filatura són força baixos. Com s'ha comentat anteriorment, podeu obtenir discs d'estat sòlid fins a uns dos terabytes, però Samsung tindrà una unitat de 20 terabytes properament. Els costos són cada cop més raonables. Una cosa que parlaré dels altres no ho és, el concepte dels discos flash. PCIe, que és el PCI Express, versus NVMe, potser haureu o no escoltat parlar d'aquesta memòria, que no sigui volàtil. Bàsicament, NVMe substituirà SAS i SATA, i és realment un protocol de comunicació més que qualsevol altra cosa. Però aquests discos són de fins a tres terabytes ara.

També és possible que algunes unitats SAS tinguin ara connectors U.2, que és una mena de connector diferent que un SAS o SATA, que suporta NVMe amb un disc estàndard; el disc també ho ha de suportar. A continuació, SATA amb connectors M.2, i aquests comencen a obtenir NVMe. De fet, hi ha venedors de portàtils que venen quaderns que tenen un disc flash NVMe, i aquestes coses cridaran en comparació amb la tecnologia que abans havíeu utilitzat.

Molta gent no sap què són tots aquests flaixos diferents. Si mireu a la cantonada inferior dreta, aquest és un exemple de M.2. Potser dius: “Bé, gee, s’assembla molt a la unitat de mSATA a l’esquerra.” Però, com es pot veure, té dos forats en els pins que no pas un i és una mica més gran. I, a més, el M.2 pot arribar a tenir tres mides diferents.

A continuació, el flaix PCI Express i el flaix NVMe. Ara, el flash NVMe també és PCI Express, però PCI Express és encara un algorisme de controlador tipus SAS o SATA escrit per a disc de filatura, i NVMe són els algorismes o tècniques que es van escriure específicament per a flaix. I, novament, veureu totes aquestes coses.

NVMe ofereix moltes coses. Crec que les dues millores més importants són que, a la part superior dreta, la latència es redueix fins a un 70 per cent. En realitat ho he vist fins i tot més amunt. A més, si mireu a la cantonada inferior dreta, quan el vostre sistema operatiu parla amb el disc NVMe, passa per molt menys nivells de programari. Bàsicament, aneu a través del controlador NVMe que ara s’inclou amb el sistema operatiu i parla directament amb els mitjans de comunicació. Hi ha moltes raons per les quals aquesta tecnologia canviarà radicalment el món de la base de dades.

I moltes vegades, la gent dirà: "Bé, què tan ràpid és NVMe?" Ja ho sabeu, els bons vells temps, al 2004 i abans, ens emocionàvem si teníem Ultra-320 SCSI, 300 megabytes per segon. Les velocitats actuals, molts de vosaltres probablement sou en fibra o en InfiniBand, i en este tipus de resultats. NVMe allà a la dreta, comença per on acaben les tecnologies actuals. El que estic buscant és: PCI Express 3.0 amb un enllaç de vuit carrils comença a gairebé 8.000, i augmentarà a mesura que obtenim versions més noves de PCI Express, versions quatre i així successivament. NVMe no té lloc enlloc, excepte cap amunt.

Ara, quines coses canvien a la base de dades? Ara a les cantonades de la part superior dreta de les meves diapositives, poso els motius empresarials que crec que apareixia la tecnologia. En aquest cas, a causa del magatzem de dades i per motius normatius de retenció obligatòria de les dades, les bases de dades comencen a oferir compressió. Ara, algunes bases de dades ofereixen compressió com a complement, d'altres ho ofereixen com a integrat a l'estàndard, diguem que l'edició empresarial de la seva base de dades, i, tanmateix, algunes bases de dades, com a Oracle, podrien incloure una versió encara millor de compressió. per exemple, a la seva plataforma Exadata, de manera que realment han creat un maquinari que pot suportar una compressió molt especialitzada i que a Exadata, per exemple, obté una velocitat de compressió de 40x, i per tant és molt significatiu. I crec que és la retenció de dades obligatòria, la gent només vol que sigui més llarga. Les empreses, per fer anàlisis i BI, necessiten els darrers 5, 10, 15 anys de dades.

Ara una altra característica que va començar a aparèixer al voltant d'aquest període de 2008 es va dividir. Un cop més, ho trobareu en bases de dades com Oracle, SQL Server i en les dues que heu de pagar. A Oracle heu de comprar l’opció de particions i a SQL Server heu d’estar a l’edició del centre de dades. És la vostra tècnica tradicional de separar i guanyar. El que fas és que tinguis el concepte d’una taula gran lògica a la part superior i, quan es posa en disc, en realitat es descompon en cubetes. I podeu veure que aquests cubells estan organitzats per uns criteris per separar, normalment referits o anomenats funció de particions i, de la mateixa manera, també podeu sub-particionar-se en algunes plataformes de bases de dades i podeu anar encara més enllà.

De nou, crec que tant l’emmagatzematge de dades com la retenció obligatòria de dades l’han impulsat, i en algunes d’aquestes bases de dades podeu tenir fins a 64.000 particions, i crec que en algunes altres bases de dades fins i tot fins a 64.000 subparticions. Això permet desglossar les vostres dades en peces manejables. També particionareu els índexs; és una opció, no cal, però també podeu repartir els índexs. Una de les raons per fer-ho pot ser que teniu una finestra corredissa de dades. Voleu conservar dades de 10 anys, però per deixar caure els índexs a la càrrega lotada d’aquesta nit, no voldreu haver de deixar caure els índexs a cada fila, només a les files que hi ha a la cubeta actual. El particionar és en realitat una molt bona eina administrativa, tot i que la majoria de la gent creu que el seu gran benefici és suposar l'eliminació de particions als vostres plans i, per tant, agilitar les vostres consultes. Això és realment un tipus de guinda del pastís.

Ara probablement heu sentit a parlar d’aguditzar i probablement pensareu: “Bé, per què heu introduït aquesta diapositiva aquí?” Aquest és un d’aquells NoSQL: aquest és un d’aquests entorns de tipus Hadoop. Oracle 12c en va publicar dos, que no són encara el G8, però que es mostra o es visualitza en previsualització en realitat. Tindreu un sistema de base de dades tradicional com Oracle i podreu eliminar com ho feu el model Hadoop, de manera que tindreu una altra tècnica de divisió i conquesta que us dividirà. Taula en forma de fila en agrupacions per node i això serà com serà el que veieu en algunes de les vostres bases de dades NoSQL. I, en realitat, MySQL, podeu aconseguir-ho bastant amb una de les seves tècniques de agrupament, però s’arriba a una base de dades tradicional i suposo que Microsoft no voldrà deixar-se enrere. Aquests dos juguen saltats entre si tot el temps, així que m'esperaria veure possiblement la següent versió de SQL Server.

Gestió del cicle de vida de dades, de nou retenció obligatòria de dades, però també per a la intel·ligència empresarial i analítica. Realment, es tracta d’una tècnica de divisió i conquesta, i normalment els DBA ho fan manualment, és a dir, “vaig a mantenir les dades d’aquest any en discs ràpids; les dades de l’any passat sobre discs lleugerament més lents, potser vaig conservar els darrers dos anys abans que en discs encara més lents i, a continuació, tindré algun mètode d’arxiu. ”Normalment, ja no es grava, normalment és: teniu algun tipus d’emmagatzematge connectat a la xarxa o algun dispositiu que tingui molts. d’emmagatzematge i és, ja sabeu, rendible, però encara gira en disc.

Així, ara mateix, tant a Oracle com a SQL Server, podeu adquirir una opció on definiu les regles i això només passa automàticament en un segon pla. Ja no heu d’escriure scripts, no heu de fer res. I si heu vist SQL Server 2016, que acaba de sortir el primer de juny, hi ha una nova funció anomenada "Bases de dades estretes" que bàsicament us permet fer-ho a la cantonada inferior dreta allà mateix, podeu passar de diverses capes directament al núvol. I, de nou, es tracta d’una característica que s’incorpora a la base de dades, només dius una cosa així com: “Si les dades tenen més de 365 dies, si us plau, traslladeu-la al núvol i, ja ho sabeu, feu-ho de manera automàtica per a mi.

Aquesta serà una característica fantàstica, de fet estic pensant que pot ser el que veurem en el futur, que és que tindreu bases de dades híbrides on guardeu una mica de locals i alguns al núvol. Abans d'això, la gent pensava: "Ah, ho faré a la premissa o ho faré al núvol". Ara veiem el matrimoni de les dues tecnologies d'aquesta manera híbrida. Crec que això serà bastant gran i Microsoft hi va arribar primer.

La redacció es deu a la protecció i al compliment de les dades. Ara bé, podríem dir ara: "Hola, desenvolupador d'aplicacions, quan el mostreu a l'informe, quan apareix a la pantalla, hi ha algunes coses de seguretat que heu de comprovar i, si us plau, només heu de mostrar les dades se suposa que veuen o emmascaren o redirigeixen les dades que no se suposa que veuen. ”Bé, com és habitual, quan la feu fora cap a l’aplicació no es fa en un lloc, de manera que es fa d’una altra manera o no. No es fa en alguns llocs. Així, ara teniu aquesta capacitat als vostres sistemes de base de dades.

Actualment, a SQL Server 2016, aquesta característica està integrada, de manera que no és un element de cost opcional que encara sigui per afegir al centre de dades. i a Oracle 12 heu de comprar el complement de gestió del seu cicle de vida, però això és nou i és que el negoci el condueix de nou. I sobretot perquè ara conserveu tantes dades i feu la mineria de dades, de manera que la BI i l’analítica, heu de saber qui accedeix a quines dades i us assegureu que només se’ls permet veure què? se'ls permet veure.

Així mateix, reviseu de nou la protecció i el compliment de les dades. Trobareu que ara molts sistemes de bases de dades creen compressió, o ho sento, xifrant directament a la base de dades i el que és important d’aquest xifratge, si mireu la fletxa cap avall i la fletxa cap amunt del diagrama. baixar al disc xifrat i després el llegeix a la memòria i el desxifra. Es tracta, en realitat, d’un model, hi ha un altre model que, ja ho sabeu, ho farà només quan comunica aquestes dades a la xarxa amb l’aplicació client real.

En aquest cas, fins i tot es mantindria en el servidor de bases de dades a la memòria, es pot xifrar i desxifrar només quan se l’envia a l’aplicació client. Hi ha dos models diferents aquí i els trobareu a les bases de dades, i de fet, una de les bases de dades que s’acaba d’afegir recentment va ser MariaDB a la seva versió 10.X; Jo crec que ara són les 10.1 o 10.2. I, realment, vaig fer algunes comparatives sobre aquest xifratge i, per obtenir aquest xifrat, només vaig experimentar un descens del 8 per cent de la velocitat de rendiment o velocitat. En una prova de referència, el xifrat no va causar tant, i per tant és una característica molt útil.

Ara, hem esmentat anteriorment sobre memòria flash i SSDs i coses així. Una de les funcions que teniu a Oracle i SQL Server que molta gent no s’adona és que podeu prendre un flaix o SSD al vostre servidor de bases de dades i que podeu dir a la base de dades: “Utilitzeu-ho com si fossin memòria. Trateu la memòria RAM com a preferència, però pretengueu que això sigui una memòria lenta i utilitzeu-la com a memòria cau estesa. ”Ara a SQL Server 2014 aquesta va sortir i es va anomenar“ Extensió de buffer pool ”, és gratuïta. A Oracle, sortia en 11g R2 i es deia "Base de dades Flash Cache" i també hi era gratuïta.

El meu consell, però, és provar detingudament aquesta funció. Cada vegada que augmenteu la memòria cau quan aneu a fer una cerca, triguen més. Si poseu una targeta flash de tres terabytes i dius a la base de dades: "Afegeix-ho a la vostra memòria", és possible que trobareu que es va retardar alguna cosa a causa del temps per mirar i veure que és en flash, és brut o neta? Hi ha un punt de disminució del retorn. El meu consell és tornar a dur a terme aquesta prova, veure què funciona per a vosaltres, però de nou, és a la base de dades i en el cas d’Oracle, tant a SQL Server com a Oracle, hi són des de fa un parell d’anys.

I això ens porta a la granddaddy que eren les bases de dades a la memòria i perquè els preus de la base de dades han baixat. L’altra raó per la qual probablement penseu que s’ha produït és que moltes de les analítiques requereixen que les dades siguin molt ràpides i, per tant, cal que siguin a la memòria. Tingueu en compte que els algorismes que utilitzen les bases de dades per accedir a aquestes dades, per comprimir-les, xifrar-les, per emmagatzemar-les, ja sabeu que en alguns casos algunes bases de dades poden continuar emmagatzemant a la memòria com a fila.

En alguns casos, algunes bases de dades poden dividir-les en una columna orientada i la raó per la qual cosa és que aconsegueixen un nivell de compressió molt més alt, en algun lloc dels voltants de l’11 al 12X, emmagatzemant-les en ordre de columna versus ordre de fila. Aquesta primera aparició a SQL Server 2014, es deia "Hekaton". S'ha incrementat radicalment a SQL Server 2016, es veuran referits amb alguns noms diferents i surt a l'Oracle 12c; Dic que el segon llançament aquí, no R2. Hi ha hagut dues versions diferents d'Oracle 12c, el 12.1.0.1 i el 12.1.0.2. És la segona versió de la versió R1 de la base de dades.

I la manera com el definiu, l'objecte de memòria és similar a les dues bases de dades. Aquí podeu veure a la cantonada superior dreta, estic creant un servidor SQL i podeu veure que diu només amb esquema optimitzat de memòria i durabilitat. No passaré per sobre de tots aquests significats de sintaxi i, a Oracle, és encara més senzill, només cal que modifiqueu una taula i digueu a la memòria o no, i la podeu canviar. Puc dir que avui és in-memory i demà no, així que és molt flexible.

Vaig fer algunes proves a Oracle amb taules de memòria, vaig tenir unes proves que van trigar gairebé 40 minuts a executar-se, a la primera fila. El que és important és que quan arribo a les dues files inferiors, hagués augmentat el temps d'execució o disminuït, hauria de dir, fins a cinc minuts aproximadament, i quan vaig mirar el factor de compressió, les dades a la memòria eren realment 3,6. fins a 4,6 vegades més petit. Això és important perquè en aquest cas utilitzava el format orientat a les columnes i és la compressió. I, doncs, endevineu què? En realitat, encaixava gairebé quatre a cinc vegades més dades a la meva memòria. No només obtenia l’avantatge de la memòria, l’avantatge de les columnes, sinó també l’avantatge de moltes més dades: fins a cinc vegades més dades a la memòria cau de memòria, de manera que es tracta d’una tècnica força potent. Un cop més Oracle i SQL Server, voleu mirar-los, són molt bones funcions. I amb això, crec que ho obriré a preguntes.

Eric Kavanagh: Bé, primer de tot heu estat molt desinteressats en tota aquesta meravellosa educació. Podríeu parlar només per un minut sobre el que feu els nois? Perquè teniu una tecnologia habilitant que us pot facilitar el que parleu. Només heu de parlar un minut sobre el que feu i, a continuació, deixem que Dez i Robin baixin de l'equació aquí.

Bert Scalzo: Sí, treballo en una empresa que es diu IDERA. Estem a Texas, tenim la seu a Houston i ara mateix estic a Austin, però estic a Dallas. Fem eines de base de dades i fem eines de base de dades per ajudar-vos a resoldre problemes. Aquest problema pot ser una cosa tan simple com la productivitat. En aquest cas, tenim una eina anomenada DBArtisan que us permet fer les tasques administratives de la vostra base de dades i és una eina que us permetrà gestionar 12 plataformes de bases de dades diferents. Puc gestionar SQL Server, puc gestionar Oracle, puc gestionar MySQL, DB2, Postgres i faig servir una eina, una executable, una de GUI i un conjunt de fluxos de treball consistents. També fabriquem eines per fer el compliment, tenim una eina anomenada SQL Compliance Manager per ajudar-vos a satisfer les vostres necessitats de compliment. Una altra eina anomenada SQL Security, de manera que intentem que les eines que us ajudaran siguin efectives i eficients, i el que és realment bo si aneu al nostre lloc web, tenim tot un munt de freeware per la qual cosa, si no és més, aneu a descarregar. - Crec que tenim 20 o 25 freewares. Hi ha algunes coses gratuïtes realment bones, com ara que hi ha un servidor SQL Server i una verificació d'ajuda de Windows, que bàsicament es fixarà en el que teniu i us dirà si teniu problemes o coses, i que és totalment gratuït.

Eric Kavanagh: I tu realment ...

Bert Scalzo: Definitivament, les primeres coses ...

Eric Kavanagh: Estàs parlant de l’heterogeneïtat del mercat actual, hi havia una mena d’equació única que s’adapta a la mida que, de fet, recordo que vaig entrevistar el doctor Michael Stonebraker quan el 2005 va fer una gran empenta. Parlava de veredicte sobre el moviment de bases de dades orientat a les columnes i parlava de com va dominar durant molts anys el model relacional unidimensional i que predicava que tot canviaria, i el noi tenia raó d'això. Ara tenim aquest entorn realment interessant i divers, amb moltes opcions i oportunitats diferents, però necessiteu que algú pugui gestionar-ho i em sembla que la vostra empresa es concentra força acurada a resoldre problemes de matemàtiques, sent així un facilitador de la capçalera d’heterogeneïtat, oi?

Bert Scalzo: Absolutament. Vull dir que sempre hi haurà ABC que diuen: "No vull utilitzar una eina GUI, ho faig tot amb scripts", saps? Ells pensen que són el tipus de DBA superman i està bé, però per a la majoria de nosaltres, volem fer feina i, ja ho sabeu, faig servir Microsoft Word per escriure els meus documents. Utilitzo Microsoft Outlook per fer el meu. Vull dir, tinc eines per fer tasques. Construïm el mateix tipus de concepte, estem construint eines per a administradors i desenvolupadors de bases de dades per ajudar-los a centrar-se en el que volen fer i no com ho han de fer.

Eric Kavanagh: Té sentit, però permeteu-me que us dirigeixi als nostres experts i que la gent no tingui ganes de capbussar-vos. Tenim un parell de comentaris que arriben per part del públic. Potser, Dez, un parell de preguntes i Robin un parell de preguntes?

Dez Blanchfield: Segur. Una de les primeres preguntes que vull llançar a vosaltres, donada l’enorme experiència d’experiència que heu aconseguit, veieu aviat un moment en què alguna cosa d’això es redueixi? O creieu que estem realment just al punt d’entrada d’aquesta línia de canvi de creixement continu? Crec que un dels grans problemes que tenen les empreses i, sempre, les persones que intenten donar suport a la tecnologia que proporcionen aquestes empreses per gestionar els seus negocis, és que la taxa de canvi és tan dramàtica que no poden estar al dia de tot. apareixen les diferents funcions i programari i sistemes i marcs i arquitectures i el codi nou, i el maquinari que hi ha a sota, veieu que el ritme actual de canvis es redueix immediatament? Vull dir que, teniu una àmplia gamma de plataformes amb tota la suite IDERA, anirem alentint-nos aviat o estem en aquest tipus de trens de mercaderies desbocats des de fa temps?

Bert Scalzo: Crec que ens trobem al primer 20 per cent d'aquesta curva de creixement i ens queda un llarg camí per recórrer i hi ha dues coses que ho impulsen. La tecnologia continua evolucionant. Heu esmentat alguns dels nous tipus de memòria que sortiran, que seran fantàstics. Samsung tindrà una unitat flash de 20 terabytes aquí aviat. Això canviarà les coses. Tenim totes aquestes bases de dades NoSQL i núvol, això continuarà funcionant. El més curiós és que, quan em fixo en bases de dades com Oracle i SQL Server i algunes d’altres, ja no són bases de dades relacionals. Puc posar dades no estructurades a Oracle i, tot i així, mantenir la conformitat amb l’ACID. Si ja m’ho havíeu dit fa 20 anys, només vau dir que sou amb drogues.

Dez Blanchfield: Sí, sí, són genials. Doncs bé, ara mateix aquells motors que tenen uns nínxols verticals força bonics com el SIG, ara millor que la capacitat nativa. Heu fet uns comentaris fantàstics sobre els reptes que tenen els DBA i les diferents èpoques de les DBA que esperem veure a tot el lloc, però com es veu el món amb aquest tipus de negoci que us ocupa? Vull dir, es tracta de les persones que utilitzen les diferents plataformes del vostre gestor de diagnòstic, de les eines d’inventari i, fins i tot, baixant al desgranat, de com s’afronten els DBA amb aquest canvi i com ho fan? , què fan amb les vostres eines per afrontar aquest canvi significatiu en el seu paisatge?

Bert Scalzo: Bé, vaig a tornar gairebé 20 anys, i diré que els DBA resolen un paper molt específic en una organització. Normalment treballen amb una plataforma de bases de dades, potser dues, i van gestionar un nombre relativament reduït de bases de dades. Avui dia i l’administrador de bases de dades, en realitat coneixerà 10 plataformes de bases de dades. Ell gestiona, i no és cap broma, en alguns casos, milers de bases de dades; això té més informació sobre el món de SQL Server o el món de MySQL. Però encara al món d’Oracle podrien gestionar centenars de bases de dades. I, per tant, han sortit totes aquestes funcions noves, tenen totes aquestes noves plataformes i tenen totes aquestes bases de dades de les quals són responsables. Cerquen eines que permetin la seva productivitat i que els ajudin a aprendre algunes coses.

I et donaré un exemple: si vull particionar una taula és una sintaxi bastant obscura, i si vull subdividir-la, la sintaxi és encara més difícil. Sé què vull fer, vull crear cubs. Si tinc una eina com DBArtisan que diu: "Hola, aquí tens una bonica pantalla que et permet concentrar-te en el que estàs intentant fer en lloc de com ho intentes, i, per cert, empeny Mostra el botó SQL quan hagueu acabat i us mostrarem què era el SQL perquè pugueu començar a aprendre i dominar-ho realment. "

Els DBA estan descobrint que les eines que els ajuden a fer la feina, però també els ajuden a ensenyar-los totes aquestes coses noves que estan utilitzant i el mateix seria cert: diguem que sóc un tipus d’Oracle i passo a MySQL i diguem, “D’acord, crea una base de dades, DBArtisan. Ara mostra’m l’SQL perquè em pregunto com és crear una base de dades a MySQL i només he après a sintaxi. ”I no només els ajudem a treballar a través de bases de dades, sinó que també els estem educant a través de bases de dades.

Dez Blanchfield: És encara més interessant quan arribes a algunes de les més modernes, o no més modernes, això no és gens just de dir, però una vegada una base de dades és una base de dades. Aquests dies veig tot allò que parleu allà amb el repte afegit que la tecnologia aplega que tradicionalment veiem dels proveïdors i que trieu un tipus de codi obert i que també són bons. No només tracten els motors de bases de dades i els llenguatges de consulta, sinó que també s’ocupen dels tipus de dades, els estructurats i no estructurats, que saps, el repte d’haver d’afrontar-ho tot, des de l’extrem extrem de l’espectre d’un HDFS multi-petabyte. entorns a contenidors petits minúsculs i fitxers de paquets i diversos formats de fitxers de registre.

I crec que això és una cosa que ara veiem on només no hi ha un ésser humà, per molt que sigui un superhome, una superwoman, sigui el que poguessin pensar que siguin, físicament, no poden afrontar mentalment aquesta taxa de canvis i l’escala de variacions. Crec que el conjunt d’eines que ofereu ara arribarà a un punt en què gairebé tindran un conjunt predeterminat de moltes maneres de manera que no puguem executar els entorns de bases de dades que tinguem sense ells perquè físicament No puc tirar-hi tants cossos. Em va agradar molt la vostra presentació. Passaré al doctor Robin Bloor, estic segur que també tindrà moltes preguntes per enviar-vos les preguntes.

Robin Bloor: Bé. Bé, sens dubte tinc preguntes. Bert, no sé cap a on vas, vaig tenir una conversa realment interessant fa uns dies on algú va començar a parlar-me sobre la protecció de dades de DU més recent i em va semblar el que deien que era increïblement draconià pel que fa a les coses en què insistien. Em vaig preguntar si realment ho heu vist; és alguna cosa que coneixeu?

Bert Scalzo: Absolutament. Sí.

Robin Bloor: 2016, d'acord, explica'ns-ho.

Bert Scalzo: I en realitat ...

Robin Bloor: Profundament interessant.

Bert Scalzo: Vaig treballar durant un temps per a un proveïdor de flaix, a la seva base de bases de dades ajudant-los a crear productes flash per a bases de dades, i puc dir-vos que el draconi es redueix. El que vull dir és que, si recordeu la meva diapositiva, he dit que en algunes bases de dades farà el xifrat, però la posa a la memòria del servidor i en algunes bases de dades el xifrat; encara es xifra a la memòria del servidor, només es desxifra quan s'envia al client. Bé, el que també trobareu és algunes d'aquestes normes governamentals, sobretot els departaments de defensa o militars que hi ha aquí als Estats Units, també van fins al nivell de flaix i volen saber no només que admetu el xifratge i el xifratge. el vostre maquinari, però que si algú robés els xips que, ja ho sabeu, els va treure de la cosa, fora del vostre servidor, que el que hi ha està xifrat i, tot i que encara que tinguin l'emmagatzematge, no es pot i ho farien. fins a l'actual, no a la part del flaix, sinó a les fitxes individuals. Volien saber que xip per xip, tot estava xifrat.

Robin Bloor: Wow Vull dir que hi ha moltes coses que, ja ho sabeu, crec que va ser una o dues diapositives que heu realitzat, però va ser una cosa que és realment interessant. La redacció d’informació, per exemple, ha de ser una mica més intel·ligent que només emmascarar diversos camps perquè, sobretot, amb l’aprenentatge automàtic actualment, podeu fer coses deductives que us permetin treure informació que abans no podríeu treure a la superfície.

Si intenteu protegir, diguem-ne informació sanitària, és a dir, que són una regla molt dràstica als EUA pel que fa a informació sobre salut, però realment, mitjançant diverses tècniques d’aprenentatge de màquines, sovint podeu esbrinar qui és la informació mèdica d’algú. en realitat ho és Em vaig preguntar si teniu alguna cosa a dir sobre això perquè tots pensen que és una zona interessant.

Bert Scalzo: Sí, absolutament, i només estic utilitzant això com a exemple, no estic intentant dir que una base de dades és millor que una altra, però aquest és un molt bon exemple pel que acaba de preguntar. A Oracle, per exemple, si no em permeten veure una fila de dades, com ara, no tinc permís de veure el registre mèdic de John Smith. A Oracle si dic: "Selecciona aquell registre", se'm bloquejarà o se'm permetrà veure el que tinc permès de veure i es tornarà a modificar. I si dic: "Selecciona l'estrella del compte de la taula on és igual a John Smith", aconseguiré zero.

A SQL Server, pot fer la redacció, però té alguns forats. Si dic: "Selecciona l'estrella del compte a la taula on és igual a John Smith", realment recuperaré una, així que sé que hi ha un John Smith. L’un és més segur que l’altre. Ara espero que arreglin això, sempre toquen granota saltant entre ells. I, de nou, no intento diferenciar les bases de dades que no pas mostrar un exemple de: mira el que estem parlant ara, una cosa tan simple com el compte selecte també ha de ser tallat per la redacció, tot i que, tècnicament parlant, no hi ha res que no es redueixi que l'existència de la fila.

Robin Bloor: Sí, no. Això és interessant. Vull dir, una altra pregunta general, perquè no tinc gaire temps, es tracta només de les millores.Vull dir que heu estat en un lloc on sé que ens heu mostrat exemples de diversos resultats de proves que heu executat. Creieu que les bases de dades tradicionals, anomenem-les bases de dades dominants, SQL Server i Oracle? creu que continuaran abans de la realització? O creieu que es deixaran atrapar per un o un altre tipus de trastorns del mercat que realment operen? Quina és la teva opinió?

Bert Scalzo: Tinc una opinió i és, ja ho sabeu, de nou, diré que és la meva opinió. Microsoft, per exemple, a l'era post-Ballmer només impressionava l'infern viu de mi. Em refereixo a que aquesta base de dades estreta obté SQL Server a Linux, passa a .NET a Linux, a PowerShell a Linux; No crec que es deixin enrere els venedors de bases de dades tradicionals. Crec que han decidit: "Heu, deixeu que els nous nois, les startups defineixin alguna cosa. Permetin-los esbrinar què és el perfeccionament i com s’ha de perfeccionar, i un cop realitzades totes les investigacions i desenvolupament, sabem exactament què volen els usuaris, ara afegim la nitidesa a Oracle. dient: "Hola, ser segon o tercer no està malament quan ets el jugador dominant, perquè la gent no migrarà de tu."

Robin Bloor: Sí, vull dir que és una estratègia que s’ha utilitzat. Vull dir que IBM solia fer-ho i tot el conjunt de - per a totes les seves gammes de productes i valora molt raonablement fins que algú surti completament fora del mur que ningú no ha pensat mai, però que no es pot planificar contra això, de totes maneres.

Preguntes del públic, Eric?

Eric Kavanagh: Sí, però teniu temps, crec que només per a un potser i sé que Bert ha de córrer. Hi havia alguna cosa aquí: d'acord, l'arquitectura d'esmicoladora d'Oracle 12c és que indiqui - o què és una indicació al vostre parer, què creieu que està passant allà?

Bert Scalzo: Doncs bé, Oracle absorbeix o / i ofereix tot el que són tots els altres proveïdors de bases de dades. Per exemple, puc posar dades no estructurades a Oracle. No sé com podeu posar dades no estructurades i, a continuació, anomenar-la base de dades relacional, de manera que no té cap sentit, però podeu fer-ho. I ara Oracle està afegint nitidesa, així que Oracle diu: "Sabeu què? Tot el que el mercat vulgui, farem la nostra base de dades d’oferta perquè el mercat vol allò que el mercat vol i oferim la solució, volem que es quedin amb nosaltres. ”

Crec que veureu articles addicionals. No m'estranyaria que agrupés els nodes de bases de dades en forma de Hadoop no en un rack Oracle o en un clúster d'aplicacions reals, però bàsicament en una agrupació tradicional de tipus Hadoop fent aquesta nitidació. Per tant, crec que podreu implementar una base de dades com Oracle, com si ho féssiu a Hadoop, i aquest tipus de tendències continuaran. Aquests grans venedors de bases de dades, obtenen milers de milions de dòlars i no volen perdre el mercat, per la qual cosa estan disposats a adaptar-se a res o a adoptar res.

Eric Kavanagh: Bé, ja ho sabeu, és curiós perquè he seguit els proveïdors de codi obert durant força temps i m’he preguntat tot això, com serà d’impacte sobre la tecnologia tradicional de portes tancades, i durant un temps segur que sentia els venedors de codi obert estaven avançant seriosament i ara, mentre miro el mercat, veig una mica el que estàs dient, que els nois grans han fet les seves matemàtiques, han aguditzat els llapis i han descobert com poden teixir. moltes coses en les seves arquitectures. Tant si es tracta d’IBM, com d’Oracle, o SAP: vaig estar a la Conferència SapphireNow del mes passat i Steve Lucas, que dirigeix la meitat d’aquesta empresa, es va vantar que SAP ara incorpori a la seva plataforma de núvols HANA, components de codi més obert que cap dels seus. competidors. Si feu aquest tema, és una afirmació força impressionant i em diu que els nois grans no aniran enlloc ni tan aviat.

Bert Scalzo: No, apostaria pels meus diners pels dos. Vull dir que, si us fixeu, les accions de Microsoft eren aproximadament a 50 dòlars i, ja ho sabeu, fa uns quants anys era a 25. No duplicareu el preu de les vostres accions en un període curt, tret que feu coses bones i, ja ho sabeu, des de fer tot, des de Windows 10 ser gratuït durant el primer any fins a totes les altres coses intel·ligents que facin, aquesta característica de base de dades extensa crec que és fenomenal. Crec que el que passarà és que molta gent s’acabarà a l’azur, no directament, com no deien: “Emigrem la meva base de dades cap a Azure”. Migrarà allà màgicament perquè s’arxivarà. Allà, amb aquesta nova característica de base de dades d'estiració i, per tant, l'adopció d'Azure acabarà disparant.

Eric Kavanagh: Bé, aquesta és una de les tendències del mercat que fins i tot puc veure, fins i tot al Mac. A mesura que aneu al vostre Mac per desar alguns documents, ara, i els nous Macs només segueixen pel núvol, oi? Vull dir, hi ha molt de sentit en aquesta estratègia, i també la miro i vaig: “D'acord, nois, intentes atraure'm peça a peça al teu entorn de núvol i, un dia, quan vull veure alguna pel·lícula si La meva targeta de crèdit ha caducat: tindré problemes. "

Bert Scalzo: Sí, però ho segueixes endavant.

Eric Kavanagh: Sí. Això és cert.

Bert Scalzo: Tu ho poses tot.

Eric Kavanagh: Bé, no tot.

Bert Scalzo: No, vull dir ...

Eric Kavanagh: Sí, endavant.

Bert Scalzo: Aquestes tendències socials estan arribant a les empreses. Ara, les empreses encara tenen moltes altres coses que fer, però veuen aquestes tendències i fan el mateix tipus de coses. No veig ni Oracle ni Microsoft desapareixent. De fet, vaig a comprar estocs cada vegada que hi hagi un bany.

Eric Kavanagh: Sí, efectivament. Doncs bé, aneu a idera.com, I-D-E-R-A dot com. Tal com va dir Bert, tenen un munt de coses gratuïtes allà mateix i és una de les noves tendències del mercat: us donen algunes coses gratuïtes per jugar, us enganxeu i, després, aneu a comprar coses reals.

Persones, aquesta ha estat una altra tecnologia calenta. Gràcies pel vostre temps avui, Bert, Dez per descomptat, i Robin també. Parlarem amb vosaltres la setmana que ve, amics, moltes coses. Si teniu alguna idea, no dubteu de veritat amb la vostra. Us parlarem la propera vegada, tingueu cura. Adeu.