Car-tech

Cloudera Preps Hadoop Enterpriseille

Hadoop Tutorial For Beginners | Hadoop Full Course In 10 Hours | Big Data Tutorial | Simplilearn

Hadoop Tutorial For Beginners | Hadoop Full Course In 10 Hours | Big Data Tutorial | Simplilearn
Anonim

Cloudera on paljastanut uuden sarjan Hadoop-hallintatyökaluja, joita kutsutaan nimellä Cloudera Enterprise, jota yritys tarjoaa vuosittain liittymismaksusta, ilmoitti tiistaina.

Sekä uudet julkaisut että useat uudet kumppanuudet datanhallintaohjelmistojen toimittajien kanssa osoittavat, että yritys aikoo tarjota kehittyvää tietokantateknologiaa - nyt useimmiten käytetään

"Vetoomme ei ole pelkästään suuret verkkoyritykset vaan pankit, sairaalat ja vakuutusyhtiöt löytävät, että heidän on analysoitava monimutkaisia ​​ja jäsenneltyjä verkkopankkeja. tietoja yhdessä, ja Hadoop tehtiin siitä ", sanoi Cloudera toimitusjohtaja Mike Olson. "Hadoop ratkaisee uuden ongelman uudella tavalla."

Yksi kasvavasta määrästä ei-SQL- tai NoSQL-tietokannoista, Hadoop perustuu Google MapReducen kehykseen, jonka avulla voidaan käsitellä tietoja rinnakkain useiden tietokoneiden solmuja. Apache-ohjelmistosäätiö on nyt avoin lähdekoodi, ja se tarjoaa vaihtoehdon perinteisille relaatiotietokannoille ainakin niille tapauksille, joissa analysoidaan suuria ja nopeasti muuttuvia tietojoukkoja.

Se voi toimia sekä SQL: n että ei- -SQL -tiedoista, ja se on joustavampi palvelimen epäonnistumiseen kuin relaatiotietokantoihin, Olson sanoi.

Cloudera pakkaa Hadoopia midlevel-organisaatioille sekä Hadoop-jakelusta että sen uusista hallintatyökaluista. Molempien pakettien pitäisi mahdollistaa organisaatioille, joilla ei ole paljon teknistä kokemusta Hadoopissa, toimimaan ohjelmistolla, Olson sanoi. "On olemassa tämä myytti, että Hadoop on käyttökelpoinen, jos sinulla on Google-skaalatut tiedot. Monet käyttäjät, joilla on vain muutamia teratavuja tietoja, joita he haluavat analysoida."

Cloudera's Distribution for Hadoop (CDH) on avoimen lähdekoodin paketti valmiiksi integroituja ohjelmistoja rakennettu noin Hadoop Common, aiemmin nimetty Hadoop Core. Paketti sisältää: Hive, joka tarjoaa tietovaraston infrastruktuurin; HBase, tietokanta Hadoop; Sika, kääntäjä karttaohjelmien vähentämiseen;

Hiljattain julkaistussa versiossa 3 paketti sisältää kolme ohjelmaa, jotka yritys on julkaissut avoimen lähdekoodin projekteina Apache V2: n avoimen lähdekoodin lisenssin alla. Yksi on Flume, joka voi auttaa tietojen lataamisessa Hadoopiin. Toinen uusi lisäys on Oozie, joka on työnkulunhallintaohjelmisto. Viimeinen on Hadoop User Environment (HUE) -koodi, joka tarjoaa käyttöliittymän Hadoopin hallintaan.

"HUE sallii kenenkään rakentaa analyytikoille suunnattuja sovelluksia, ja se osaa puhua Hadoop-klustereista", Olson sanoi.

Cloudera Enterprise -paketti lisää CDH-versiota 3 lisähallintatyökaluilla. Tämä uusi ohjelmisto, joka ei ole avoin lähdekoodi, sallii järjestelmänvalvojat hallitsemaan pääsynhallintaa käyttämällä Lightweight Directory Access Protocolia.

Olson ei keskustele siitä, kuinka paljon Cloudera on tehnyt tilaus- ja konsultointipalkkioista tähän mennessä, mutta toteaa, että vuoden 2010 ensimmäisellä neljänneksellä yhtiö teki niin paljon kuin mitä se ansaitsi puoleen vuoteen 2009. Eri alojen, rahoituspalvelujen, televiestinnän, vähittäiskaupan, valtion ja verkkokaupan yritykset ovat osoittaneet olevansa kiinnostuneita teknologiasta, Olson sanoi.

"Yritysten tekemät asiat Hadoopilla vaihtelevat. yleisesti, nämä ihmiset saavat paljon tietoja monista paikoista ja tarvitsevat sitä hienostuneisiin analyyseihin ", Olson sanoi. "Rahoituspalvelut ovat kiinnostuneita Hadoopin käyttämisestä petosten havaitsemiseen. Televiestinnässä on todellinen tarve optimoida verkkoja ja vähentää asiakkaiden kouristelua."

Cloudera on tarjonnut näiden pakettien lisäksi myös Hadoop-tukipalveluita liiketoimintatiedon toimittajilta ja tietohallintopalvelujen tarjoajilta.

Olson aikoo ilmoittaa Hadoop Summit 2010 -keskustelussaan Santa Clarassa, Kaliforniaan tiistaina, että BI-toimittaja MicroStrategy tukee Hadoop-käyttöä.

Toinen uusi kumppani on Open Source Data Integration -ohjelmiston myyjä Talend. Yhtiö on laajentanut Talend Integration Suite -ohjelmaansa käyttöliittymää Hadoop-tietokantojen kanssa. Sen avulla järjestelmänvalvojat voivat hallita ja yhdistää useita tietolähteitä yhdestä konsolista. Hadoopin avulla ohjelmisto "voi lisätä tai noutaa tietoja luonnostaan ​​ja käsitellä tietoja Hadoop-arkkitehtuurissa", sanoi Talend varapääjohtaja markkinoinnista, Yves de Montcheuil.

Microstrategy ja Talend liittyvät yhä useammat yritykset valmistavat avoimen lähdekoodin tai kaupallinen hallintatyökalu Hadoopille. Viime viikolla Cloudera ja Quest aloittivat projektin, jonka avulla voidaan rakentaa ohjelmistoja, jotka voivat yhdistää Hadoopin Oracle-tietokantoihin. Toukokuussa avoimen lähdekoodin yritys-tiedustelupalveluyritys Pentaho ilmoitti, että sen BI-sarja toimisi Hadoop-tietokantojen kanssa.

IDG News Serviceissa erillisessä haastattelussa Yahoo CTO Raymie Stata huomautti, että Hadoop voisi vähentää supertietokoneiden rakentamisen tarvetta analysoida suuria tietojoukkoja. Perinteisesti suuria tietojoukkoja on siirretty tallennustilasta supertietokoneeseen, joka on analysoitu analysoitava yhdistettyjen palvelimien joukko. Sitä vastoin Hadoop siirtää analyyttisen laskennan siihen paikkaan, jossa data on, eliminoimalla cental, giant number-crunching kone.

Cloudadan tarjonnan lisäksi Hadoop on kaupallistanut myös IBM: n, joka äskettäin aloitti tarjoamalla joukon analyyttisia palveluja, jotka käyttävät teknologiaa.

Joab Jackson käsittelee enterpise-ohjelmistoja ja yleisiä teknologia uutisia IDG News Service. Seuraa Joab Twitterissä osoitteessa @Joab_Jackson. Joabin sähköpostiosoite on [email protected]