Windows

Facebookin suuret tietosuunnitelmat sisältävät varastoja, nopeampia analyysejä

Search Engine Optimization Strategies | Use a proven system that works for your business online!

Search Engine Optimization Strategies | Use a proven system that works for your business online!
Anonim

Facebook voi aarnaa sen miljardin plus-käyttäjilleen tietoja mainostuotteistaan, mutta analyysi, jonka sivustolla on kyseisten tietojen odotetaan edelleen aiheuttavan useita haasteita tulevana vuonna, insinööri sanoi.

Ongelmia, joita Facebook on joutunut tarttumaan "paljon nopeammin kuin laajempi teollisuus" tehokkaampia tapoja käsitellä käyttäjän käyttäytymistä sivustossa, miten eri tietotyyppien tietoja voidaan entistä paremmin hyödyntää ja yhdistää Facebookin monilla datakeskuksilla ja kehittää uusia avoimen lähdekoodin ohjelmistojärjestelmiä näiden tietojen käsittelyyn. Viesti Murthy, joka hallinnoi Facebookin analytiikka-infrastruktuuria, sanoi tiistaina.

"Facebook on datayhtiö, ja selkein asia, josta ihmiset ajattelevat, on kyse mainoksen kohdistamisesta", hän sanoi San Franciscossa järjestetyssä alan konferenssissa

[Lue lisää: Paras TV-suoratoistopalvelut]

"Mutta se menee syvemmälle kuin tämä", hän sanoi.

Yksi merkittävimmistä alueista kulissien takana oleva työ liittyy Facebookin analytiikkainfrastruktuuriin, jonka tarkoituksena on nopeuttaa tuotekehitystä ja parantaa käyttäjien kokemuksia syvällisellä analyysillä kaikista käytettävissä olevista tiedoista riippumatta siitä, ovatko ne toimista, joita käyttäjät käyttävät sivustossa, kuten tilojen päivitysten lähettämistä tai Facebookissa useilla eri sovelluksilla.

Facebook käyttää tällä hetkellä useita erilaisia ​​avoimen lähdekoodin ohjelmistoja, joita kutsutaan nimellä Hadoop, Corona ja Prism, käsittelemään ja analysoimaan tietoja, joita yritys keskittyy nopeammin ja tehokkaammin seuraavien kuuden tai kahdentoista kuukauden aikana, Murthy sanoi.

Monet yrityksen haasteista ovat sidoksissa siihen, mitä Facebook viittaa tietovarastonaan, joka yhdistää tietoja useista lähteistä tietokantaan, jossa käyttäjän toimintaa voidaan analysoida yhteenvetona, esimerkiksi antamalla päivittäinen raportti tietyssä maassa merkityistä valokuvamääristä tai tarkastelemalla kuinka monta käyttäjää tietyllä alueella on sitoutunut sivuille, joita heille suositellaan.

Analyysi on suunniteltu optimoimaan käyttäjäkokemuksia ja selvittämään, mitä käyttäjät pitävät ja eivät pidä, mutta se on myös yhä verotus, sillä Facebook pystyy käyttämään yhä enemmän tietoja käyttäjistä, Murthy sanoi. Tällä hetkellä Facebook-varasto käsittää 500 teratavua uutta tietoa päivässä tai 500 000 gigatavua. Varasto on kasvanut lähes neljäkymmentä kertaa koko viimeisen neljän vuoden aikana, "Facebookin käyttäjien kasvun edetessä", Murthy sanoi.

Näiden ongelmien ratkaisemiseksi Facebook on kehittänyt Prism-ohjelmistojärjestelmänsä, joka on suunniteltu suorittamaan keskeisiä analyysifunktioita eri puolilla maailmaa sijaitsevissa datakeskuksissa ja jakaa analyysit "paloiksi", Murthy sanoi. Näin analysoitaessa jotain käyttäjien uutissyöttöihin liittyvää muuttujaa ei yleistää varastoa.

"Olemme yhä enemmän ajattelemassa, miten nämä tiedot saadaan kiinni."

Yhtiö pyrkii myös järjestelmään, joka ottaa täysin toisenlaisen lähestymistavan kyselyyn varastolta ja antaa vastausaikaa muutamassa sekunnissa, Murthy sanoi.

Toinen alue Facebook etsii jatkuvasti paranemista sen "transaktioinfrastruktuuria, ", Joka käsittelee, sanoa, pidä, kommentoi ja tilapäivityksistä päivittäistä, päivittäistä tietojenkäsittelyä, jotta sosiaalinen verkosto toimisi sujuvasti. Osa kysymyksistä, joita yhtiön insinöörit ja analyytikot ovat tarkastelleet, ovat selvittää, kuinka ennakoidaan todellista kasvua tällaisissa tietolähteissä, ja kuinka paljon Facebookin pitäisi laskea, mistä Murthy sanoi."Voimmeko ennustaa, mitä se tulee olemaan kuuden kuukauden kuluttua?" Hän sanoi.

Samalla Facebook on mukana pitkän aikavälin pyrkimyksissä tehostaa fyysisiä palvelimiaan. Yritys aloitti Open Compute -projektinsa vuonna 2011, jonka tavoitteena on suunnitella modulaarisia palvelimia, jotka antavat asiakkaille entistä paremman hallinnan verkkoihin, muistiin, virtalähteisiin ja muihin komponentteihin, jotka menevät palvelimiinsa. Sitä laajennettiin sisällyttämään ARM-prosessorit tammikuussa.