Hjem Anmeldelser Hvordan virksomheder kan give mening om big data-markedet

Hvordan virksomheder kan give mening om big data-markedet

2024

Video: Shoshana Zuboff on surveillance capitalism | VPRO Documentary (Oktober 2024)

Virksomheder får ingen point for, hvor effektiv deres infrastruktur kører, eller hvor høj de kan stakke alle Big Data, de indsamler. Hvad der tæller er kvaliteten af den analyse og intelligens, som data producerer.

I løbet af de sidste flere år er Hadoop det ord, der er blevet mest synonymt med indtagelse, behandling og transformering af data. Denne open-source ramme for distribueret datalagring og -behandling har givet sit eget virksomhedsrum og integreret sin vej i alle de store skyplatforme. Hadoop er langt fra den eneste Big Data-teknologi, der er værd at tale om, men det er blevet den, som mange andre er bygget på.

Problemet for virksomheder er, at Hadoop-pladsen er fuld af distributioner og værktøjsmuligheder, og som Gartner Research Director Nick Heudecker forklarede, ser mange af dem de samme ud. Heudecker, hvis forskning dækker informationsstyring inklusive Big Data og NoSQL-mellemrummet, sagde, at hvis du ser på de generelle databehandlingsmuligheder, tilbyder mange leverandører meget lignende funktioner.

Nedbryde markedet

Der er tre vigtigste start-up-spill fra Hadoop - Cloudera, Hortonworks og MapR - og de er alle vokset støt i 2015. Ifølge Gartner har hver ca. 700 kunder, giver eller tager 10 procent, hvilket sætter det globale marked mellem 2.100-2.400 Hadoop-kunder over hele verden. Alle tre tilbyder både et gratis lag og et virksomhedslag for deres Hadoop-distribution, og hver yder betydelige open source-bidrag til projekter under Apache Software Foundation (ASF) banner.

"Vores data viser, at 44 procent af Hadoop-brug i øjeblikket er ubetalt, " sagde Heudecker. "Er der en klar leder? Jeg tror ikke det. De griber alle sammen markedsandele, fordi det er et meget nyt rum."

I de sidste par måneder er meget af konkurrencen mellem de tre kommet til konkurrence om dataanalysefunktioner og kreative måder at integrere Apache Spark, en open-source Big Data-behandlingsmotor med brugssager fra realtids datastrømme til maskinlæring. MapR annoncerede for nylig MapR Streams som en del af en "konvergeret dataplatform", der integrerer Hadoop, gnistbaseret streambehandling og analyse. Hortonworks lancerede en opdatering til Hortonworks Data Platform (HDP) med Spark-analyse i hukommelsen, og Cloudera tilbyder en række open source Spark-integrationer gennem sit One Platform Initiative sammen med at tilbyde Spark-træningsklasser.

"Der sker meget i informationsstyring og informationsinfrastrukturrum, og det er ikke alt Hadoop, " forklarede Heudecker. "Der er en enorm fart bag Sparks hurtigheds- og hukommelsescentriske databehandlingsmodel, skønt Sparks udvikling stadig er i sine tidlige stadier. Spark vil være en anden lingua franca i databehandling, ligesom SQL i dag, og viser bestemt tegn på, at den har nogle ben som flere og flere virksomheder investerer i det."

Heudecker understregede også vigtigheden af skyafspillerne i Big Data; de teknologigiganter, der har integreret Hadoop og andre Big Data-teknologier i deres eksisterende Infrastructure-as-a-Service (IaaS) tilbud.

Amazon Web Services (AWS) bruger sin Amazon Elastic MapReduce (EMR) -tjeneste til skybaseret Hadoop-orkestrering. Microsoft tilbyder en hel række Big Data-tjenester inden for sin Azure-skyplatform, der samarbejder med Hortonworks om sin HDInsight-tjeneste til styring af Apache Hadoop, Spark, HBase og Storm sammen med sin SQL-baserede Azure Data Lake og Azure Data Analytics. IBM har både sit lokale IBM Open Platform-tilbud til Hadoop og IBM BigInsights, en analysepakke, der skal køres ovenpå, sammen med administrerede Hadoop og Apache Spark-as-a-service i sin Bluemix-sky. Listen fortsætter, og virksomheder finder de mere anvendelige brugssager i skyen.

"Vi estimerer, at AWS alene har omkring 5.000 kunder, så det er over det dobbelte af kundegrundlaget for pure-playet, " sagde Heudecker. "En af fordelene ved at flytte ind i skyen er at du får et økosystem. Du kan få pure-play Hadoop-distributioner på et hvilket som helst af IaaS-tilbudene. MapR er tilgængelig i alle de skyer, du kan tænke på, bortset fra IBM's; det samme for Cloudera og Hortonworks. Vi har ikke set, at tilgængelighed i skyen bliver for meget af en faktor, når vi vælger mellem en leverandør og en anden."

Valg af en Enterprise Data Strategi

For både små til mellemstore virksomheder (SMB'er) og voksende virksomheder, når de investerer i databehandlings- og analyseløsninger, sagde Heudecker, at den afgørende faktor er, hvilken platform der kan levere det højeste serviceniveau. Den største udfordring for virksomhederne er ifølge Gartner kompetencegabet - at finde ud af, hvem der skal styre platformen, når den først er installeret og implementeret.

"Hvis virksomheder er på udkig efter en dataplatformpartner, hvem vil hjælpe dem med indtagelse af data? Hvem vil hjælpe dem med at opbygge den analytiske applikation? For så vidt angår de tre pure-spillede Hadoop-ers, er evalueringskriterierne ofte omkring modenhed af styringsværktøjer og -konsoller, værktøjer til datastyring og ydeevne."

Det andet interessante aspekt ved at vælge en Hadoop-platform er en mangel på loyalitet. Virksomheder revurderer deres Hadoop-platform så ofte som hver 6.-12. Måned for at se, om databehandlingskomponenterne stadig er den rigtige pasform, på grund af hvor hurtigt pladsen ændrer sig, og hvor lidt de store spillere har differentieret sig. Heudecker sagde, at 20 procent af de virksomheder, han har talt med, har flere Hadoop-distributioner, der kører i deres datacentre eller sky, enten ved at lade forskellige hold vælge deres valgte platform eller diversificere med vilje for at undgå at sidde fast med kun en Hadoop-distribution.

Denne form for diversificeret platformsportefølje strømmer ind i, hvad Frank Buytendijk, en Gartner Research Vice President og Distinguished Analyst, der fokuserer på digital strategi, kalder "information som et aktiv." Da du ikke kan drive en virksomhed uden kapital, arbejdskraft, materialer og hverken fysiske eller virtuelle faciliteter, sagde Buytendijk, at du ikke kan drive en virksomhed uden information.

"Vi plejede at se på forretninger med hensyn til de tre strømme: den primære strøm var varer, den sekundære strøm var penge, og den tertiære strøm var information for at sikre, at varerne og pengene var på linje. I de fleste virksomheder er det omvendt. Den primære strøm er information, fra identifikation og konfiguration til indholdsmarketing osv. Uanset om du kalder Big Data eller ikke, betyder det ikke noget."

"Big Data" er forældet

Buytendjik sagde, at han ikke ser Big Data som en separat teknologi for virksomheder, men som et tema eller et tankesæt i din overordnede digitale strategi.

"Jeg tror ikke på at have en Big Data-strategi, " sagde Buytendjik. "Der er næppe en forretningsstrategi længere uden digitale komponenter, så jeg tror på at have en digital strategi, hvor alle slags teknologier leverer kritiske muligheder. Dette inkluderer mobile, sociale, cloud, IoT, smarte maskiner og Big Data."

Heudecker mener, at vi begynder at tale om "Big Data" mindre og mindre, for nu er det bare data. Det er den måde, forretningen foregår på. Massive mængder og høj hastighed af data er ikke længere så afskrækkende.

"Big Data bliver igen subsumeret af information og analyse, " sagde Heudecker. "Big Data-kategorien adskiller ikke ærligt. Vi bliver altid spurgt om størrelsen på Big Data-markedet, men hvad betyder det endda? Big Data er ikke et marked, det er et koncept. For en virksomhed, der tænker på Big Data som noget unikt og specielt, der er radikalt anderledes end hvad du har gjort før, er en fejl. På dette tidspunkt er data bare normale."