Som ett av de mest kraftfulla programmeringsramarna för öppen källkod är Hadoop ett viktigt verktyg för alla som hoppas kunna hitta ett big data-jobb. Om du vill borsta upp dina Hadoop -färdigheter eller lära dig att bemästra det, är ditt bästa alternativ att gå en onlinekurs. Om det inte är tillgängligt för dig kan du titta på gratis onlinehandledning och använda referensmaterial för att felsöka specifika problem. När du väl har grunderna, öva på små uppsättningar verkliga data för att förbättra dina färdigheter.
Steg
Metod 1 av 2: Att gå kurser och använda självstudier
Steg 1. Registrera dig för Cloudera för en 6-delad kurs och interaktiva självstudier
Cloudera ger dig verkliga exempel att träna på i en skrivskyddad miljö, så du behöver inte oroa dig för att göra stora misstag. De erbjuder också analysverktyg som hjälper dig att experimentera med frågedata, samt en gratis live -demo som heter Cloudera Live för att lära dig Hadoop -miljön.
Även om den kompletta, fördjupade kursen med certifiering kommer att kosta dig $ 295, är det definitivt värt det om du använder dessa färdigheter för ditt jobb. Att använda Cloudera -kursen hjälper dig att fånga misstag och spara tid, vilket gör att det snabbt kan betala sig själv
Steg 2. Prova gratis onlinekurser genom Cloudera om du redan kan grunderna
Om du har erfarenhet av Hadoop och bara vill ha en uppdatering behöver du kanske inte betala ut pengarna till den 6-delade kursen. Kolla istället de gratis onlinekurser på Cloudera University -webbplatsen.
Det finns resurser för administratörer, utvecklare och dataanalytiker, så oavsett vilken roll du har bör du kunna hitta en lämplig kurs
Steg 3. Ta en kurs på universitetsnivå om Coursera om du vill ha mer teori
Coursera är en välkänd, respekterad källa till programmeringskurser. Även om instruktionerna i allmänhet är mer teoretiska och inte innehåller så många löpande exempel, kan du öva tillsammans med handledningen och använda kursprojekten för att få praktisk erfarenhet.
- Du hittar den här kursen online på
- Kostnaden varierar mellan kurser, men Coursera erbjuder också ett ekonomiskt stöd till dem som kvalificerar sig.
Steg 4. Följ en kostnadsfri kurs på Big Data University för ett kostnadseffektivt alternativ
Om du inte vill betala för en onlinekurs är Big Data University ett bra alternativ. De har en tvådelad kurs, som fokuserar först på Hadoop-grunderna, sedan på programmering med Hadoop, och onlineformatet gör det enkelt att gå i din egen takt.
- Du hittar dessa kurser på
- De erbjuder många självstudier på engelska, såväl som japanska, spanska, portugisiska och ryska.
Steg 5. Sök efter genomgångar på YouTube om du behöver gratis, specifik utbildning
Det finns tusentals videor för att förklara Hadoop och hur man använder den. Det breda utbudet av videor ger dig flexibilitet, plus att det är gratis. Om du stöter på ett specifikt problem, sök på YouTube efter en video som leder dig genom processen.
Hadoop -handledning bör också vara ganska lätt att hitta, eftersom "hadoop" är en unik sökterm
Steg 6. Använd Yahoos gratis handledning om du vill träna med ett virtuellt exempel
Dessa självstudier är uppdelade i sju moduler, och de instruerar dig i att installera och använda Hadoop från början. Detta är ett bra alternativ för att borsta upp specifika färdigheter om de är lite rostiga.
Steg 7. Se kostnadsfria, djupgående instruktioner i IBM Open Source-dokumentet
Detta är ett otroligt grundligt PDF-dokument med öppen källkod som skapats av ett IBM-utbildningsinitiativ. Det går dig igenom Hadoop noggrant, steg för steg, och ger tydliga skriftliga instruktioner.
Dessa instruktioner fungerar också bra när de är ihopkopplade med en live -demo som Cloudera
Metod 2 av 2: Övergång till verklig applikation
Steg 1. Fråga om du kan implementera Hadoop på jobbet för att träna med riktiga data
Ställ en förfrågan med din chef eller arbetsledare, eller prata med dem en-mot-en om att få dessa nya färdigheter till arbetsplatsen. Detta är särskilt viktigt om ditt företag betalat för någon utbildning eller onlinekurser.
Ju tidigare du börjar implementera de färdigheter du har lärt dig, desto tidigare kommer du att kunna bemästra dem
Steg 2. Leta efter enkla projekt att öva dina färdigheter på
Välj projekt som är relativt enkla och med låg risk, till exempel att räkna och rangordna antalet interaktioner per kundagent, som e-post och chattpass.
- Några andra riktiga dataprogram inkluderar skanning genom webbloggar efter fel eller övervakning av sociala mediekanaler för varumärkesstämning.
- Du kan också träna med exempeldata från webbplatser som https://www.kaggle.com/datasets eller
Steg 3. Kontrollera regelbundet din kod med små delmängder för att lösa eventuella buggar
Innan du kör hela uppsättningen data, ta en mindre testdataset till din lokala dator och kör den genom flera olika lägen. Du kan till exempel köra det iterativt genom Local Jobrunner Mode, sedan Pseudo-Distributed Mode och sedan Full-Distributed Mode.
- Detta låter dig känna igen eventuella brister eller buggar innan de förstärks i hela datauppsättningen.
- Lokalt Jobrunner-läge låter dig testa och felsöka din karta lokalt och minska koden, Pseudodistribuerat läge efterliknar produktionsmiljön och Fullt distribuerat läge ser på ditt verkliga produktionskluster.
Steg 4. Använd en 1-årig gratis provperiod för att träna på en virtuell maskinmiljö
Företag som Amazon och Microsoft erbjuder betalda prenumerationer för sina Hadoop -övningstjänster. Amazons virtuella maskin kallas Amazon Web Service (AWS) och Microsofts tjänst kallas Microsoft Azure. För båda tjänsterna är ditt första år gratis när du anger din kreditkortsinformation.
Glöm inte att säga upp prenumerationen efter 1 år för att undvika att debiteras
Tips
- Tänk på att Hadoop är ett mer specialiserat programmeringsspråk som är smalt. Det kommer säkert att ge dig en fördel i big data -världen, men det är inte alltid nödvändigt att bli programmerare.
- Du kan också läsa böcker och artiklar om Hadoop, till exempel Hadoop: The Definitive Guide, 3rd Edition av Tom White.