Najbolji primjeri iz prakse za implementaciju Hadoop poslužitelja na CentOS/RHEL 7 - 1. dio
U ovoj seriji članaka pokrit ćemo cijelu zgradu Cloudera Hadoop Cluster Building s najboljim primjerima iz prakse Dobavljača i Industrije.
Instalacija OS-a i rad na razini OS-a Preduvjeti su prvi koraci za izgradnju Hadoop klastera. Hadoop može raditi na različitim verzijama Linux platformi: CentOS, RedHat, Ubuntu, Debian<, SUSE itd., U proizvodnji u stvarnom vremenu, većina Hadoop klastera izgrađena je na vrhu RHEL/CentOS, mi koristit će CentOS 7 za demonstraciju u ovoj seriji vodiča.
U organizaciji, instalacija OS-a može se obaviti pomoću kickstarta. Ako se radi o klasteru od 3 do 4 čvora, ručna instalacija je moguća, ali ako gradimo veliki klaster s više od 10 čvorova, zamorno je instalirati OS jedan po jedan. U ovom scenariju, metoda Kickstart dolazi na scenu, možemo nastaviti s masovnom instalacijom pomoću kickstarta.
Postizanje dobrih performansi iz Hadoop okruženja ovisi o postavljanju odgovarajućeg hardvera i softvera. Dakle, izgradnja proizvodnog Hadoop klastera uključuje puno razmatranja u vezi s hardverom i softverom.
U ovom ćemo članku proći kroz različite referentne vrijednosti o instalaciji OS-a i neke najbolje prakse za implementaciju Cloudera Hadoop poslužitelja klastera na CentOS/RHEL 7.
Važno razmatranje i najbolji primjeri iz prakse za implementaciju Hadoop poslužitelja
Sljedeće su najbolje prakse za postavljanje implementacije Cloudera Hadoop klaster poslužitelja na CentOS/RHEL 7.
- Hadoop poslužitelji ne zahtijevaju standardne poslužitelje poduzeća za izgradnju klastera, to zahtijeva standardni hardver.
- U proizvodnom klasteru preporuča se imati 8 do 12 podatkovnih diskova. O tome trebamo odlučiti prema prirodi opterećenja. Ako je klaster za računalno intenzivne aplikacije, najbolje je imati 4 do 6 pogona kako biste izbjegli probleme s I/O.
- Podatkovne pogone treba particionirati pojedinačno, na primjer – počevši od /data01 do /data10.
- Konfiguracija RAID-a ne preporučuje se za radne čvorove, jer sam Hadoop pruža toleranciju na pogreške na podacima tako što replicira blokove u 3 prema zadanim postavkama. Dakle, JBOD je najbolji za radne čvorove.
- Za glavne poslužitelje, RAID 1 je najbolja praksa.
- Zadani datotečni sustav na CentOS/RHEL 7.x je XFS. Hadoop podržava XFS, ext3 i ext4. Preporučeni datotečni sustav je ext3 jer je testiran na dobre performanse.
- Svi poslužitelji trebaju imati istu verziju OS-a, barem isto manje izdanje.
- Najbolja je praksa imati homogen hardver (svi radni čvorovi trebaju imati iste karakteristike hardvera (RAM, prostor na disku & Core itd.).
- Prema radnom opterećenju klastera (uravnoteženo radno opterećenje, intenzivno računanje, intenzivno I/O) i veličini, planiranje resursa (RAM, CPU) po poslužitelju će se razlikovati.
U nastavku pronađite primjer za particioniranje diska poslužitelja od 24TB za pohranu.
Instaliranje CentOS 7 za implementaciju Hadoop poslužitelja
Stvari koje trebate znati prije instaliranja CentOS 7 poslužitelja za Hadoop poslužitelj.
- Minimalna instalacija dovoljna je za Hadoop poslužitelje (radničke čvorove), u nekim slučajevima GUI se može instalirati samo za glavne poslužitelje ili upravljačke poslužitelje gdje možemo koristiti preglednike za web sučelja Alati za upravljanje.
- Konfiguriranje mreža, naziva hosta i drugih postavki vezanih uz OS moguće je izvršiti nakon instalacije OS-a.
- U stvarnom vremenu dobavljači poslužitelja imat će vlastitu konzolu za interakciju i upravljanje poslužiteljima, na primjer – Dell poslužitelji imaju iDRAC koji je uređaj ugrađen u poslužitelje. Korištenjem tog iDRAC sučelja možemo instalirati OS sa slikom OS-a u našem lokalnom sustavu.
U ovom smo članku instalirali OS (CentOS 7) u VMware virtualni stroj. Ovdje nećemo imati više diskova za izvođenje particija. CentOS je sličan RHEL (ista funkcionalnost), pa ćemo vidjeti korake za instalaciju CentOS.
1. Započnite s preuzimanjem CentOS 7.x ISO slike u vašem lokalnom Windows sustavu i odaberite je tijekom pokretanja virtualnog stroja. Odaberite ‘Instaliraj CentOS 7’ kao što je prikazano.
2. Odaberite jezik, zadani će biti engleski i kliknite nastavi.
3. Odabir softvera – Odaberite 'Minimalna instalacija' i kliknite 'Gotovo'.
4. Postavite korijensku zaporku onako kako će od nas tražiti da je postavimo.
5. Odredište instalacije – Ovo je važan korak na kojem treba biti oprezan. Moramo odabrati disk na koji će biti instaliran OS, namjenski disk treba odabrati za OS. Kliknite na 'Instalacijsko odredište' i odaberite Disk, u stvarnom vremenu bit će tamo više diskova, moramo odabrati, po mogućnosti 'sda'.
6. Ostale opcije pohrane – Odaberite drugu opciju (ja ću konfigurirati particioniranje) da biste konfigurirali particioniranje povezano s OS-om kao /var, / var/log, /home, /tmp, /opt, /swap.
7. Kada završite, započnite instalaciju.
8. Kada instalacija završi, ponovno pokrenite poslužitelj.
9. Prijavite se na poslužitelj i postavite naziv hosta.
hostnamectl status
hostnamectl set-hostname tecmint
hostnamectl status
Sažetak
U ovom smo članku prošli kroz korake instalacije OS-a i najbolje prakse za particioniranje datotečnog sustava. Sve su to opće smjernice, u skladu s prirodom radnog opterećenja, možda ćemo se morati usredotočiti na više nijansi kako bismo postigli najbolju izvedbu klastera. Planiranje klastera je umjetnost za Hadoop administratora. U sljedećem ćemo članku detaljno zaroniti u preduvjete na razini OS-a i sigurnosnu zaštitu.