Povećanje brzine i agilnosti u procesu strojnog učenja
sij 10, 2022 • Software • Hewlett Packard Enterprise operated by Selectium, Croatia
Svakog dana generiramo više od 2.5 kvintiliona1 bajtova podataka. To je digitalni „zlatni rudnik“ informacija koje kompanije analiziraju kako bi pomogle donošenju pravih poslovnih odluka i strategija. Nažalost, usprkos važnosti upotrebe podataka prilikom donošenja odluka, mnoge kompanije nemaju dobro razrađene tijekove analize, kako bi oni bili optimizirani da u najkraćem vremenskom razdoblju iskoriste maksimalnu količinu potrebnih podataka. Znanstvenici koji se bave obradom podataka (data scientists) za različite svrhe u istoj kompaniji često rade nezavisno jedni od drugih, te rijetko na raspolaganju imaju dovoljno resursa. Zato je uobičajena situacija da moraju čekati da se oslobodi infrastruktura, kako bi je mogli upotrijebiti za testiranje svojih modela. A kada se model proslijedi softverskim developerima, oni gube uvid u njegove performanse.
Zašto je važno strojno učenje (Machine Learning – ML)?
Strojno učenje ima brojne prednosti i mogućnosti, ali se u realnosti susreće s mnogo poteškoća. Podaci koje strojno učenje može iskoristiti se nalaze u različitim formatima, na različitim mjestima koja pak imaju različite sigurnosne zahtjeve i različito se odnose prema privatnosti. Na sve to treba dodati i da je vrlo teško generirati novo okruženje za izradu modela. A nedostatak standardizacije često znači da modeli nikad ne prođu razinu pilot-projekta.
Na kraju se sve svodi na jednu stavku – vrijeme, odnosno na predugačak period koji prođe od trenutka kada se osmisli model do njegove finalne realizacije. I upravo to je glavni razlog zašto čak 87%2 data science projekata nikad ne dospije do produkcije. Ako će machine learning unaprijediti način na koji živimo, radimo i donosimo odluke, informacija o tolikom postotku neuspjeha djeluje zastrašujuće.
Kako onda preskočiti tu ogromnu prepreku i učiniti strojno učenje mnogo efikasnijim i upotrebljivijim?
1 „SG Analytics“ – 2.5 quintillion bytes of data generated everyday – Top Data Science Trends 2020
2 „Venture beat“ – Why do 87% of data science projects not make it into production?
Uklanjanje prepreka
Rješenje je uspostavljanje efikasnog i jedinstvenog data science tijeka. Upravo to je Hewlett Packard Enterprise uspio s HPE Ezmeral ML Ops-om (što je skraćenica od HPE Ezmeral Machine Learning Ops).
HPE Ezmeral ML Ops proširuje mogućnosti HPE Ezmeral Runtime Enterprise Platform-e i donosi agilnost u sustav strojnog učenja. S njim se olakšava standardizacija procesa strojnog učenja. Znanstvenici koji se bave analizom podataka s ovom platformom dobijaju fleksibilnost da machine learning pokrenu u lokalnom podatkovnom (data) centru, u različitim cloud ili hibridnim okruženjima, te da brzo odgovore na dinamičke poslovne zahtjeve u najrazličitijim scenarijima upotrebe.
Ova platforma uspješno izbjegava prepreke i osigurava prijeko potrebnu brzinu obrade podataka, uz sigurnost na enterprise nivou, kako bi sve kritične aplikacije nesmetano radile. Ne smijemo zaboraviti ni sposobnost dijeljenja koda, projekata, kao i modela baza podataka. Rezultat je dobijanje više vremena za izradu modela i aktiviranja novih funkcionalnosti, što u krajnjem slučaju vodi ka povećanju produktivnosti i bržem puštanju u produkciju. Kao dodatni plus, HPE Ezmeral ML Ops je dostupan i kao servis. Podaci se sada mogu obrađivati i u bilo kojem sandbox okruženju, a procesi su standardizirani kroz cijeli životni ciklus analitike.
HPE Ezmeral ML Ops osigurava „jedinstven prostor“ za kompletan životni ciklus strojnog učenja i kreira zajedničko dinamičko okruženje za obradu ogromne količine podataka, kreiranje modela, njegovo testiranje i puštanje u produkciju. Na taj način će se iz svakog modela izvući najveća količina korisnih podataka.
Jednostavnost kao preduvjet efikasnosti
Sve započinje kreiranjem dijeljenog „skladišta“ projekta u koje korisnici mogu ubaciti sve što je nužno za kreiranje modela – kao što su programski kod i podaci neophodni za pokretanje modela. Zatim se dodjeljuju korisnici koji su zaduženi za testiranje modela, ali i računalni resursi neophodni za obradu. Sustav već posjeduje velik broj unaprijed konfiguriranih modela, pa je najčešće dovoljno da se odabere jedan od ponuđenih. Naravno, uvijek se mogu izvršiti izmjene ili se može napraviti potpuno nova konfiguracija. Kada su svi parametri odabrani i podešeni, model se može registrirati.
Najveća prednost HPE Ezmeral ML Ops-a je što je svaki korak u životnom ciklusu strojnog učenja povezan i dostupan s jedne, centralne platforme. Računalni resursi i setovi alata su spremni za upotrebu i uvijek vidljivi svim neophodnim sudionicima u procesu, čime se stvara osnovni preduvjet da se pretvaranje podataka u realne odluke obavi brže nego ikad prije.
HPE Ezmeral ML Ops ubrzava proces postavljanja modela u produkciju sa skale koja se mjeri godinama, na skalu označenu mjesecima. Ako bismo napravili analogiju s prijevozom, onda bi prelazak na HPE Ezmeral ML Ops bio kao kada bi se s planinskog puta punog serpentina prešlo na auto-put – tolike bi bile razlike u brzinama. To višestruko ubrzava proces inovacija i donošenja strateških odluka u kompanijama. Također, zahvaljujući pay-as-you-go modelu plaćanja, troškovi se mogu lako prilagoditi svakom poslovnom planu i budžetu. S tog aspekta, HPE Ezmeral Machine Learning Ops predstavlja odlično rješenje za kompanije, kako u smislu ubrzanja donošenja poslovnih odluka, tako i u smislu optimizacije troškova.