Przetwarzanie rozproszone i platforma BOINC?

PojÄcie przetwarzania rozproszonego jest doÅÄ szerokie, ale dla lepszego zrozumienia zaczniemy wÅaÅnie od niego, aby później móc swobodnie dotrzeÄ do zagadnieÅ bardziej zaawansowanych.
No wiÄc przetwarzanie rozproszone (ang. distributed processing) to wykonywanie okreÅlonych zadaÅ użytkownika z wykorzystaniem wspóÅdzielonych zasobów poÅÄ
czonych sieciÄ
komputerowÄ
.
Chodzi tu m.in. o potÄżnÄ
iloÅÄ danych jaka znajduje siÄ w sieci a przede wszystkim w bazach danych wielu instytucji naukowych i nie tylko.
Problem w tym, że to sÄ
wÅaÅnie dane, dlatego uprzednio muszÄ
zostaÄ przetworzone, aby czÄÅÄ z nich staÅa siÄ dla nas istotnymi informacjami.
Danych jest po prostu zbyt ogromna iloÅÄ i coÅ lub ktoÅ musi je przetworzyÄ, wyselekcjonowaÄ z tej masy to co może stanowiÄ dla naukowca, dla nas interesujÄ
cÄ
nas wiedzÄ.
W dzisiejszym Åwiecie czyniÄ
to zazwyczaj superkomputery, duża iloÅÄ komputerów poÅÄ
czona w klastry lub ogromna iloÅÄ komputerów personalnych poÅÄ
czonych sieciÄ
Internet.
I tutaj przechodzimy do pojÄcia zwanego obliczeniami rozproszonymi.
Obliczenia rozproszone (ang. distributed computing) to takie obliczenia, które umożliwiajÄ
wspóÅdzielenie zasobów obliczeniowych, które sÄ
czÄsto geograficznie rozproszone. W obliczeniach rozproszonych zadanie obliczeniowe poddane zostaje dekompozycji np. na programy, procesy, procesory.
SzczególnÄ
popularnoÅciÄ
wÅród użytkowników Internetu cieszÄ
siÄ projekty, w których użytkownicy udostÄpniajÄ
odpÅatnie bÄ
dź nieodpÅatnie moc obliczeniowÄ
swoich komputerów firmom prywatnym, instytucjom naukowym, rzÄ
dowym lub osobom prywatnym. Obliczenia te opierajÄ
siÄ na modelu klient-serwer. Użytkownik instaluje oprogramowanie (klienta), który pobiera dane (np. zadany przedziaÅ liczb, zbiór czÄ
steczek, itp.) z serwera w celu ich przetworzenia. Po przetworzeniu pobranych danych klient przesyÅa serwerowi wyniki przeprowadzonych obliczeÅ, a nastÄpnie pobiera od serwera kolejne dane do przetworzenia.

No i jeÅli chodzi o projekty, to obecnie istnieje platforma BOINC, która obsÅuguje, skupia zdecydowanÄ
wiÄkszoÅÄ najpopularniejszych projektów.
BOINC jest skrótem od Berkeley Open Infrastructure for Network Computing, co po polsku oznacza “Otwarta Infrastruktura Przetwarzania Rozproszonego Uniwersytetu Berkeley”.
Ta platforma wywodzi siÄ z bardzo zasÅużonego dla wielu dziedzin nauki Uniwersytetu Berkeley w Kalifornii.
Pierwotnie Berkeley byÅo inicjatorem projektu SETI@home, który na podstawie analizy sygnaÅów radiowych z kosmosu wyszukuje prawdopodobieÅstwa wystÄ
pienia sygnaÅu(informacji) pochodzÄ
cej od obcych cywilizacji, zamieszkujÄ
cych inne ukÅady planetarne naszej galaktyki.
I od tego m.in. zaczÄÅa siÄ kilka lat temu moja przygoda z przetwarzaniem rozproszonym. ![]()
ZnaÅem wtedy również projekt Grid(medycyna, biologia), ale do jego obsÅugi sÅużyÅ inny program, a razem z aplikacjÄ
SETI bardzo obciażaÅy komputer.
WiÄc dla lepszego rozpowszechnienia siÄ tej globalnej szczytnej dziaÅalnoÅci na rzecz ogólnoÅwiatowej nauki, naukowcy z Berkeley stworzyli pod koniec 2002 roku platformÄ (program, aplikacjÄ dla kilku systemów operacyjnych), który od tamtej pory skupia sobÄ
wiele powstajÄ
cych wtedy i obecnie projektów. Jest to kolejny przejaw Wolnej Kultury, gdzie nie liczy siÄ interes jednostek, natomiast wspólne dziaÅanie dla dobra nauki, a co za tym idzie również dobra ludzkoÅci.
Oprogramowanie to udostÄpnione jest na Pomniejszej Publicznej Licencji GNU, co oznacza, że aplikacja BOINC posiada otwarty kod, natomiast kody poszczególnych aplikacji projektowych ÅaczÄ
cych siÄ z platformÄ
już nie (jest to spowodowane gÅównie wzglÄdami bezpieczeÅstwa).
Sama platforma BOINC może byÄ rozwijana przez każdego zaprzyjaźnionego programistÄ, czy developera.
W przeszÅoÅci projekty dziaÅaÅy zupeÅnie samodzielnie i koniecznym byÅo instalowanie osobnych programów obsÅugujacych te różnorodne projekty, co stanowiÅo duÅ¼Ä trudnoÅÄ i niepotrzebne obciÄ Å¼anie komputerów.
Obecnie mamy jeden program, platformÄ i możemy dedykowaÄ niewykorzystanÄ moc procesora naszego komputera dla projektów, jakie Nam odpowiadajÄ , z jakimi My siÄ utożsamiamy, że tak to pozwolÄ sobie nazwaÄ. Liczba tych projektów stale roÅnie z racji dużej uniwersalnoÅci platformy.
Ja osobiÅcie utożsamiam siÄ z wieloma, gdyż zdajÄ sobiÄ sprawÄ z faktu, iż w dzisiejszych czasach naukowcom wrÄcz wykÅadniczo rosnÄ
iloÅci danych w bazach danych (instytutów, uniwersytetów i wszelakich innych instytucji badawczych).
Nie każdy z nich ma dostÄp do superkomputerów lub procesorowych klastrów, czas natomiast ucieka, a wielu naukowców nadal nie zna odpowiedzi na nurtujÄ
ce ich i nas pytania, czÄsto w dziedzinach, które dla samej ludzkoÅci nie cierpiÄ
zwÅoki (mowa tu przede wszystkim o projektach z dziedziny medycyny i biologii).
Jest to inicjatywa dobrowolna, aczkolwiek szczytna.
JeÅli weźmiesz w niej udziaÅ staniesz siÄ jednym z okoÅo 600 tyÅ. aktywnych dziaÅaczy(aktywnych, ponieważ nieaktywnych jest kilka milionów), wolontariuszy z caÅego Åwiata.
Obecnie tak jak i w przeszÅoÅci ta wielka liczba uczestników organizuje siÄ w grupy (tzw. teamy). Charakter tych zgrupowaÅ jest różnorodny, tworzÄ je ludzie pracujÄ cych w różnych firmach, a dedykujÄ cych moc przeliczeniowÄ swoich komputerów (np. Sun Microsystems, Intel, Microsoft, EraGSM, PlusGSM itd.), sÄ to przedstawiciele różnych wyższych uczelni (uniwersytety, politechniki etc.) – w wiÄkszoÅÄ sÄ to studenci, teamy reprezentujÄ ce miasta, województwa (SETI@Nowa Sól), czy też tworzÄ siÄ na podstawie jednego projektu, dla którego czÅonkowie szczególnie lub caÅkowicie poÅwiÄcajÄ swe komputery (np. Seti Team 2000).
Wymienione tutaj zespoÅy zwiÄ
zane sÄ
w szczególnoÅci z SETI, bo tych też znam najwiÄcej, z racji, że z projektu SETI@home siÄ wywodzÄ i monitorowaÅem sytuacjÄ na bieżÄ
co przez kilka lat.
Wraz z wejÅciem nowej platformy czasy siÄ zmieniÅy i czÄÅÄ z zespoÅów przemianowaÅa siÄ, jak np. wysoko w rankingu stojÄ cy miÄdzynarodowy SETI Synergy na BOINC Synergy – ten zespóŠjest teraz zespoÅem miÄdzyprojektowym podobnie jak mój BOINC@Poland.
ZespóÅ, do którego należÄ, sÅuży caÅej gamie projektów, na dzieÅ dzisiejszy jesteÅmy zarejestrowani w 20. OczywiÅcie każdy z naszych czÅonków indywidualnie ustala, w którym projekcie chce braÄ czynny udziaÅ.
CzÄÅÄ z projektów już skoÅczyÅa siÄ, lub koÅczy swÄ
dziaÅalnoÅÄ z racji speÅnienia swej roli, natomiast na bieżÄ
co powstajÄ
nowe, którym BOINC@Poland na pewno nie bÄdzie obcy.
Każdy z teamów, czy też indywidualni użytkownicy biorÄ
udziaÅ w bardzo rozbudowanych statystykach i rankingach na specjalnie do tego celu powoÅanym serwerze BOINCstats.
Co ciekawe spolszczenia na BOINCstats dokonaÅ zaÅożyciel naszego teamu – Mchl ![]()
Tutaj każdy uczestnik może obserwowaÄ postÄpy swojego kraju, teamu i swoje wÅasne, dokonywaÄ porównaÅ i przeglÄ
daÄ zaawansowane rankingi i statystyki.
Dodatkowo może umieszczaÄ baner z wÅasnymi osiÄ
gniÄciami, gdziekolwiek zechce, czy na forum w podpisie, czy też na wÅasnej stronie, jak to przykÅadowo widaÄ u mnie na weblogu.
Projekty, które wyszczególniÄ poniżej sÄ
inicjatywami pochodzÄ
cymi z wielu krajów Åwiata.
Nawet WÄgry doczekaÅy siÄ wÅasnego, Polska jeszcze niestety nie ![]()
Dlatego na forum B@P powstaÅa inicjatywa utworzenia
stowarzyszenia Polski Projekt BOINC, który postawiÅ sobie za cel rozpowszechnianie wiedzy o istniejÄ
cej platformie BOINC w Polsce, zdobywanie wspracia ze strony instytucji naukowych, które mogÅyby byÄ potencjalnymi inicjatorami polskich projektów naukowych opartych o tÄ
platformÄ, jednoczesne uÅwiadamianie naszych rodaków i rodaczek, aby każdy z nich miaÅ możliwoÅÄ wziÄcia w tym udziaÅu i czerpaÄ satysfakcjÄ ze wsparania Åwiatowej, jak i ojczystej nauki.
Teraz przedstawiÄ listÄ najpopularniejszych projektów, w których jeÅli chcesz, jako wolontariusz możesz wziÄ Ä udziaÅ, wiÄcej infomacji znajdziecie pod linkami
1. BBC Climate Change Experiment – projekt podobny tematycznie do Climateprediction.net, zwiÄ zany z badaniami klimatu.
2. BURP – jest próbÄ wykorzystania infrastruktury BOINC do zadaÅ nie zwiÄ zanych z naukÄ , lecz z grafikÄ komputerowÄ . Umożliwi on jego użytkownikom renderowanie ich wÅasnych trójwymiarowych grafik przy wykorzystaniu komputerów innych użytkowników.
3. Climateprediction.net – projekt majÄ cy na celu okreÅlenie jakie uproszczenia można wprowadziÄ w komputerowym modelowaniu klimatu.
4. Einstein@home – bardzo interesujÄ cy projekt, majÄ cy na celu badanie fal grawitacyjnych. Zgodnie z teoria wysuniÄtÄ przez A. Einsteina zmiany w polu grawitacyjnym powodujÄ zmiany w zakrzywieniu czasoprzestrzeni.
5. The Lattice Project – jest projektem prowadzonym przez Uniwersytet stanu Maryland. Oprócz architektury BOINC wykorzystuje także architekturÄ GRID (przetwarzanie rozproszone z wykorzystaniem klastrów superkomputerów). Co wiÄcej, projekt ten w zaÅożeniu ma byÄ platformÄ dla wielu innych projektów przetwarzania rozproszonego. W uproszczeniu można wiÄc przyjÄ Ä, że projekt Lattice ma na calu poÅÄ czenie architektur BOINC i GRID w jedno spójne Årodowisko.
6. Leiden Classical – projekt jest zwiÄ zany z modelowaniem zachowania siÄ czÄ steczek wody. Aplikacja modeluje 100 pikosekund “z życia” grupy czÄ steczek. Celem jest zgroamdzenie danych statystycznych.
7. LHC@home – projekt wspomagajÄ cy konstrukcjÄ Wielkiego Zderzacza Hadronów (Large Hadron Collider – LHC) w laboratorium CERN pod GenewÄ .
8. MalariaControl.net – Szwajcarski Instytut BadaÅ Nad Chorobami Tropikalnymi opracowaÅ komputerowy model epidemiologoczny rozprzestrzeniania siÄ zarodźca malarycznego (Plasmodium falciparum). DziÄki wynikom symulacji, bÄdzie można lepiej zaplanowaÄ akcje ograniczajÄ ce zachorowalnoÅÄ na malariÄ.
9. Î?Fluids – projekt Î?Fluids zajmuje siÄ symulacjÄ zachowania siÄ pÅynów w warunkach mikrograwitacji oraz w mikrokanaÅach. Celem projektu jest zaprojektowanie lepszych systemów napÄdowych dla sztucznych satelitów, oraz poszerzenie wieszy o przepÅywie pÅynów w ukÅadach MEMS.
10. Orbit@home – na Uniersytecie stanu Waszyngton powstaje projekt, którego celem jest wykrywanie i Åledzenie okoÅoziemskich obiektów kosmicznych (NEOs – Near Earth Objects) oraz obliczanie prawdopodobieÅstwa ich ewentualnego zderzenia z ZiemiÄ .
11. Pirates@home – w odróżnieniu od pozostaÅych projektów BOINC, ten nie sÅuży konkretnym obliczeniom zwiÄ zanym z badaniami naukowymi, lecz jest poletkiem doÅwiadczalnym, na którym rozwijana jest architektura BOINC.
12. Predictor@home – projekt jest czÄÅciÄ eksperymentu majÄ cego na celu przewidzenie struktury biaÅka na podstawie sekwencji aminokwasów wchodzÄ cych w jego skÅad.
13. PrimeGrid – tworzony z poczÄ tku przy użyciu bardzo ograniczonych Årodków (na domowym laptopie), a obecnie na nieco mocniejszym komputerze, projekt ukierunkowany na stworzenie serwera harmonogramów BOINC w jÄzyku PERL. Jest to zatem przedsiÄwziÄcie skierowane bardziej w kierunku rozwoju architektury BOINC niż obliczeÅ naukowych.
14. QMC@home – Quantum Monte Carlo, projekt poÅwiÄcony badaniom teorii kwantowych, wszystkiego zwiÄ zanego z molekuÅami, z których skÅada siÄ nasz Åwiat.
15. Rosetta@home – zagadnienia zwiÄ zane z przewidywaniem struktury biaÅek, sÄ najwyraźniej bardzo wdziÄcznym tematem dla projektów przetwarzania rozproszengo. Rosetta@home, to kolejny po Predictor@home i Folding@home projekt zajmujÄ cy siÄ tymi zagadnieniami.
16. SETI@home – prawdopodobnie najbardziej znany i najwiÄkszy projekt przetwarzania rozproszonego w internecie. Jego pierwotna wersja zgromadziÅa ponad 5 mln uczestników z czego 500 000 aktywnych (czyli takich, którzy przez ostatnie 4 tygodnie nadesÅali wyniki obliczeÅ) Komputery uczestników analizujÄ dane z radioteleskopu w Arecibo (najwiekszy na Åwiecie, widaÄ go m.in. w filmie James Bond Golden Eye), w poszukiwaniu sygnaÅów mogÄ cych pochodziÄ od pozaziemskich cywilizacji.
17. SIMAP@home – SIMAP to prawdopodobnie najwiÄksza na Åwiecie baza danych, w której zgromadzono informacje o sekwencjach aminokwasów w biaÅkach. Zawiera ona wszystkie opublikowane sekwencje i jest na bieÅ¼Ä co aktualizowana. Oparty o BOINC projekt przetwarzania rozproszonego ma za zadanie pomóc w porównywaniu sekwencji różnych biaÅek. Jest to dosyÄ istotne, gdyż biaÅka o zbliżonych sekwencjach, majÄ najprawdopodbniej wspólnego “przodka”, a co ważniejsze, czÄsto peÅniÄ podobne funkcje.
18. SZTAKI Desktop Grid – powstaÅy na WÄgrzech projekt, zajmujÄ cy siÄ zagadnieniami uogólnionych systemów dwójkowych (a w przyszÅoÅci zapewne innymi równie abstrakcyjnymi tematami).
19. The World Community Grid – jest dziaÅajÄ cÄ od dÅuższego czasu platformÄ dla projektów przetwarzania rozproszonego, która w ostatnim czasie udestÄpniÅa swoje aplikacje także w wersjach dla klienta BOINC. W chwili obecnej na platformie dziaÅajÄ dwa projekty: Human Proteome Folding Project oraz FightAIDS@Home.
20. XtremLab – projekt wyeksportowaÅ ostatni plik ze statystykami 18 października 2005
Francuski projekt który pojawiÅ siÄ na krótko i szybko zniknÄ
Å z niewyjaÅnionych przyczyn. MiaÅ siÄ zajmowaÄ ocenÄ
mocy obliczeniowej, możliwej do uzyskania przez projekt BOINC.
WiÄcej informacji o projektach znajdziecie Tutaj
A Tutaj przewodniki Krok po Kroku, jak Åatwo staÄ siÄ domowym naukowcem.
Zapraszam do udziaÅu
^^



