YOMEDIA
ADSENSE
Điều phối tác vụ trong hệ thống MAP-REDUCE dựa trên tính địa phương của dữ liệu
31
lượt xem 4
download
lượt xem 4
download
Download
Vui lòng tải xuống để xem tài liệu đầy đủ
Bài viết tập trung nghiên cứu và so sánh hiệu suất hệ thống trong các trường hợp độ sao lưu dữ liệu có giá trị khác nhau, từ đó giúp người vận hành hệ thống Map-Reduce có thêm một tiêu chí để chọn các thông số hệ thống phù hợp. Mời các bạn cùng tham khảo!
AMBIENT/
Chủ đề:
Bình luận(0) Đăng nhập để gửi bình luận!
Nội dung Text: Điều phối tác vụ trong hệ thống MAP-REDUCE dựa trên tính địa phương của dữ liệu
- Hội Thảo Quốc Gia 2015 về Điện Tử, Truyền Thông và Công Nghệ Thông Tin (ECIT 2015) Hội Thảo Quốc Gia 2015 về Điện Tử, Truyền Thông và Công Nghệ Thông Tin (ECIT 2015) iu Phi Tác V Trong H Thng MAP-REDUCE Da Trên Tính a Phưng Ca D Liu Hunh Tn t Bùi Xuân Lc Hc viên Khoa Công Ngh Thông Tin II Khoa K Thut Hc Vin Công Ngh Bưu Chính Vin Thông i Hc Tân To Email: dathuynhtan@gmail.com Email: locbui@ieee.org Abstract— Vn d liu a phưng là mt vn quan trng thêm to ra kt qu cui cùng. Khi thc hin các tác v cn xem xét khi thit k thut toán iu phi công vic cho h “map”, mt trong nhng xem xét quan trng là vic phân b thng Map-Reduce. Gn ây, bài báo k thut [13] ã gii quyt tác v gn vi máy tính lưu tr khi d liu u vào cho tác v ưc vn d liu a phưng bng vic xut mt kin trúc ó; vn này còn ưc gi là vn d liu a phưng. hàng i mi và mt thut toán iu phi tác v ánh x (map task) da trên chính sách JSQ (Join the Shortest Queue) kt hp i vi mi tác v, chúng ta gi mt máy tính là mt máy vi chính sách MaxWeight. Tuy nhiên, bài báo [13] ch xem xét tính a phưng cho tác v nu on d liu liên quan n tác trưng hp sao lưu d liu là mt giá tr c th bng 3. Trên v này ưc lưu tr ngay ti máy tính ó, và chúng ta gi tác thc t, tu thuc vào cu hình h thng, sao lưu d liu có th v này là mt tác v a phưng trên máy tính. Trong trưng ln hn hoc nh hn 3. Trong bài báo này, chúng tôi m rng nghiên cu ca bài báo [13] và so sánh hiu sut h thng trong hp còn li (ngha là d liu cn thit cho tác v không ưc các trưng hp sao lưu d liu có giá tr khác nhau, t ó lưu tr ti máy tính), máy tính ó ưc gi là máy tính t xa giúp ngưi vn hành h thng Map-Reduce có thêm mt tiêu chí cho tác v, và tưng ng vi tác v này ưc gi là tác v t chn các thông s h thng phù hp. xa trên máy tính. Tính a phưng nên ưc xem xét n trong vic phân b các tác v “map” chy trên các máy tính. Vic Keywords- in toán ám mây, Map-Reduce, d liu a ci thin tính a phưng có th gim thi gian x lý ca các phưng, Hadoop. tác v “map” và lưu lưng ti t mng khi mt vài tác v “map” cn ly d liu t xa. Tuy nhiên, vic gán tt c các tác I. GII THIU v n các máy tính a phưng có th dn n mt s phân Ngày nay, chúng ta ang sng trong thi i thông tin, vi phi không ng u ca các tác v gia các máy, tc là mt s tng trưng bùng n thông tin theo cp s nhân. Nhng s máy b tc nghn trong khi các máy khác nhàn ri. Vì vy công ty hàng u v công ngh thông tin như Google, Yahoo!, chúng ta cn phi cân bng gia các d liu a phưng và cân Amazon, Microsoft, Facebook, Twitter… ang i mt vi bng ti trong Map-Reduce. ây chính là ng lc thúc y mt khi lưng d liu khng l. S tng trưng này òi hi các nhà nghiên cu tìm hiu, ci tin, xut các thut toán các chin lưc mi x lý và phân tích d liu. in toán mi nhm nâng cao hiu qu s dng và hiu sut h thng. ám mây ưc phát trin và Map-Reduce/Hadoop ang là mt Mt s thut toán iu phi ưc xut trưc ây trong h mô hình tính toán mnh m ưc ng dng trong in toán thng Map-Reduce/Hadoop ci thin d liu a phưng. ám mây. Vic x lý các tp d liu quy mô ln ã tr thành Thut toán FIFO scheduler trong Hadoop [12] vi vic iu mt vn ngày càng quan trng và y thách thc vi s phi mt máy sn sàng phc v tác v “map” t công vic lưng d liu ưc to ra bi các mng xã hi trc tuyn, head-of-line vi d liu gn nht n máy tính. Mc dù mt vài nghiên cu khoa hc… Map-Reduce/Hadoop [9]-[15] là mt ti ưu hoá a phưng ã ưc thc hin, vn head-of-line framework n gin nhưng mnh m x lý các tp d liu blocking a phưng vn tn ti và hiu sut thông lưng vn quy mô ln trong môi trưng phân tán và x lý song song, và b hn ch. Thut toán Fair Scheduler trong Hadoop [6] vi k ang ưc s dng rng rãi trong thc t. Mt cm máy tính thut iu phi chm tr ưc s dng ci thin a phưng. Map-Reduce có th bao gm hàng chc ngàn máy tính [2]. Các Khi mt máy tính yêu cu mt tác v mi, nu công vic ưc d liu ưc lưu tr thưng ưc t chc trên h thng phân iu phi tip công bng không có tác v a phưng sn có phi tp tin (ví d h thng tp tin Google (GFS) [10], h thng cho máy tính này, thì công vic tm thi b qua và máy tính tp tin phân tán Hadoop (HDFS) [4]) trong ó phân chia mt kim tra các công vic tip theo trong danh sách. K t khi tp d liu ln thành nhiu on d liu và lưu tr thành nhiu máy tính ưc gii phóng nhanh, nhiu tác v a phưng ưc bn sao (mc nh là 3 bn sao) ca mi on d liu trên các phc v. Tuy nhiên, máy tính ang rnh s ưc gii thiu t máy tính khác khau. Mt yêu cu x lý d liu trong mt máy sn sàng có th b qua tt c các công vic khi nó framework Map-Reduce ưc gi là mt công vic (job) bao không th tìm mt tác v a phưng và vic cân bng gia gm hai loi tác v: “map” (“ánh x”) và “reduce” (“gim”). thi gian rnh và a phưng là không rõ ràng. Thut toán iu Mt tác v “map” c mt on d liu và x lý nó to ra phi Quincy ưc thit k cho Dryad [7] vi mt mô hình phân kt qu trung gian (các cp khoá – giá tr). Sau ó tác v phi máy tính cho phép lưu d liu phc tp hn Map-Reduce. “reduce” ly kt qu trung gian và thc hin các tính toán Quincy s dng tng s d liu truyn như n v o a ISBN: 978-604-67-0635-9 24 24
- Hội Thảo Quốc Gia 2015 về Điện Tử, Truyền Thông và Công Nghệ Thông Tin (ECIT 2015) Hội Thảo Quốc Gia 2015 về Điện Tử, Truyền Thông và Công Nghệ Thông Tin (ECIT 2015) phưng và mã hoá nó vào trong mô hình giá. Sau ó, quyt cn ly d liu u tiên. Các tác v có th phân loi theo các nh iu phi ưc thc hin bng cách gii quyt vn chi máy tính a phưng mà chúng liên kt vi nhau. i vi mi phí thp nht. Ngoài ra, còn có rt nhiu công trình nghiên cu tác v chúng tôi gán ch s ca K máy tính cc b theo mt ã xut thut toán iu phi gii quyt vn ci thin trt t tng dn vào trong mt vector hình thành các loi tác d liu a phưng trong Map-Reduce và ưc trin khai trong v: thc t. Tuy nhiên chưa có công trình nghiên cu nào ưa ra ∈ , , … , ∈ 1,2, … , , < < ⋯ thut toán iu phi công vic có th t ưc min dung < . lưng y (full capacity region) gim thiu thi gian ch i và tc nghn trong mt cm máy tính Map-Reduce. Các ký hiu ∈ ch rng máy tính m là mt máy tính a Vi tình hình ó, mt kin trúc hàng i mi và mt thut phưng cho kiu tác v . Chn ký hiu ℒ biu th cho tp toán iu phi tác v “map” ã ưc xut gn ây trong bài hp các kiu công vic tn ti trong cm và = ℒ. báo k thut [13]. Kin trúc và thut toán này gii quyt ưc A. Quá trình n và quá trình phc v vn d liu a phưng bng vic t ưc min dung lưng y nhm gim thiu thi gian ch i và tc nghn trong Cho biu din tng s lưng kiu công vic n h mt cm máy tính Map-Reduce. Kin trúc hàng i này gm thng cho n thi im bt u ca khe thi gian t. Chúng tôi mt hàng i a phưng tưng ng vi tng máy tính lưu gi s rng quá trình n là hàm tng theo thi gian vi tc tr các tác v a phưng cho các máy này và mt hàng i n . Ti mi máy tính thi gian phc v công vic ưc gi chung cho tt c các máy tính. Da trên kin trúc hàng i này, s là tuân theo phân phi hình hc (geometric distribution). các tác gi nghiên cu mt thut toán iu phi tác v ánh x Tham s phân phi hình hc cho mt công vic ti mt máy (map) vi hai giai on: khi mt tác v mi n nó s ưc tính a phưng là và ti máy tính t xa là . Quá trình phc chuyn n mt trong 3 hàng i tưng ng vi 3 máy tính a v ca mt công vic có th ưc xem như là mt chui các phưng hoc hàng i chung bng chính sách Join the Shortest s kin c lp vi xác sut thành công (hoc ) và chui s Queue (JSQ) và khi mt máy tính rnh nó s chn mt tác v kin s dng mt khi chúng ta có mt s thành công tc là t hàng i a phưng tưng ng vi nó hoc hàng i chung mt công vic ã hoàn thành. Trong mô hình này chúng tôi gi bng cách s dng chính sách MaxWeight [14]. s > , ngha là, thi gian phc v trung bình ca công vic a phưng là ít hn thi gian phc v công vic t xa. Chú ý Có th d dàng thy rng các tác gi ca [13] ch xem xét rng các giá tr khác nhau ca và th hin hiu qu x lý trưng hp sao lưu d liu bng 3 (ngha là mi on d khác nhau i vi d liu a phưng. liu có 3 bn sao ưc lưu tr 3 máy tính khác nhau). Trên thc t, tu thuc vào cu hình h thng, sao lưu d liu có B. Thut toán iu phi công vic (task scheduling algorithm) th ln hn hoc nh hn 3. Trong bài báo này, chúng tôi m rng nghiên cu ca bài báo [13] bng vic xem xét và so sánh iu phi công vic là vic gán các công vic n các máy hiu sut h thng trong các trưng hp sao lưu d liu có tính x lý. Vi vn d liu a phưng, thut toán iu giá tr khác nhau. C th, chúng tôi chng minh lý thuyt và phi công vic có th nh hưng áng k n hiu qu ca h mô phng h thng dùng công c mô phng OMNeT++ cho thng. Trong bài báo này, chúng tôi xem xét mt thut toán trưng hp sao lưu d liu K có giá tr tng quát; ng thi iu phi công vic bao gm hai phn, nh tuyn và iu so sánh hiu sut ca h thng vi các trưng hp dưi ti phi, ưc xut trong bài báo k thut [13]. H thng iu (underload), gn ti (load), và quá ti (overload). Chúng tôi tin phi bao gm mt kin trúc hàng i ưc minh ho bi Hình rng nhng kt qu có ưc s giúp ngưi vn hành h thng 1. Máy Master duy trì mt hàng i các công vic cc b cho Map-Reduce có thêm mt tiêu chí chn các thông s h mi máy tính m, ưc ký hiu là và ưc gi là hàng i thng phù hp. cc b. Có mt hàng i chung cho tt c các máy tính ưc ký hiu là (hoc ôi khi ngưi ta ký hiu ) và ưc Phn còn li ca bài báo ưc t chc như sau. Trong phn gi là hàng i chung t xa (common remote queue). Chúng II, chúng tôi miêu t mô hình h thng. Trong phn III, chúng tôi dùng mt vector chiu dài hàng i = , … , tôi trình bày chng minh lý thuyt v ti ưu hoá thông lưng. , ký hiu cho chiu dài các dàng i ti thi Phn IV cung cp các kt qu mô phng. Cui cùng, chúng tôi im bt u ca khe thi gian t. Khi mt công vic n, máy kt lun bài báo trong phn V. Master nh tuyn công vic này n mt hàng i trong h thng hàng i. Khi mt máy tính là idle, nó chn mt công II. MÔ HÌNH H THNG vic t hàng i a phưng tưng ng hoc hoc t hàng i Chúng tôi xem xét mt mô hình thi gian ri rc cho mt cm chung t xa phc v. Hai bưc này ưc minh ho trong máy tính bao gm M máy tính, ưc ánh s th t 1, 2, …, Hình 1. Chúng ta gi bưc u tiên là nh tuyn (routing) và M. Chúng tôi gi nh rng mi công vic n yêu cu mt tác bưc th hai là iu phi (scheduling). Thut toán c th như v “map”, và mi tác v “map” yêu cu mt mu d liu u sau. vào. Chúng tôi cng gi s rng mi mt mu d liu ưc Bưc 1 - Join the Shortest Queue (JSQ) Routing: Khi mt sao lưu K (K > 1) máy tính khác nhau. Vì vy mi tác v công vic n, máy tính Master s so sánh chiu dài hàng i liên quan n K máy tính a phưng. Phi mt mt thi gian ca K hàng i cc b và hàng i chung t xa và sau ó nh dài hn cho mt máy tính x lý mt tác v nu on d liu cn thit không ưc lưu tr ti a phưng k t khi máy tính tuyn n mt hàng i có chiu dài ngn nht. Cho , 2525
- Hội Thảo Quốc Gia 2015 về Điện Tử, Truyền Thông và Công Nghệ Thông Tin (ECIT 2015) Hội Thảo Quốc Gia 2015 về Điện Tử, Truyền Thông và Công Nghệ Thông Tin (ECIT 2015) và biu din các công vic ưc giao tưng ng vi nu máy tính m là idle tc là = , là 1 hoc 2 và . Các công vic ưc giao n cho mi hàng i có ưc quyt nh bi máy tính Master bng thut toán th ưc biu din bng vector n MaxWeight. Chúng tôi dùng vector iu phi = = , … , , ưc nh ngha như sau: , , … , biu din quyt nh iu phi cho tt c các máy tính. = , , = 1,2, … , , C. ng hc hàng i (queue dynamics) ∈ Trong khe thi gian t, u tiên máy tính Master kim tra thông = . tin trng thái làm vic và chiu dài hàng i . Sau ó các công vic n ti máy tính Master và máy tính Master thc hin nh tuyn và iu phi, cho ta thông tin . Chúng tôi nh ngha: = , = = 1, = , = = 2. Vi nh ngha trên, dch v t máy tính m cho hàng i a phưng và hàng i t xa là hai bin Bernoulli và . Do ó, các dch v ưc áp dng cho mi hàng i có th ưc biu din , bng vector dch v = , … , vi tc dch v hoc . Khi ó chiu dài các hàng i tho mãn các phưng trình sau: Hàng i a phưng (Local queues): vi m=1,2, …, M, 1 = , trong ó: Hình 1: Kin trúc hàng i và thut toán iu phi 1, = Bưc 2 - MaxWeight Scheduling: Nu mt máy tính m va = . hoàn thành mt công vic ti khe thi gian t-1, thì trng thái Hàng i t xa (Remote queue) làm vic ca nó là idle. Nu không, máy tính phi thc hin mt công vic a phưng hoc mt công vic t xa. Cho 1 = , = , 1, 2 biu din tưng ng cho 3 trng thái: idle, ang thc hin mt công vic a phưng, và ang thc hin trong ó: mt công vic t xa. Vector trng thái làm vic = = , , , … , và vector chiu dài hàng i ∈ ưc báo cáo v cho máy tính Master ti thi im bt u ca khe thi gian t và máy tính Master quyt nh iu phi cho vi là tp các máy tính mà nó phc v mt vài công vic tt c các máy tính da trên và . Các máy tính idle t hàng i t xa ti slot thi gian t. Chú ý rng có th có mt ưc iu phi bi thut toán MaxWeight: gi s máy tính m vài máy tính c gng phc v hàng i t xa nhưng tht bi do là idle ti slot thi gian t, thì nó phc v mt công vic a thiu công vic. phưng nu và phc v mt công vic t Chúng ta có th vit li phưng trình ng hc hàng i như xa cho các trưng hp khác. Các máy tính khác tip tc thc sau: hin các công vic chưa hoàn thành tc là thc hin các công vic không ưu tiên. Cho biu din quyt nh iu phi 1 = , (1) ca máy tính m ti slot thi gian t, thì nó là mt hàm ca . vi = , … , , và và Trong trưng hp thi gian phc v là xác nh, quá trình 1 hàng i , là chui Markov. Tuy nhiên thi gian = , phc v trong mô hình này là ngu nhiên và không ng nht 2. do vn d liu a phưng. Do ó chúng ta cn xem xét Lưu ý rng cho bit hàng i máy tính m ã ưc iu thêm các vector trng thái làm vic ; c th, cùng phi phc v. Nó ch có giá tr 1 hoc 2 k t khi ưc iu vi s to thành chui Markov , , . phi phc v mt công vic a phưng hoc mt công vic Chúng ta gi nh trng thái ban u là , = t xa. Nu máy tính m không idle tc là = 12 , , và không gian trng thái chúng ta thit lp iu phi bng vi . Tuy nhiên, ,1,2 bao gm tt c các trng thái mà nó có th t ưc 26 26
- Hội Thảo Quốc Gia 2015 về Điện Tử, Truyền Thông và Công Nghệ Thông Tin (ECIT 2015) Hội Thảo Quốc Gia 2015 về Điện Tử, Truyền Thông và Công Nghệ Thông Tin (ECIT 2015) t trng thái ban u, vi là tp s nguyên không âm. D chn ngoài Ʌ. Do ó thut toán này là ti ưu thông lưng và Ʌ thy rng chui Markov này là ti gin (irreducible) và không cng là min dung lưng ca h thng. tun hoàn (aperiodic). Chng minh: III. TI U HOÁ THÔNG LNG Chng minh này tưng t như chng minh ca nh lý 1 trong bài báo k thut [13], tuy nhiên, [13] ch xét trưng hp Trong phn này, chúng tôi s chng minh tính nng ti ưu hoá K=3. Vi trưng hp K tng quát, ta thy rng tp ℒ (tp hp thông lưng ca thut toán iu phi ưc trình bày phn các kiu công vic) s thay i, và = ℒ cng thay i. Tuy trưc. Chú ý rng tính nng này ã ưc chng minh trong bài nhiên, chng minh ca nh lý 1 trong [13] vn có th ưc báo k thut [13] vi trưng hp K=3; trong phn này chúng m rng cho trưng hp K tng quát. Vì lý do gii hn v tôi m rng chng minh vi trưng hp K tng quát. dài bài báo, chúng tôi ch nêu ý tưng chng minh ây và Ý tưng ca chng minh như sau: Trưc tiên chúng ta xác mi ngưi c tham kho bài báo [13] v chi tit. Ý tưng ca nh min chn ngoài (outer bound) ca min dung lưng ca chng minh như sau: Vì , , là mt chui h thng. Sau ó chúng ta chng minh rng thut toán iu Markov ti gin và không tun hoàn, s n nh ưc nh phi trên có th n nh hoá bt k vector tc n nào ngha là s hi quy dưng (positive recurrence) ca chui thuc min chn ngoài này (n nh hoá theo ngha các hàng Markov này. Da theo nh lý Foster-Lyapunov m rng, ta i u n nh và không tng theo thi gian). iu ó có ch cn tìm mt s dưng T và mt hàm Lyapunov sao cho ngha là thut toán iu phi trên là ti ưu thông lưng, và trôi ca hàm Lyapunov (Lyapunov drift) sau T khe thi gian b min dung lưng cng trùng vi min chn ngoài. chn nu bên trong mt tp con hu hn ca không gian trng thái và là âm nu bên ngoài tp con này. C th hàm A. Min dung lng (capacity region) Lyapunov ưc chn có dng: i vi bt k kiu công vic ∈ ℒ, chúng ta gi nh rng s lưng kiu công vic n ưc phân b n máy m có tc , = = , , vi = , . Tp tc , ∈ℒ,,…, ưc gi là mt phân tích (decomposition) ca vector tc Khi ó ta có th chng minh rng (tham kho chi tit trong = , , … , . Vi vector tc n , xét mt máy [13]) trôi Lyapunov sau T khe thi gian t t0 ưc chn bi , ≤ 2 vi hng s > . nh tính m bt k, iu kin cn h thng ưc n nh là khi lưng tác v trung bình ưc phân b cho máy tính m trong ngha tp ß = , ∈ ⋯ ≤ vi mt khe thi gian có th ưc phc v ht trong khe thi gian > bt k. Khi ó ß là mt tp con hu hn ca không ó, có ngha là: gian trng thái vi , ∈ ß , , ≤ và , ∈ , , ß, , ≤ . iu này tho mãn nh lý Foster-Lyapunov ≤ 1, (2) m rng và hoàn thành chng minh. ∈ ∉ IV. KT QU MÔ PHNG trong ó v trái là thi gian máy tính m cn có phc v Trong phn trưc chúng tôi ã chng minh tính ti ưu hoá lưng tác v trung bình phân b cho nó trong mt khe thi thông lưng ca thut toán iu phi ưc xut ngay c vi gian, vi tc dch v cho công vic a phưng và cho sao lưu d liu K tng quát. Tuy nhiên, câu hi ưc t ra công vic t xa. là hiu sut h thng ca thut toán iu phi thay i th nào Gi Ʌ là tp giá tr tc n mà mi phn t phân tích ca nó vi các giá tr K khác nhau. Chúng tôi s tr li câu hi ó tho mãn (2). C th: trong phn này vi các kt qu mô phng. Ʌ = = , , … , Chúng tôi mô phng thut toán vi các giá tr sao lưu = , , ∀ ∈ ℒ, (3) d liu: K = 2, 3, 4, 6, 8, 10, và so sánh hiu sut ca h thng vi các trưng hp dưi ti (underload), trong ti (load) và , , ∀ ∈ ℒ, ∀ = 1, … , quá ti (overload). Tiêu chun ánh giá da vào tng s lưng các tác v còn tn ti trong các hàng i a phưng và hàng , , i t xa sau mi khe thi gian. ≤ 1, ∀ = 1, … , . Chúng tôi thc hin mô phng trên h thng vi 400 máy ∈ ∉ tính và mt tp d liu ưc phân b ng u trên 320 máy D thy rngɅ chính là min chn ngoài ca min dung lưng trong s ó. Thi gian phc v cho tác v a phưng và tác ca h thng. v t xa tuân theo phân phi hình hc vi tham s tưng ng là = .8 và = .2. Vì vy tng dung lưng ca h thng B. Tính ti u thông lng (throughput optimality) (tính theo s tác v n trong mt n v thi gian) bng = nh lý 1: Thut toán iu phi ưc xut Phn II.B có 320 α + 80γ = 272. Tng thi gian chy ca h thng là 2000 th n nh h thng vi vector tc n bt k thuc min n v thi gian. 27 27
- HộiHội Thảo Quốc Thảo GiaGia Quốc 2015 2015vềvềĐiện ĐiệnTử, Tử,Truyền TruyềnThông và Công Thông và CôngNghệ NghệThông ThôngTinTin (ECIT (ECIT 2015) 2015) Bng 1 cho thy kt qu trung bình theo thi gian ca tng A. Trng hp di ti (underload) s lưng tác v còn trong hàng i (tưng ng vi tng chiu Vi trưng hp này chúng ta cho h thng chy vi tc dài ca tt c các hàng i) vi các giá tr khác nhau ca tc tác v n = 100 (tác v trong mt n v thi gian). Chy tác v n () và sao lưu d liu (K). Kt qu này cng vi K = 2, 3, 4, 6, 8, 10 vi thi gian 2000 n v thi gian. ưc th hin trong th Hình 2. C th, Hình 2 biu din s bin thiên ca tng chiu dài trung bình hàng i theo s Chúng ta theo dõi tng s lưng tác v tc thi trong h thay i ca tc tác v n ng vi các trưng hp K = 2, thng quan sát s n nh. Hình 3 cho thy con s i din 3, 4, 6, 8, 10. Ta có th thy rng khi tc n nh (dưi ti này n nh theo thi gian, qua ó thy rõ s n nh ca h – underload), tng chiu dài trung bình hàng i tng dn khi thng. Vi kt qu như Hình 3 chúng ta thy rng hiu sut h K tng dn, ngha là giá tr K nh s có hiu sut cao hn trong thng vi sao chép d liu K = 2, 3, 4, 6, 8, 10 luôn luôn n trưng hp này. Tuy nhiên, khi tc n tng dn (ti tng nh theo thi gian. Tuy nhiên vi trưng hp này sao chép dn), tng chiu dài trung bình hàng i ng vi giá tr K nh d liu K = 2 tt hn các trưng hp khác. tng nhanh hn tng chiu dài trung bình hàng i ng vi giá tr K ln. c bit, khi tc n gn ti (gn dung lưng h thng), tng chiu dài trung bình hàng i gim dn khi K tng dn, ngha là giá tr K ln s cho hiu sut cao hn. Hình 3: Kt qu trưng hp = 100 B. Trng hp gn ti (load) Vi trưng hp này chúng ta cho h thng chy vi tc tác v n ln lưt là = 200 (tác v trong mt n v thi gian), = 250 (tác v trong mt n v thi gian), = 260 (tác v trong mt n v thi gian), và = 270 (trong mt n v thi gian). Chy vi K = 2, 3, 4, 6, 8, 10 vi thi gian 2000 n v Hình 2: Hiu sut thông lưng h thng thi gian. Bng 1: Kt qu s lưng công vic trung bình trong h thng Vi kt qu như Hình 4, Hình 5 chúng ta thy rng tng s CCCCCCSSCC K lưng tác v tc thi trong h thng vn n nh theo thi K=2 K=3 K=4 K=6 K=8 K=10 gian. Kt qu Hình 6, Hình 7 cho thy tng s lưng tác v 100 42 48 55 68 77 85 tc thi trong h thng có chiu hưng quá ti. Tuy nhiên vi 120 65 66 75 90 101 110 các trưng hp này sao chép d liu K = 10 tt hn các 140 114 89 96 113 127 136 trưng hp khác. 160 371 122 122 138 153 163 180 503 330 159 166 180 191 200 596 445 347 203 211 220 220 713 530 444 344 270 258 230 798 584 490 390 349 316 240 937 663 555 444 398 371 250 1613 849 690 544 482 437 260 8277 7673 7608 7209 7280 6788 272 22941 22514 22456 22042 22205 21752 300 57792 57420 57438 57050 57246 56792 K tip, chúng tôi xem xét quá trình thay i ca tng chiu dài hàng i theo thi gian ng vi các giá tr khác nhau ca và K. Hình 4: Kt qu trưng hp = 200 28 28
- HộiHội Thảo Quốc Gia 2015 về Điện Tử, Truyền Thông và Công Nghệ Thông Tin (ECIT 2015) Thảo Quốc Gia 2015 về Điện Tử, Truyền Thông và Công Nghệ Thông Tin (ECIT 2015) V. KT LUN Trong bài báo này chúng tôi ã k tha và m rng kt qu nghiên cu ca các tác gi W. Wang, K. Zhu, L. Ying, J. Tan, và L. Zhang trong bài báo k thut [13] cho trưng hp sao lưu d liu có giá tr tng quát. Trong h thng Map-Reduce thc t, sao lưu d liu là mt thông s quan trng và chúng tôi tin rng nhng kt qu có ưc trong bài báo này s giúp ngưi vn hành h thng Map-Reduce có thêm mt tiêu chí chn các thông s h thng phù hp. TÀI LIU THAM KHO Hình 5: Kt qu trưng hp = 250 [1] C. Abad, Y. Lu, and R. Campbell (2011), “DARE: Adaptive data replication for efficient cluster scheduling” in IEEE Int. Conf. Cluster Computing (CLUSTER), pp. 159–168. [2] G. Ananthanarayanan, S. Agarwal, S. Kandula, A. Greenberg, I. Stoica, D. Harlan, and E. Harris (2011), “Scarlett: coping with skewed content popular in MapReduce clusters” in Proc. European Conf. Computer Systems (EuroSys), pp. 287–300. [3] J. Dean and S. Ghemawat (2008), “MapReduce: simplified data processing on large clusters” ACM Commun, vol 51 (no. 1), pp. 107– 113. [4] K. Shvachko, H. Kuang, S. Radia, and R. Chansler (2010), “The hadoop distributed file system” in IEEE Symp. Mass Storage Systems and Technologies (MSST), pp. 1–10. [5] L. Tassiulas and A. Ephremides (1992), “Stability properties of constrained queueing systems and scheduling policies for maximum throughput in multihop radio networks” IEEE Trans. Autom. Control, vol 4, pp. 1936–1948. Hình 6: Kt qu trưng hp = 260 [6] M. Zaharia, D. Borthakur, J. Sen Sarma, K. Elmeleegy, S. Shenker, and I. Stoica (2010), “Delay scheduling: a simple technique for achieving locality and fairness in cluster scheduling” in Proc. European Conf. Computer Systems (EuroSys), pp. 265–278. [7] M. Isard, V. Prabhakaran, J. Currey, U. Wieder, K. Talwar, and A. Goldberg (2009), “Quincy: fair scheduling for distributed computing clusters” in Proc. ACM Symp. Operating Systems Principles (SOSP), Big Sky, MT, pp. 261-276. [8] S. T. Maguluri and R. Srikant (2013), “Scheduling jobs with unknown duration in clouds” in Proc. IEEE Int. Conf. Computer Communications (INFOCOM), Turin, Italy. [9] S. T. Maguluri, R. Srikant, and L. Ying (2012), “Heavy traffic optimal resource allocation algorithms for cloud computing clusters” in Int. Teletraffic Congr. (ITC), Krakow, Poland. [10] S. Ghemawat, H. Gobioff, and S.-T. Leung (2003), “The google file system” in Proc. ACM Symp. Operating Systems Principles (SOSP), pp. Hình 7: Kt qu trưng hp = 270 29–43. [11] S. Kavulya, J. Tan, R. Gandhi, and P. Narasimhan (2010), “An analysis C. Trng hp quá ti (overload) of traces from a production MapReduce cluster” in Proc. IEEE/ACM Int. Conf. Cluster, Cloud and Grid Computing (CCGRID), pp. 94–103. Vi trưng hp này chúng ta cho h thng chy vi tc tác [12] T. White (2010), Hadoop: The definitive guide, Yahoo Press. v n ln lưt = 272 (tác v trong mt n v thi gian), [13] W. Wang, K. Zhu, L. Ying, J. Tan, and L. Zhang, (2013), “MapTask = 300 (tác v trong mt n v thi gian). Chy vi K = 2, 3, scheduling in MapReduce with data locality: Throughput and heavy- 4, 6, 8, 10 vi thi gian 2000 n v thi gian. traffic optimality”, in Proc. IEEE Int. Conf. Computer Communications (INFOCOM), Turin, Italy. Vi kt qu Bng 1 chúng ta thy rng ng vi c hai giá tr [14] L. Tassiulas and A. Ephremides (1993), “Dynamic server allocation to trong trưng hp này tng s lưng tác v trung bình theo thi parallel queues with randomly varying connectivity” IEEE Trans. Inf. Theory, vol. 39, pp. 466–478. gian là tưng ưng nhau cho tt c các giá tr ca K, và h [15] http://hadoop.apache.org. thng luôn luôn quá ti. [16] https://omnetpp.org. 29 29
ADSENSE
CÓ THỂ BẠN MUỐN DOWNLOAD
Thêm tài liệu vào bộ sưu tập có sẵn:
Báo xấu
LAVA
AANETWORK
TRỢ GIÚP
HỖ TRỢ KHÁCH HÀNG
Chịu trách nhiệm nội dung:
Nguyễn Công Hà - Giám đốc Công ty TNHH TÀI LIỆU TRỰC TUYẾN VI NA
LIÊN HỆ
Địa chỉ: P402, 54A Nơ Trang Long, Phường 14, Q.Bình Thạnh, TP.HCM
Hotline: 093 303 0098
Email: support@tailieu.vn