Wie viel kostet der Zeitplan?

Die Basisdaten von Computerexperimenten zur Reorganisation der Tiered-Parallel-Form (LPF) von Informationsgraphen von Algorithmen (TGA) sind in der vorherigen Veröffentlichung angegeben . Der Zweck der aktuellen Veröffentlichung ist es, die endgĂŒltigen Ergebnisse der Forschung zur Entwicklung von ZeitplĂ€nen fĂŒr die AusfĂŒhrung paralleler Programme im Hinblick auf die rechnerische KomplexitĂ€t der Transformation selbst und die QualitĂ€t der resultierenden ZeitplĂ€ne aufzuzeigen. Diese Arbeit ist das Ergebnis eines genau definierten Forschungszyklus in dem betrachteten Bereich.





Wie bereits erwĂ€hnt, wird die RechenkomplexitĂ€t (BT) in diesem Fall in Bewegungseinheiten von Operatoren von Schicht zu Schicht berechnet, wĂ€hrend der YAPF neu organisiert wird. Dieser Ansatz kommt dem klassischen Verfahren zum Bestimmen des BT von Ordnungs- (Sortier-) Operationen von numerischen Arrays nahe, der Nachteil besteht darin, dass die KomplexitĂ€t der Verfahren zum Bestimmen der Elemente fĂŒr die Permutation nicht berĂŒcksichtigt wird.





weil Im akzeptierten Modell bestimmt der YAPF tatsĂ€chlich die AusfĂŒhrungsreihenfolge der Operatoren eines parallelen Programms (die Operatoren werden nacheinander in Gruppen von Ebenen ausgefĂŒhrt). Aus GrĂŒnden der VerkĂŒrzung verwenden wir manchmal die AbkĂŒrzung „YAPF“ als ein Synonym fĂŒr das Konzept eines Plans (Zeitplans) zur AusfĂŒhrung eines Parallelprogramms. Aus offensichtlichen GrĂŒnden wurden die Studien an Daten eines relativ kleinen Volumens unter der Annahme durchgefĂŒhrt, dass die Richtigkeit der erhaltenen Ergebnisse bei der Verarbeitung von Daten grĂ¶ĂŸerer GrĂ¶ĂŸe erhalten bleibt. Die in dieser Veröffentlichung beschriebenen Studien sollen die FĂ€higkeiten der verfĂŒgbaren Tools zur Lösung der zugewiesenen Aufgaben demonstrieren. Falls gewĂŒnscht, ist es möglich, einen beliebigen Algorithmus zu untersuchen, indem er im Datenflussmodul beschrieben und debuggt wird mit anschließendem Import im Format eines Informationsgraphen in das SPF @ home-Modul zur weiteren Verarbeitung.





Wir betrachten weiterhin das Erreichen der maximalen Codedichte (tatsĂ€chlich die maximale Last der verfĂŒgbaren Einzelcomputer des Parallelcomputersystems) als Hauptziel der LPF-Transformationen . Übrigens ist genau mit diesen Konzepten die bekannte böse-ironische Aussage ĂŒber die ĂŒbermĂ€ĂŸige Anzahl von NOP-Anweisungen in den „BĂŒndeln“ eines extra langen Maschinenworts in den Computern der VLIW-Architektur verbunden (auch wenn Es gibt Abschnitte mit vollstĂ€ndig sequentiellem Code. Die LĂŒcken in einem extra langen Wort sollten formal mit einer Operation gefĂŒllt werden - "Dummy") ...





, (   ), Lua . ( ).





  ( ),   ( - ). , .   





    . ,   , .2 SPF@home (http://vbakanov.ru/spf@home/content/install_spf.exe). – , {k,l} ( ) ik,jk il,jl, i,j – ( , ; ).





(, ) , – .





( ) (, ) –   “1-01_bulldozer” vs “1-02_bulldozer”, - “WidthByWidtn” vs “Dichotomy”. , 






1.

  () . ( ). ( ). .. , .





– “1-01_bulldozer” “1-02_bulldozer”.





. 1-3; ( ):





  • a), b) ) – , (CV ),  ( ) ;





  • (), () - () – , “1-01_bulldozer”   “1-02_bulldozer” c.





Abbildung 1. Parameter des parallelen AusfĂŒhrungsplans unter Beibehaltung der LPF-Höhe fĂŒr den Algorithmus zum Multiplizieren quadratischer Matrizen der 2,3,5,7,10-ten Ordnung (entspricht der Nummerierung entlang der Abszissenachsen) nach der klassischen Methode
1. 2,3,5,7,10- ( )
 2.         
        5,10,15,20- 
 (    )
2. 5,10,15,20- ( )
 3.         
       ()   
2,3,4,5,7,10-  (     )  
()
3. () 2,3,4,5,7,10- ( ) ()

. 1-3 , . ., . 1a) 1,7 ( “1-01_bulldozer”) 3 ( “1-02_bulldozer”) 10- .





(. 1b) 0,3 ( ) “1-02_bulldozer” , , .





(. 1c) “1-02_bulldozer” ( 3,7 10) “1-01_bulldozer”.





, .





  “1-02_bulldozer” (. 2).





() 10 (. 3) . (. 3a), CV (. 3b), “1-02_bulldozer” (. 3c).





 , , (   ) . .. , ( ).





2.

VLIW- ( “”, “” ). .





  W ( W=W0 W=1, W0 – , ). – “Dichotomy” “WidthByWidtn”:





  • “Dichotomy”. – c W c    . W, ,   W. , “” ( ).





  • “WidthByWidtn”. N>W   , :





  ,  .





. 4,5  -     () ; “WidthByWidtn” “Dichotomy” . ,   “” .





 4.   ()     (), 
;        
 5  10-  – . a)  b)
4. () (), ; 5 10- – . a) b)
Abbildung 5. Zunahme der Höhe (Ordinaten) bei Begrenzung der Breite des YPF (Abszisse), Zeiten;  ein Algorithmus zum Lösen eines Systems linearer algebraischer Gleichungen nach der direkten (nicht iterativen) Gauß-Methode 5. und 10. Ordnung - Abb.  a) bzw. b)
5. () (), ; () 5 10- – . a) b)

. 4 5, ( , ,  !). , .





“ -” “WidthByWidtn” , “Dichotomy”; . “WidthByWidtn” , N./W. , N. – , W. – .





Figure 6. Die Anzahl der Bewegungen von Operatoren zwischen den Ebenen - a) und der Variationskoeffizient CV - b) mit einer Verringerung der Breite des FP fĂŒr den Algorithmus zum Multiplizieren von Quadratmatrizen 10. Ordnung mit der klassischen Methode (der Abszisse) Achse ist die Breite des FP nach der Reform)
6. - a) CV - b) 10- ( – )
Figure 7. Die Anzahl der Verschiebungen von Operatoren zwischen den Ebenen - a) und der Variationskoeffizient CV - b) mit einer Verringerung der Breite des LPF fĂŒr den Algorithmus zum Lösen eines Systems linearer algebraischer Gleichungen 10. Ordnung durch die direkte (nicht iterative) Gauß-Methode (die Abszissenachse ist die Breite des LPF nach der Reformierung)
7. - a) CV - b) 10- () ( – )

, . 6 7, ( , – ).   . 6 7,   “WidthByWidtn” ( 3-4 ) ( ) “Dichotomy” ( ). , () “WidthByWidtn” “Dichotomy” ( ).





.. () . .





, ( ) .





  ( ) .






:





  • (https://habr.com/ru/post/530078/, 26.11.2021)





  •   (https://habr.com/ru/post/534722/, 24.12.2021)





  • (https://habr.com/ru/post/535926/, 03.01.2021)





  • Streaming-Computerdynamik ( https://habr.com/ru/post/540122/ , 02/01/2021)





  • ParallelitĂ€t und Codedichte ( https://habr.com/ru/post/545498/ , 03/05/2021)





  • Wie hoch ist der Zeitplan ( https://habr.com/ru/post/551688/ , 10.04.2021) - aktuell








All Articles