Hatékony cache szervezések vizsgálata

OData támogatás
Konzulens:
Dr. Horváth Gábor
Hálózati Rendszerek és Szolgáltatások Tanszék

Napjainkban, mivel a CPU órajelének további növelése fizikai határokba ütközik, a párhuzamosítás mellett egy másik fontos irány van jelen a kutatásban, mely a CPU-ban található cache-elés hatékonyságát kívánja javítani, hiszen ez az a terület, ahol további sebességnövekedés érhető el, az időigényes várakozást okozó cache hibák számának csökkentésével.

Diplomatervemben bemutatok különféle CPU cache tulajdonságokat, külön kiemelve, hogy a napjainkban elterjedtebb asztali CPU családok melyik kategóriába sorolhatók. Bemutatok néhány, a gyakorlatban elterjedt, alapvető szervezést és cserealgoritmust. Az alapvető szervezéseket és cserealgoritmusokat követi az elvégzett irodalomkutatás során talált néhány összetettebb cache megoldás részletesebb leírása. Ezt a cache szervezések és cserealgoritmusok hatékonyságára vonatkozó mérőszámok bemutatása után programok lokalitásának mérésére, és vizuális megjelenítésére alkalmas módszerek leírása követi.

A munka második részében röviden bemutatom az olvasónak az Intel által fejlesztett Pin keretrendszert, valamint az ennek segítségével általam elkészített, bináris programok memóriaeléréseinek naplózására alkalmas eszközt. Az eszköz bemutatását a kiválasztott alapvető és összetett szervezések implementációinak bemutatása követi.

A munka utolsó részében az implementált eszközök segítségével néhány, gyakorlatban használt program memóriaelérés sorozatát rögzítem. Az implementált szimulációs és vizualizációs algoritmusok segítségével összehasonlítom és értékelem az egyes programok lokalitását, valamint a cache algoritmusok működését.

Letölthető fájlok

A témához tartozó fájlokat csak bejelentkezett felhasználók tölthetik le.