# Анализ стратегии замещения данных Random в устройстве управления с кэш-памятью ассоциативного типа

Ковальов С.А., Шишко С.Н. Донецкий национальный технический университет shishko@cs.dgtu.donetsk.ua

### **Abstract**

Kovalov S.A., Shishko S.N. Analyse of Random data replacement strategy in CMCU with associative cache. Replacement strategy is the main part of any unit which uses cache technology. The area of cache technology usage defines the replacement strategy which is more efficient for it. It depends on each area of caching provides its own features and demand some approximation of replacement strategy.

### Введение

Большинство цифровых устройств построены с учётом принципа микропрограммного управления. Для реализации этого принципа цифровоё устройство чаще всего представляется совокупностью управляющего и операционного автомата. Управляющий автомат координирует работу всех блоков цифрового устройства. Одним из способов его реализации является композиция автоматов с «жёсткой» и «программируемой» логикой. Такой автомат имеет минимально возможную ёмкость управляющей памяти и максимальное быстродействие и называется композиционным микропрограммным устройством управления (КМУУ)[1].

# Постановка задачи

Одним из уровней иерархии памяти, используемым в вычислительных устройствах, может выступать кэш-память, структурно расположенная между вычислителем и основной памятью [2,3,4,5,6]. Выполненная обычно на микросхемах статической памяти SRAM, кэш-память используется для хранения команд и данных, которые требуются ВУ на протяжении текущего такта. Статистический анализ работы современных вычислительных устройств показывает, что около 90% всех запрашиваемых данных обычно находится в кэш-памяти; эта величина называется коэффициентом кэш-попадания. Если ВУ находит нужную ему информацию в кэш-памяти, это называется кэш-попаданием, иначе ему приходится искать нужную информацию в основной памяти; такая ситуация называется кэш-промахом. Использование кэш-памяти также предполагает наличие кэшконтроллера – специального блока, управляющего работой такой памяти [5,6].

Одним из способов повышения быстродействия КМУУ является использование в структуре КМУУ кэш-памяти, предназначенной для хранения наиболее часто используемых микрокоманд и выполненной на быстродействующих микросхемах типа SRAM. (рис.1)



Рисунок 1 - Структурная схема КМУУ с кэш-памятью

Автомат адресации реализуется с помощью комбинационной схемы КС и регистра памяти РП и формирует адреса микрокоманд, которые хранятся в управляющей памяти УП. Счётчик адреса микрокоманд СЧАМК и управляющая память УП являются автоматом с программируемой логикой и естественной адресацией микрокоманд. Для хранения наиболее часто используемых микрокоманд используется кэш-память КП. Кэшконтроллер К предназначен для управления процессом выбора микрокоманды из памяти. Кэшконтроллер, помимо управления УП и КП, также управляет подачей синхронизации на входы СЧАМК и РП.

Основными способами архитектурной организации кэш-памяти является кэш-память с прямым отображением и полностью ассоциативная кэш-память [7]. В кэш-памяти с прямым отображением каждому блоку микрокоманд сопоставляется строго определённая строка кэшпамяти. В полностью ассоциативной кэш-памяти любой блок может быть размещен в любой строке кэша. Ассоциативность предполагает наличие стратегии, по которой будет выбираться замещаемая строка. Стратегия замещения обычно реализуется аппаратно и является важнейшей характеристикой кэш-памяти полностью ассоциативного типа

# Анализ стратегии

В качестве стратегии замещения данных предлагается проанализировать стратегию замещения Random, в которой в случае кэш-промаха замещаемый блок выбирается случайным образом [9,10]. При реализации этой стратегии в кэшконтроллере может быть использован генератор случайных чисел, максимально генерируемое значение которого, равно количеству строк в кэш памяти. Реализации основных стратегий замещения, таких как FIFO, LRU, MRU, LFU, Second Chance и др., предполагает накопление и анализ различного рода статистических данных [11], например о частоте или порядке использования блоков в кэшпамяти. Это требует дополнительных затрат аппаратуры, резко возрастающих с увеличением объёма кэш-памяти, т.к. для накопления и анализа данных необходимо использовать дополнительные блоки регистров (рис. 2).



Рисунок 2 - Регистровая структура кэшпамяти полностью ассоциативного типа, реализующая алгоритмы FIFO,LRU,MRU, LFU, Second Chance.

Каждой строке кэш памяти ставится в соответствие отдельный регистр из блока регистров накопления и анализа данных (БРНАД) в котором в зависимости от выбранной стратегии накапливаются и анализируются данные, на основании которых выбирается замещаемая строка

При реализации стратегии Random нет необходимости использовать дополнительные блоки регистров, так как строка кэш памяти замещается при каждом кэш-промахе случайным образом и накопление и анализ каких либо данных не происходит (рис 3).



Рисунок 3 - Регистровая структура кэшпамяти полностью ассоциативного типа, реализующая алгоритм Random.

Блок регистров тэгов (БРТ) содержит тэги блоков микрокоманд, находящихся в данный момент в кэш-памяти, а также бит достоверности данных v-bit. Разрядность регистров тэгов на один разряд больше разрядности поля тэга в адресе микрокоманды.

Блок данных (БД) представляет собой модуль статической памяти, состоящий из N строк по S ячеек в каждой строке. Здесь число N не обязательно является целой степенью двойки. Это связано с тем, что в адресе микрокоманды отсутствует поле, определяющее строку кэшпамяти, и эта строка определяется кэшконтроллером. Однако увеличение числа строк кэшпамяти приводит к значительному усложнению схемы кэш-контроллера. Каждая строка блока данных может хранить любой блок микрокоманд из УП.

Применительно к КМУУ последовательность алгоритма замещения Random может быть следующей:

На первом шаге из адреса запрашиваемой микрокоманды выделяется поле тэга.

На втором шаге проверяется, произошло кэш-попадание или кэш-промах. Последовательно для каждой из N строк кэш-памяти проверяется следующее:

Если содержимое і-й строки достоверно и тэг блока, находящегося в этой строке, совпадает с тэгом в адресе МК, то имеет место кэшпопадание и выполняется «короткий» цикл чтения из і-й строки микрокоманды, соответствующей полю Word в адресе МК.

 В противном случае проверяется следующая строка. Если проверены все строки и совпадение тэгов не обнаружено, то имеет место кэш-промах.

На третьем шаге выполняется последовательная проверка всех строк кэш-памяти на достоверность их содержимого. Для замещения выбирается первая обнаруженная строка с недостоверным содержимым. Этот шаг эффективен лишь до тех пор, пока не будут выполнены первые N кэш-промахов, после чего проверка строк на достоверность будет излишней — все строки будут содержать некоторые блоки микрокоманд из УП. Однако в дальнейшем выполнение этого шага не замедляет работу кэш-контроллера, поскольку фактически шаг 3 выполняется аппаратно одновременно с шагом 4, и имеет лишь логический приоритет в выборе замещаемой строки.

На четвертом шаге кэш-контроллер случайным образом генерирует число от 1 до числа равное количеству строк в кэш памяти. Таким образом, генерируемое число соответствует номеру строки кэш-памяти. Строка с соответствующим номером подлежит замещению.

В общем случае, недостатком случайного выбора замещаемой строки является то, что не учитывается возможная высокая вероятность обращения к замещаемому блоку в ближайшее время. Вероятность кэш-попаданий алгоритма при использовании той или иной стратегии зависит от области использования технологии кэширования.

В таблице 1 показаны результаты имитационного моделирования в среде С++ стратегии Random и LRU (Least Recently Used) в КМУУ с кэш-памятью полностью ассоциативного типа. Исходными данными при определении вероятности кэш попаданий, являются: граф схема реализуемого алгоритма, вероятности переходов по логическим условиям, адресация микрокоманд, число строк и слов в кэш-памяти. Вероятности логических условий считаются известными, потому что эти значения могут зависеть не только от результатов выполнения микрокоманд, но и от внешних факторов (например, от датчиков). Эти значения могут быть получены только опытным путём в процессе функционирования КМУУ, реализующего алгоритм в реальных условиях. Содержимое операционных микрокоманд (ОМК) на этапе определения вероятности кэш-попаданий не имеет значения. Действия, выполняемые в ОМК, либо никак не влияют на процесс выполнения алгоритма, либо влияют на вероятности переходов логических условий, которые уже считаются заданными. Экспериментальный способ определения вероятности кэш попаданий заключается в построении программной модели КМУУ с кэшпамятью с целью сбора статистической информации о количестве кэш-попаданий и кэш-промахов в процессе многократного выполнения алгоритма.

Вероятность кэш попаданий алгоритма определяется как сумма вероятностей кэшпопаданий каждой микрокоманды алгоритма.

$$P_h(G) = \sum_{i=1}^{M} P_h(a_i)$$

 $P_h(a_i)$  - частота возникновения кэшпопаданий каждой микрокоманды алгоритма.

Получены значения вероятности кэшпопаданий для алгоритма размерностью в 20 микрокоманд при разных размерах кэш-памяти. В верхней части ячейки показана вероятность кэшпопаданий алгоритма, используя стратегию Random а в нижней части используя стратегию LRU. При этом N-количество строк в кэш-памяти, Sколичество слов в строке кэш-памяти (табл.1). Для каждой размерности кэш-памяти было выполнено 100000 повторений алгоритма. Такое большое количество повторений необходимо для более точного определения количества кэшпопаданий. Это связано с тем, что переходы по ветвям логических условий выбираются каждый раз случайным образом и при каждом проходе алгоритма может выполняться разное количество микрокоманд.

Таблица-1 — Вероятности кэш-попаданий алгоритма при использовании стратегии LRU и Random.

| SN | 1     | 2     | 3     | 4     | 5     | 6     |
|----|-------|-------|-------|-------|-------|-------|
| 1  | 0,276 | 0,310 | 0,393 | 0,402 | 0,426 | 0,467 |
|    | 0,276 | 0,329 | 0,393 | 0,463 | 0,544 | 0,631 |
| 2  | 0,276 | 0,310 | 0,393 | 0,402 | 0,425 | 0,468 |
|    | 0,276 | 0,329 | 0,393 | 0,463 | 0,544 | 0,630 |
| 3  | 0,553 | 0,618 | 0,671 | 0,675 | 0,944 | 0,944 |
|    | 0,553 | 0,630 | 0,716 | 0,821 | 0,944 | 0,944 |
| 4  | 0,553 | 0,618 | 0,671 | 0,675 | 0,944 | 0,944 |
|    | 0,553 | 0,630 | 0,716 | 0,821 | 0,944 | 0,944 |
| 5  | 0,674 | 0,761 | 0,966 | 0,966 | 0,966 | 0,966 |
|    | 0,674 | 0,809 | 0,966 | 0,966 | 0,966 | 0,966 |
| 6  | 0,674 | 0,761 | 0,966 | 0,966 | 0,966 | 0,966 |
|    | 0,674 | 0,809 | 0,966 | 0,966 | 0,966 | 0,966 |

Исходя из содержимого таблицы, можно сделать вывод, что значения вероятности кэшпопаданий алгоритма, используя стратегию Random и LRU, зависят от размерности кэшпамяти. При некоторых размерностях эти значения совпадают, а при некоторых отличаются. В таблице выделен диапазон размерностей, при которых значения вероятности кэш попаданий для двух стратегий отличаются. Среднее значения расхождений в пользу LRU внутри этого диапазона составляет 7,25 %.

#### Заключение

Анализ стратегии случайного замещения данных Random в кэш-памяти КМУУ показывает, что она является экономной с точки зрения затрат оборудования, так как нет необходимости накапливать и анализировать различного рода статистическую информацию, например о частоте или порядке использования блоков в кэш-памяти. Вероятности кэш-попаданий алгоритма при использовании стратегии замещения Random совпадают с вероятностями кэш-попаданий при использовании стратегии LRU при определённых размерностях кэш-памяти. В диапазоне размерностей, где значения кэш-попаданий двух стратегий отличаются, LRU по вероятности кэш попадания эффективнее, чем Random в среднем на 7,25%. Дальнейшее продолжение работы авторы видят в поиске наиболее оптимальных стратегий замещения, которые бы учитывали всю специфику устройств управления.

## Литература

- 1. Баркалов А.А., Матвиенко А.В. Реализация микропрограммного устройства управления композицией автоматов с жесткой и программируемой логикой // Микропроцессорные средства, разработка и применение. К.: ИК АН УССР, 1985. С. 38-42.
- 2. Шагурин И.И., Бердышев Е.М. Процессоры семейства Р6 Pentium II, Pentium III, Celeron и другие. Архитектура, программирование, интерфейс. М.: Горячая линия Телеком. 2000. 248 с.

- 3. Гук М. Процессоры Intel от 8086 до Pentium II. СПб.: Питер, 1997. 224с.
- 4. Hill Mark Donald. Ascepts of Cache Memory and Instruction Buffer Performance. Ph. D. Dissertation, Computer Science Devision (EECS), University of California, Berkeley, November 1987.
- 5. Hennessy J.L., Patterson D.A. Computer Architecture: A Quantitative Approach. Morgan Kaufmann Publishers, San Mateo, CA, second ed., 1996.
- 6. Faust B. Designing Alpha–based systems. Byte Magazine. June 1995. P. 239-240.
- 7. Cheremisinova L. Synthesis of single-level circuits in programmable array logic basis. / In: Computer Aided. Design of Discrete Devices. VI. Minsk, 1997. P. 81-85.
- 8. Hosseini-Khayat S. On Optimal Replacement of Nonuniform Cache Objects // IEEE Transactions on Computers, Vol. 49, № 8, August 2000. P. 769-778.
- Johnson T., Shasha D. A Low Overhead High Performance Buffer Management Replacement Algorithm // VLDB 1994: P. 439-450.
- Kessler R., Hill M. Page Placement Algorithm for Large Real-Indexed Caches // ACM Trans. Computer Systems. Nov. 1992, vol. 10, no. 4. P. 338-359.
- 11. Tanenbaum, Andrew S. Modern Operating Systems (Second Edition). New Jersey: Prentice-Hall 2001.