Главная /
Архитектура параллельных вычислительных систем /
На основе систолической матрицы операцию умножения двух 16-разрядных кодов можно свести к четырем умножениям 8-разрядных кодов по схеме, показанной на примере: А692 ВС34 = (А600ВС00) + (А500 34) + (92 ВС00) + (92 34). Загружая конвейер четыре такта подряд
На основе систолической матрицы операцию умножения двух 16-разрядных кодов можно свести к четырем умножениям 8-разрядных кодов по схеме, показанной на примере:
А692 ВС34 = (А600ВС00) + (А500 34) + (92 ВС00) + (92 34)
. Загружая конвейер четыре такта подряд (в процессе умножения векторов с длиной, равной четырем), необходимо на его выходе обеспечить накопление результата в соответствии с относительным смещением промежуточных результатов.
Составьте проект универсального параллельного конвейера АЛУ, реализующего операции сложения и умножения 16-разрядных кодов на систолической матрице процессорных элементов, основной операцией которых является сложение 8-разрядных чисел.
Каковы должны быть размеры систолической матрицы для выполнения этих двух операций?
Составьте временную диаграмму выполнения последовательности двух операций и определите задержку начала выполнения второй операции. Последовательно выполняются операции:
1. a + b = c
2. c d = f
вопрос
Правильный ответ:
задержка 7 тактов
задержка 5 тактов
задержка 3 такта
Сложность вопроса
61
Сложность курса: Архитектура параллельных вычислительных систем
57
Оценить вопрос
Комментарии:
Аноним
Я помощник профессора! Срочно удалите сайт vtone.ru с ответами с интуит. Немедленно!
13 июн 2020
Аноним
Это очень нехитрый вопрос по интуиту.
30 июл 2018
Другие ответы на вопросы из темы аппаратное обеспечение интуит.
- # Для выражения A = (a×b+ a: c)× (c+ d) изобразите схему коммутации решающего поля, включая ОЗП. При возможном лишь последовательном считывании данных составьте временную диаграмму загрузки каждого ПЭ, учитывающую задержку поступления данных. Время считывания и время сложения равны одной условной единице, время умножения - двум, время деления - трем единицам. Найдите время решения
- # Два процессора коммутации одновременно начинают выполнять программы в виртуальных адресах решающего поля. Составьте план программы их совместного выполнения по тактам, представив, как адресный генератор предлагает им физические адреса буферных регистров 1×abv12+v1cv23×v2ev3 1+dfv12:v1Lv23×v2kv3
- # В очереди заявок к памяти данных находятся 4 заявки. В каком порядке они будут выполняться (адреса указаны в восьмеричной системе счисления), если память расслоенная, а последние два двоичные разряды образуют интерливинг? 1Сч3760→ (1,1)2Зп37623Сч3740→ (3,2)4Сч3761→ (1,2)
- # Составьте граф-схемы выполнения операций свертки (преобразование "вектор - скаляр") массивов, содержащих m элементов, методом "пирамиды", реализующей операцию m=5
- # Составьте взвешенный информационный граф счета линейного (непрерываемого) участка программы, содержащего условия. Сложение производится за 2 такта, умножение - за 4 такта, деление - за 5 тактов. Логические операции, включая команду if-then-else, выполняются за 2 такта. Операция считывания из ОП производится не менее чем за 50 тактов. A:if a>0then ifb>c thena↑2else d×a×b else (d-e)×f B:=if a×b>0 then A×x else 0