Главная /
Введение в принципы функционирования и применения современных мультиядерных архитектур (на примере Intel Xeon Phi) /
Какое из следующих утверждений является верным?
Какое из следующих утверждений является верным?
вопросПравильный ответ:
инструкция вида FMA позволяет выполнить 3 арифметических операции за один такт
инструкция вида FMA позволяет выполнить 2 арифметических операции без потери точности
инструкция вида FMA позволяет выполнить 2 арифметических операции с округлением в конце
инструкция вида FMA позволяет выполнить 3 арифметических операции с округлением в конце
Сложность вопроса
80
Сложность курса: Введение в принципы функционирования и применения современных мультиядерных архитектур (на примере Intel Xeon Phi)
65
Оценить вопрос
Комментарии:
Аноним
спасибо за тест
26 сен 2020
Аноним
Спасибо за помощь по intuit.
06 июн 2019
Другие ответы на вопросы из темы суперкомпьютерные технологии интуит.
- # Информационную целостность (когерентность) кэшей на аппаратном уровне могут обеспечить:
- # Следующий псевдокод 1. i number; 2. for j = 2 to number 3. if (i == 1) break; 4. r i % j; 5. if (r == 0) 6. i i / j; 7. save_divisor(number, j); 8. j j - 1;
- # Следующая функция void factorization() { #pragma omp parallel for for (int i = 1; i < NUM_NUMBERS; i++) { int number = i; int idx = number; for (int j = 2; j < idx; j++) { if (number == 1) break; int r; r = number % j; if (r == 0) { number /= j; divisors[idx].push_back(j); j--; } } } } факторизует числа в диапазоне от 1 до NUM_NUMBERS. Добавление к прагме parallel параметра schedule(dynamic) уменьшит время
- # Какие ключи компилятора необходимо указать для корректной компиляции следующей функцииvoid GetOptionPrices( float * restrict pT, float * restrict pK, float * restrict pS0, float * restrict pC) { int i; float d1, d2, erf1, erf2; for (i = 0; i < N; i++) { d1 = (logf(pS0[i] / pK[i]) + (r + sig * sig * 0.5f) * pT[i]) / (sig * sqrtf(pT[i])); d2 = (logf(pS0[i] / pK[i]) + (r - sig * sig * 0.5f) * pT[i]) / (sig * sqrtf(pT[i])); erf1 = 0.5f + 0.5f * erff(d1 / sqrtf(2.0f)); erf2 = 0.5f + 0.5f * erff(d2 / sqrtf(2.0f)); pC[i] = pS0[i] * erf1 - pK[i] * expf((-1.0f) * r * pT[i]) * erf2; } }
- # Вы написали программу на языке C. Эта программа работает корректно на подготовленных тестовых данных, но скорость работы вас не устраивает. Какими инструментами, входящими в комплект поставки Intel Parallel Studio, вы воспользуетесь для увеличения скорости работы вашей программы?