Теория и практика параллельных вычислений

Операцию редукции данных MPI_Reduce можно описать:

(Отметьте один правильный вариант ответа.)

Варианты ответа

как операцию передачи данных, при которой над собираемыми значениями осуществляется обработка, при этом частичные значения результатов редуцирования получают все процессы параллельной программы

операцию передачи данных, при которой над собираемыми значениями осуществляется та или иная обработка, при этом результат обработки получают все процессы

как операцию передачи данных, при которой над собираемыми значениями осуществляется обработка в процессе передачи, при этом результат обработки получает только ведущий процесс(Верный ответ)

Похожие вопросы

Задача редукции определяется в общем виде как:

Завершение функции MPI_Send означает, что:

Циклический q-сдвиг, это операция, при которой:

Прием сообщений при помощи функции MPI_Recv может быть осуществлен:

Прием сообщения при помощи функции MPI_Recv может быть инициирован:

Функция MPI_Recv:

Нижняя оценка необходимого количества операций для упорядочивания набора из n значений определяется выражением:

Пусть перед программистом поставлена задача перемножения матрицы на вектор. Размер перемножаемой матрицы 100x100. На вычислительной системе все операции сложения и умножения выполняются одинаковое время $\tau = 2$ нсек. Латентности сети $\alpha = 50$ нсек. Пропускная способность сети 60 Мбайт/сек. Элементы матрицы имеют тип double и в системе занимают w = 8 байт. Если при распараллеливании использовать разделение матрицы на блоки (количество блоков по строкам и по строкам равно и равно $q=\sqrt{p}$ , где p – количество процессоров), чему будет равно теоретическая эффективность при использовании 4 процессоров:

Пусть перед программистом поставлена задача перемножения матрицы на вектор. Размер перемножаемой матрицы 100x100. На вычислительной системе все операции сложения и умножения выполняются одинаковое время $\tau = 2$ нсек. Латентности сети $\alpha = 50$ нсек. Пропускная способность сети 60 Мбайт/сек. Элементы матрицы имеют тип double и в системе занимают w = 8 байт. Если при распараллеливании использовать разделение матрицы на блоки (количество блоков по строкам и по строкам равно и равно $q=\sqrt{p}$ , где p – количество процессоров), чему будет равно теоретическое ускорение при использовании 16 процессоров:

Для разбиения графа на k частей в методе бинарного деления для решения задачи оптимального разделения графов необходимо: