Теория и практика параллельных вычислений - ответы

Количество вопросов - 250

При разработке параллельного алгоритма умножения матриц, основанного на ленточной схеме разделения данных, может быть использован подход:

Перейти

За основу организации параллельных вычислений при реализации метода сопряженных градиентов выбирается:

Перейти

В обобщенном алгоритме быстрой сортировки в дополнение к обычному методу быстрой сортировки предлагается:

Перейти

В результате выполнения одной итерации параллельного алгоритма быстрой сортировки исходное множество процессоров разделяется на:

Перейти

Каковы причины значительного снижения полезной вычислительной нагрузки для процессоров при организации волновых вычислений в системах с распределенной памятью?

Перейти

При выполнении параллельного алгоритма, основанного на ленточной схеме разделения данных, основной коммуникационной операцией является:

Перейти

Матрица смежности это:

Перейти

С ростом числа процессоров, наибольшее ускорение демонстрирует:

Перейти

Пусть есть задача вычисление суммы следующего вида $y=\sum\limits_{i=1}^N a_ib_ic_i$ . Пусть N = 4 и применяется каскадная схема, аналогичная схеме описанной в лекции для суммирования элементов вектора. Какая в этом случае минимально возможная высота дерева модели вычисления:

Перейти

Из представленных в лекции алгоритмов, лучшей масштабируемостью обладает:

Перейти

Базовая операция "сравнить и разделить" отличается от операции "сравнить и переставить":

Перейти

Под коллективными операциями в MPI понимаются:

Перейти

При выборе способа разделения вычислений при прочих равных условиях нужно отдавать предпочтение:

Перейти

Рассмотрение графа "подзадачи – сообщения" концентрирует внимание на вопросах:

Перейти

Эксперименты в режиме имитации возможно проводить:

Перейти

Задача поиска всех кратчайших путей обычно формулируется как:

Перейти

Режим передачи по готовности может быть использован только если:

Перейти

Под параллельной программой в рамках MPI понимается:

Перейти

Управление распределением нагрузки для процессоров необходимо:

Перейти

В чем состоят необходимые условия для возможности организации параллельных вычислений:

Перейти

Рассмотрим задачу поиска решения системы линейных уравнений. Пусть размер матрицы системы линейных уравнений 100x100. На вычислительной системе все операции сложения и умножения выполняются одинаковое время $\tau = 2$ нсек. Латентности сети $\alpha = 500$ нсек. Пропускная способность сети $\beta = 50$ Mбайт/сек. Элементы матрицы системы линейных уравнений имеют тип double и занимают w = 8 байт. Если при распараллеливании алгоритма Гауса использовалось 4 процессора, то какое в этом случае достигается теоретическое ускорение:

Перейти

Какие проблемы параллельного программирования являются общими для систем с общей и распределенной памятью?

Перейти

Метод покоординатного разбиения для решения задачи оптимального разделения графов отличается от метода бинарного деления тем, что:

Перейти

Двоичный код Грея используется для определения соответствия между:

Перейти

Время начальной подготовки (tн) характеризует:

Перейти

Пусть есть задача вычисления суммы следующего вида $y=\sum\limits_{i=1}^N a_ib_i$ . Пусть N = 8 и применяется каскадная схема с минимально возможной высотой дерева модели вычисления. Чему в этом случае равна эффективность при использовании восьми вычислительных элементов:

Перейти

В методах покоординатной маршрутизации поиск путей передачи данных осуществляется:

Перейти

Для эффективного выполнения параллельного алгоритма умножения матриц, основанного на ленточной схеме разделения данных, необходимо, чтобы процессоры вычислительной системы были организованы в топологию:

Перейти

Какая коммуникационная операция используется в параллельном алгоритме умножения матрицы на вектор, основанном на блочном разделении матрицы, для получения блоков результирующего вектора на процессорах, составляющих одну строку процессорной решетки?

Перейти

Какие режимы передачи данных поддерживает система имитационного моделирования ПараЛаб:

Перейти

Распределенные вычислительные системы:

Перейти

Суперкомпьютеры:

Перейти

Кластерные вычислительные системы:

Перейти

Под мультикомпьютером понимается:

Перейти

Типовые топологии сети передачи данных определяются:

Перейти

Какая из приведенных в лекции топологий (при одинаковом количестве процессоров) обладает наименьшей стоимостью:

Перейти

В модели вычислений вершинами графа являются:

Перейти

Стоимость вычислений - это:

Перейти

При вычислении общей суммы последовательности числовых значений стоимостно-оптимальным алгоритмом является:

Перейти

Пусть есть задача вычисления суммы следующего вида $y=\sum\limits_{i=1}^N a_i$ . Пусть N = 6 и применяется каскадная схема с минимально возможной высотой дерева модели вычисления. Чему в этом случае равна стоимость вычислений при использовании восьми вычислительных элементов:

Перейти

Пусть в решаемой задаче последовательная часть составляет четыре единицы времени, а часть, допускающая линейное распараллеливание, шесть единицы времени. Если использовать закон Амдаля, сколько потребуется процессоров для достижения ускорения в два раза:

Перейти

Метод покоординатной маршрутизации в приложении к топологии типа гиперкуб состоит:

Перейти

Основной набор параметров, описывающих время передачи данных, состоит из следующего набора величин:

Перейти

При использовании метода передачи сообщений:

Перейти

Задача редукции определяется в общем виде как:

Перейти

Уплотнение дуг это:

Перейти

Соседние вершины в нумерации кода Грея имеют:

Перейти

Для кластерных систем характерна:

Перейти

Масштабирование разрабатываемого параллельного алгоритма это процесс:

Перейти

Граф "процессы – каналы" используется:

Перейти

Для снижения сложности моделирования и анализа параллельных методов операции передачи и приема данных считаются выполняющимися:

Перейти

Выбор способа разделения вычислений на независимые части основывается:

Перейти

В статической схеме передачи данных:

Перейти

Этап распределения подзадач между процессорами является избыточным, если:

Перейти

Для организации параллельных вычислений в вычислительных системах с распределенной памятью необходимо:

Перейти

Под коммуникатором в MPI понимается:

Перейти

Процессы, между которыми выполняется передача данных:

Перейти

Функция MPI_Recv:

Перейти

В синхронном режиме передачи завершение функции отправки сообщения происходит:

Перейти

Функция блокирующего ожидания завершения одного обмена в MPI называется:

Перейти

Коллективные операции MPI:

Перейти

Обобщенная передача данных от всех процессов всем процессам может быть описана как:

Перейти

Протяженность производного типа в MPI это:

Перейти

H-векторный и H-индексный способы создания данных отличаются от векторного и индексного способов тем, что:

Перейти

MPI поддерживает топологии вида:

Перейти

Какие способы распределения элементов матрицы между процессорами вычислительной системы изложены в данной лекции?

Перейти

Какая коммуникационная операция используется при выполнении параллельного алгоритма умножения матрицы на вектор, основанного на разделении матрицы на вертикальные полосы?

Перейти

Для эффективного выполнения параллельного алгоритма умножения матрицы на вектор, основанного на разделении матрицы на вертикальные полосы, необходимо, чтобы процессоры вычислительной системы были объединены в топологию:

Перейти

Какие алгоритмы обладают наилучшими теоретическими показателями ускорения и эффективности (в случае, когда не учитываются затраты на передачу данных между процессорами):

Перейти

Рассмотрим задачу перемножения матрицы на вектор. Пусть размер перемножаемой матрицы 100x100. На вычислительной системе все операции сложения и умножения выполняются одинаковое время $\tau = 2$ нсек. Латентности сети $\alpha = 40$ нсек. Пропускная способность сети 60 Мбайт/сек. Элементы матрицы имеют тип double и занимают w = 8 байт. Если при распараллеливании использовать разделение матрицы на строки, чему будет равна теоретическая стоимость при использовании 2 процессоров:

Перейти

Пусть перед программистом поставлена задача перемножения матрицы на вектор. Размер перемножаемой матрицы 100x100. На вычислительной системе все операции сложения и умножения выполняются одинаковое время $\tau = 2$ нсек. Латентности сети $\alpha = 50$ нсек. Пропускная способность сети 60 Мбайт/сек. Элементы матрицы имеют тип double и в системе занимают w = 8 байт. Если при распараллеливании использовать разделение матрицы на блоки (количество блоков по строкам и по строкам равно и равно $q=\sqrt{p}$ , где p – количество процессоров), чему будет равно теоретическое ускорение при использовании 16 процессоров:

Перейти

Какие схемы разделения данных используются при разработке параллельных алгоритмов умножения матриц?

Перейти

С ростом числа процессоров, наибольшее ускорение демонстрируют:

Перейти

Рассмотрим задачу перемножения матриц. Пусть размер перемножаемой матрицы 100x100. На вычислительной системе все операции сложения и умножения выполняются одинаковое время $\tau = 2$ нсек. Латентности сети $\alpha = 500$ нсек. Пропускная способность сети $\beta = 50$ Mбайт/сек. Элементы матрицы имеют тип double и занимают w = 8 байт. Если при распараллеливании использовать разделение матрицы на ленты, чему будет равно теоретическое ускорение при использовании 4 процессоров:

Перейти

Рассмотрим задачу перемножения матриц. Пусть размер перемножаемой матрицы 200x200. На вычислительной системе все операции сложения и умножения выполняются одинаковое время $\tau = 2$ нсек. Латентности сети $\alpha = 500$ нсек. Пропускная способность сети $\beta = 50$ Mбайт/сек. Элементы матрицы имеют тип double и занимают w = 8 байт. Если при распараллеливании использовать алгоритм Фокса, чему будет равна теоретическая эффективность при использовании 4 процессоров:

Перейти

Какая схема разделения данных используется при реализации параллельного алгоритма Гаусса?

Перейти

На каждой итерации прямого хода алгоритма Гаусса для нахождения ведущей строки используется

Перейти

За основу организации параллельных вычислений при реализации метода сопряженных градиентов выбирается параллельное выполнение операции умножения матрицы на вектор, потому что:

Перейти

Рассмотрим задачу поиска решения системы линейных уравнений. Пусть размер матрицы системы линейных уравнений 100x100. На вычислительной системе все операции сложения и умножения выполняются одинаковое время $\tau = 2$ нсек. Латентности сети $\alpha = 50$ нсек. Пропускная способность сети $\beta = 60$ Mбайт/сек. Элементы матрицы системы линейных уравнений имеют тип double и занимают w = 8 байт. Если при распараллеливании алгоритма Гауса использовалось 4 процессора, то какая в этом случае достигается теоретическая эффективность:

Перейти

Рассмотрим задачу поиска решения системы линейных уравнений. Пусть размер матрицы системы линейных уравнений 20x20. На вычислительной системе все операции сложения и умножения выполняются одинаковое время $\tau = 2$ нсек. Латентности сети $\alpha = 50$ нсек. Пропускная способность сети $\beta = 60$ Mбайт/сек. Элементы матрицы системы линейных уравнений имеют тип double и занимают w = 8 байт. Если при распараллеливании алгоритма сопряженных градиентов использовалось 4 процессора, то какая в этом случае достигается теоретическая стоимость параллельного алгоритма:

Перейти

Внутренняя сортировка это:

Перейти

Базовая операция "сравнить и переставить" состоит из:

Перейти

Общее число итераций параллельного алгоритма чет-нечетной сортировки при использовании p процессоров равно:

Перейти

Параллельный вариант алгоритма Шелла состоит в следующем:

Перейти

При надлежащем выборе ведущих элементов в алгоритме быстрой сортировки исходный массив данных оказывается упорядоченным после выполнения:

Перейти

Три схемы распараллеливания алгоритма быстрой сортировки различаются:

Перейти

Один из этапов параллельного алгоритма быстрой сортировки состоит том, что:

Перейти

Для поддержки упорядоченности в ходе выполнения алгоритма обобщенной быстрой сортировки процессоры должны выполнять:

Перейти

Взвешенный граф это:

Перейти

Сложность последовательного алгоритма Флойда имеет порядок:

Перейти

При горизонтальном разбиении матрицы исходных данных на каждой итерации алгоритма Флойда потребуется передавать между подзадачами:

Перейти

Охватывающим деревом (или остовом) неориентированного графа называется:

Перейти

Трудоемкость нахождения МОД характеризуется:

Перейти

Задача оптимального разделения графа состоит в разбиении вершин графа на непересекающиеся подмножества:

Перейти

Для разбиения графа на k частей в методе бинарного деления для решения задачи оптимального разделения графов необходимо выполнить:

Перейти

На одном из этапов метода покоординатного разбиения для решения задачи оптимального разделения графов:

Перейти

Основное отличие комбинаторных алгоритмов от геометрических методов, применяемых для решения задачи оптимального разделения графов, заключается:

Перейти

При разработке параллельных алгоритмов решения дифференциальных уравнений в частных производных за основу выбирается разделение данных, потому что:

Перейти

Каким образом обеспечивается балансировка вычислительной нагрузки процессоров для параллельных алгоритмов для систем с общей памятью,?

Перейти

Чем определяется эффективность параллельных вычислений?

Перейти

В чем состоит первая проблема, которую приходится решать при организации параллельных вычислений на системах с распределенной памяти?

Перейти

Какие механизмы передачи данных могут быть задействованы?

Перейти

К числу параметров вычислительной системы в системе ПараЛаб относятся:

Перейти

В каком из режимов можно провести вычислительный эксперимент?

Перейти

При построении графических зависимостей для экспериментов, проведенных в режиме удаленного доступа к параллельной вычислительной системы, используется:

Перейти

Какие топологий сети не поддерживает система имитационного моделирования ПараЛаб:

Перейти

На каких топологиях сети в системе ПараЛаб не реализованы алгоритмы обработки графов:

Перейти

Помимо выполнения экспериментов в режиме имитации, в системе ПараЛаб предусмотрена возможность проведения реальных экспериментов в режиме удаленного доступа к вычислительному кластеру. Какие возможны операции после выполнения реальных параллельных вычислений:

Перейти

При выполнении параллельного алгоритма, основанного на разделении данных на горизонтальные полосы, сбор данных полученных результатов выполняется при помощи:

Перейти

Операция широковещательной рассылки данных это:

Перейти

Базовая операция "сравнить и переставить" обычно используется в:

Перейти

Какие из перечисленных ниже классы задач поддерживает система имитационного моделирования ПараЛаб:

Перейти

Комбинаторные методы решения задачи оптимального разделения графов обычно обеспечивают:

Перейти

Разработка параллельных алгоритмов включает в себя этапы:

Перейти

При проведении серии экспериментов системой ПараЛаб может автоматически варьироваться:

Перейти

Трудоемкость параллельного алгоритма чет-нечетной сортировки оценивается выражением:

Перейти

Каскадная схема используется для:

Перейти

Для эффективного выполнения алгоритма Фокса необходимо, чтобы процессоры вычислительной системы были организованы в топологию:

Перейти

В рамках системы ПараЛаб какие допускаются схемы выполнения вычислений при проведении экспериментов:

Перейти

Для того чтобы выбрать ведущий элемент в параллельном алгоритме быстрой сортировки выполняются следующие действия:

Перейти

Один из возможных способов агрегации вычислений для увеличения эффективности параллельного алгоритма Флойда состоит:

Перейти

В методе передачи пакетов:

Перейти

Рассмотрим задачу перемножения матрицы на вектор. Пусть размер перемножаемой матрицы 100x100. На вычислительной системе все операции сложения и умножения выполняются одинаковое время $\tau = 2$ нсек. Латентности сети $\alpha = 50$ нсек. Пропускная способность сети 60 Мбайт/сек. Элементы матрицы имеют тип double и занимают w = 8 байт. Если при распараллеливании использовать разделение матрицы на строки чему будет равно теоретическое ускорение при использовании 2 процессоров:

Перейти

Под процессом понимают:

Перейти

Основным показателем успешности выполнения этапа распределения подзадач между процессорами является:

Перейти

Рассмотрим задачу перемножения матриц. Пусть размер перемножаемой матрицы 100x100. На вычислительной системе все операции сложения и умножения выполняются одинаковое время $\tau = 2$ нсек. Латентности сети $\alpha = 500$ нсек. Пропускная способность сети $\beta = 50$ Mбайт/сек. Элементы матрицы имеют тип double и в системе занимают w = 8 байт. Если при распараллеливании использовать алгоритм Кеннона, чему будет равно теоретическое ускорение при использовании 4 процессоров:

Перейти

При разработке параллельных алгоритмов для матричных вычислений за основу выбирается разделение данных, потому что:

Перейти

Пусть есть задача вычисления произведения всех элемента вектора $y= \prod\limits_{i=1}^N a_i$ . Пусть N = 6 и применяется каскадная схема с минимально возможной высотой дерева модели вычисления. Чему в этом случае равно ускорение при использовании неограниченного числа вычислительных элементов:

Перейти

Для эффективного выполнения параллельного алгоритма умножения матрицы на вектор, основанного на разделении матрицы на горизонтальные полосы, необходимо, чтобы процессоры вычислительной системы были объединены в топологию:

Перейти

В рассматриваемой учебной задаче по решению задачи Дирихле при использовании разделенной памяти, какие возможны способы разделения данных?

Перейти

Алгоритмы маршрутизации определяют:

Перейти

Номер процесса в рамках MPI именуется:

Перейти

Для распределения вычислений между процессорами в вычислительных системах с распределенной памятью необходимо:

Перейти

Режим разделения времени:

Перейти

Под кластером обычно понимается:

Перейти

В основе классификации вычислительных систем в систематике Флинна используются:

Перейти

Среди рассмотренных в лекции типовых топологий приведены:

Перейти

Какая из приведенных в лекции топологий (при одинаковом количестве процессоров) обладает наименьшим диаметром:

Перейти

Ускорение параллельных вычислений – это:

Перейти

Пусть в решаемой задаче последовательная часть составляет четыре единицы времени, а часть, допускающая линейное распараллеливание, шесть единицы времени. Если использовать закона Густавсона-Барсиса, сколько потребуется процессоров для достижения ускорения в два раза (результат округлите в большую сторону):

Перейти

Метод передачи пакетов в большинстве случаев приводит к:

Перейти

Для рассылки от одного процессора всем остальным процессорам сети при использовании топологии типа гиперкуб достаточно (N=log₂p):

Перейти

Способы логического представления (отображения) топологий характеризуются следующими тремя основными характеристиками:

Перейти

Соседние вершины в кольцевой топологии отображаются кодом Грея:

Перейти

В модели Хокни используются параметры:

Перейти

Распределение подзадач между процессорами должно быть выполнено таким образом, чтобы:

Перейти

Граф "подзадачи – сообщения" представляет собой:

Перейти

Канал передачи данных можно рассматривать как:

Перейти

Для локальной схемы передачи данных характерно:

Перейти

Все данные для передачи в качестве сообщения MPI описываются с помощью триады:

Перейти

Сигнатурой производного типа в MPI именуется:

Перейти

При выполнении параллельного алгоритма, основанного на разделении матрицы на горизонтальные полосы, сбор данных результирующего вектора выполняется при помощи:

Перейти

Пусть перед программистом поставлена задача перемножения матрицы на вектор. Размер перемножаемой матрицы 100x100. На вычислительной системе все операции сложения и умножения выполняются одинаковое время $\tau = 2$ нсек. Латентности сети $\alpha = 50$ нсек. Пропускная способность сети 60 Мбайт/сек. Элементы матрицы имеют тип double и в системе занимают w = 8 байт. Если при распараллеливании использовать разделение матрицы на блоки (количество блоков по строкам и по строкам равно и равно $q=\sqrt{p}$ , где p – количество процессоров), чему будет равно теоретическая эффективность при использовании 4 процессоров:

Перейти

Какая схема разделения данных используется при разработке параллельных алгоритмов Фокса и Кэннона?

Перейти

Какие коммуникационные операции используются при выполнении параллельного алгоритма Фокса?

Перейти

Какое расположение вектора правых частей и вектора неизвестных используется при реализации параллельного алгоритма Гаусса:

Перейти

При выполнении параллельного алгоритма Гаусса основными коммуникационными операциями являются:

Перейти

При реализации параллельного алгоритма для метода сопряженных градиентов вычисления над векторами дублируются на всех процессорах для того, чтобы:

Перейти

Задача сортировки данных обычно формулируется как:

Перейти

Алгоритм быстрой сортировки основан на:

Перейти

Оптимальная стратегия выбора ведущего элемента при применении параллельных алгоритмов быстрой сортировки состоит в выборе такого значения ведущего элемента, при котором:

Перейти

Минимально охватывающим деревом называется:

Перейти

Количество выполняемых операций при определении номера ближайшей вершины до охватывающего дерева и корректировке расстояний после расширения МОД ограничивается сверху величиной:

Перейти

Для разбиения графа на k частей в методе бинарного деления для решения задачи оптимального разделения графов необходимо:

Перейти

С какими проблемами сталкивается программист, разрабатывая параллельные программы для систем с общей памятью?

Перейти

Какой способ наиболее эффективен при подсчете общей для всех процессоров погрешности вычислений, которые используются в параллельной реализации метода сеток на системах с распределенной памятью?

Перейти

За счет чего увеличивается число передач данных между процессорами при блочном представлении сетки области расчетов на системах с распределенной памятью?

Перейти

Какие достоинства имеет синхронный механизм передачи сообщений?

Перейти

Для постановки задачи в системе ПараЛаб необходимо выбрать:

Перейти

При анализе результатов проведенных экспериментов пользователю предоставляется возможность:

Перейти

В рамках системы ПараЛаб какие присутствуют средства для детального изучения и исследования параллельных алгоритмов решения сложных вычислительных задач:

Перейти

Процессы параллельной программой в рамках MPI:

Перейти

При индексном способе новый производный тип создается как:

Перейти

Для эффективного выполнения алгоритма Кэннона необходимо, чтобы процессоры вычислительной системы были организованы в топологию:

Перейти

В коллективных операциях передачи данных обязаны принимать участие:

Перейти

Задача разделения вычислительной сети, на которую разбивается область обрабатываемых данных, между процессорами может быть сведена:

Перейти

Применение неблокирующего способа выполнения обменов позволяет:

Перейти

В модифицированной каскадной схеме:

Перейти

Модель вычислений – это:

Перейти

При асинхронном способе взаимодействия участники взаимодействия:

Перейти

При реализации параллельного алгоритма Гаусса рекомендуется использовать ленточную циклическую схему разделения данных, потому что

Перейти

Завершение функции MPI_Send означает, что:

Перейти

Пусть в решаемой задаче последовательная часть составляет четыре единицы времени, а часть, допускающая линейное распараллеливание, шесть единицы времени. Если использовать закон Амдаля, какая достигается эффективность, если используются три вычислительных элемента:

Перейти

Какие способы разделения элементов матрицы между процессорами вычислительной системы используются для разработки параллельных алгоритмов умножения матрицы на вектор?

Перейти

Какие алгоритмы обладают наилучшими теоретическими показателями ускорения и эффективности (в случае, когда не учитываются затраты на передачу данных между процессорами):

Перейти

Показатели ускорения и эффективности параллельного алгоритма Прима имеют вид (без учета затрат на передачу данных):

Перейти

К основным преимуществам кластерных вычислительных систем относится:

Перейти

Операцию редукции данных MPI_Reduce можно описать:

Перейти

Показатели ускорения и эффективности параллельного алгоритма Флойда имеют вид (без учета затрат на передачу данных):

Перейти

Равновесность подмножеств вершин в задаче оптимального разделения графа:

Перейти

На каждой итерации обратного хода метода Гаусса используется

Перейти

Какую компьютерную систему можно отнести к суперкомпьютерам:

Перейти

Общее наименьшее количество итераций параллельного алгоритма Шелла равно:

Перейти

Какие способы распределения данных между процессорами вычислительной системы изложены в данной лекции?

Перейти

Граф это:

Перейти

Рассмотрим задачу перемножения матрицы на вектор. Пусть размер перемножаемой матрицы 100x100. На вычислительной системе все операции сложения и умножения выполняются одинаковое время $\tau = 2$ нсек. Латентности сети $\alpha = 50$ нсек. Пропускная способность сети 60 Мбайт/сек. Элементы матрицы имеют тип double и занимают w = 8 байт. Если при распараллеливании использовать разделение матрицы на строки чему будет равно ускорение при использовании 4 процессоров:

Перейти

При выполнении алгоритма обобщенной быстрой сортировки в качестве ведущего элемента обычно выбирается:

Перейти

В модели вычислений дуги графа определяют:

Перейти

Прием сообщений при помощи функции MPI_Recv может быть осуществлен:

Перейти

Пусть есть задача вычисления произведения всех элементов вектора $y= \prod\limits_{i=1}^N a_i$ . Пусть N = 10 и применяется каскадная схема, аналогичная схеме описанной в лекции для суммирования элементов вектора. Какая в этом случае минимально возможная высота дерева модели вычисления:

Перейти

На основании результатов экспериментов, представленных в лекции, можно сказать, что наибольшее ускорение демонстрирует:

Перейти

Топология типа тор в MPI является частным видом топологии типа:

Перейти

Минимально необходимый набор операций для организации информационного взаимодействия между процессорами в вычислительных системах с распределенной памятью включает в себя только:

Перейти

К числу суперкомпьютеров относятся:

Перейти

Какая из приведенных в лекции топологий (при одинаковом количестве процессоров) обладает наибольшей связностью:

Перейти

Эффективность параллельных вычислений – это:

Перейти

Циклический q-сдвиг, это операция, при которой:

Перейти

Увеличение вершин:

Перейти

Указание используемого коммуникатора является:

Перейти

Прием сообщения при помощи функции MPI_Recv может быть инициирован:

Перейти

При векторном способе новый производный тип создается как:

Перейти

С ростом числа процессоров, согласно теоретической оценке, наибольшее ускорение демонстрирует:

Перейти

Можно ли утверждать, что представленные в лекции алгоритмы обладают идеальными теоретическими показателями ускорения и эффективности (в случае, когда не учитываются затраты на передачу данных между процессорами):

Перейти

Рассмотрим задачу поиска решения системы линейных уравнений. Пусть размер матрицы системы линейных уравнений 100x100. На вычислительной системе все операции сложения и умножения выполняются одинаковое время $\tau = 2$ нсек. Латентности сети $\alpha = 5$ нсек. Пропускная способность сети $\beta = 500$ Mбайт/сек. Элементы матрицы системы линейных уравнений имеют тип double и занимают w = 8 байт. Если при распараллеливании алгоритма сопряженных градиентов использовалось 4 процессора, то какое в этом случае достигается теоретическое ускорение:

Перейти

Нижняя оценка необходимого количества операций для упорядочивания набора из n значений определяется выражением:

Перейти

Основными отличиями параллельного алгоритма Шелла от метода чет-нечетной перестановки являются:

Перейти

При применении параллельных алгоритмов быстрой сортировки одним из основных моментов является:

Перейти

Задача нахождения МОД формулируется как:

Перейти

Вычислительный эксперимент в системе ПараЛаб – это:

Перейти

На каких топологиях сети в системе ПараЛаб реализованы алгоритмы перемножения матриц:

Перейти

Для параллельных алгоритмов для систем с общей памятью при проведении вычислительных экспериментов может наблюдаться сверхлинейное ускорение. Каковы возможные причины достижения этого эффекта?

Перейти

Трудоемкость алгоритма пузырьковой сортировки оценивается выражением:

Перейти

В декартовой топологии множество процессов представляется в виде:

Перейти

При построении графических зависимостей для экспериментов, проведенных в режиме имитации, используются:

Перейти

Под мультипроцессором понимается:

Перейти

Пусть есть задача вычисление суммы следующего вида $y=\sum\limits_{i=1}^N a_ib_i$ . Пусть N = 8 и применяется каскадная схема, аналогичная схеме описанной в лекции для суммирования элементов вектора. Какая в этом случае минимально возможная высота дерева модели вычисления:

Перейти

Производным типом данных в MPI называется:

Перейти

Число итераций параллельного алгоритма Флойда равно:

Перейти

На каких топологиях сети в системе ПараЛаб реализована быстрая сортировка:

Перейти

Из представленных в лекции алгоритмов, лучшей масштабируемостью обладает:

Перейти

Топология полный граф сети кластерной вычислительной системы может иметь ограничения на:

Перейти

Рассмотрим задачу перемножения матриц. Пусть размер перемножаемой матрицы 100x100. На вычислительной системе все операции сложения и умножения выполняются одинаковое время $\tau = 2$ нсек. Латентности сети $\alpha = 500$ нсек. Пропускная способность сети $\beta = 50$ Mбайт/сек. Элементы матрицы имеют тип double и занимают w = 8 байт. Если при распараллеливании использовать алгоритм Фокса, чему будет равно теоретическое ускорение при использовании 4 процессоров:

Перейти

Рассмотрим задачу перемножения матриц. Пусть размер перемножаемой матрицы 200x200. На вычислительной системе все операции сложения и умножения выполняются одинаковое время $\tau = 2$ нсек. Латентности сети $\alpha = 500$ нсек. Пропускная способность сети $\beta = 50$ Mбайт/сек. Элементы матрицы имеют тип double и в системе занимают w = 8 байт. Если при распараллеливании использовать разделение матрицы на ленты, чему будет равна теоретическая эффективность при использовании 4 процессоров:

Перейти

Рассмотрим задачу поиска решения системы линейных уравнений. Пусть размер матрицы системы линейных уравнений 200x200. На вычислительной системе все операции сложения и умножения выполняются одинаковое время $\tau = 2$ нсек. Латентности сети $\alpha = 50$ нсек. Пропускная способность сети $\beta = 50$ Mбайт/сек. Элементы матрицы системы линейных уравнений имеют тип double и занимают w = 8 байт. Если при распараллеливании алгоритма сопряженных градиентов использовалось 4 процессора, то какая в этом случае достигается теоретическая эффективность:

Перейти

Завершение вызова функции неблокирующего обмена приводит:

Перейти

Среди предусмотренных в составе MPI операций передачи сообщений различают:

Перейти

Длительность времени передачи одного слова данных по одному каналу передачи данных определяется:

Перейти

Какие достоинства и недостатки имеет асинхронный механизм передачи сообщений?

Перейти

К числу характеристик топологии сети передачи данных относятся:

Перейти

Качество разрабатываемых параллельных методов определяется:

Перейти

Как исключается неоднозначность вычислений в параллельном алгоритме метода сеток на системах с общей памятью?

Перейти

Для определения угла поворота в рекурсивном инерционном методе деления пополам при решении задачи оптимального разделения графов, используется:

Перейти

В отличие от геометрических схем комбинаторные методы решения задачи оптимального разделения графов не принимают во внимание:

Перейти

В буферизованном режиме функция отправки сообщения завершается:

Перейти

Для эффективного выполнения параллельного алгоритма умножения матрицы на вектор, основанного на блочном разделении матрицы, необходимо, чтобы процессоры вычислительной системы были объединены в топологию:

Перейти

Рассмотрим задачу перемножения матриц. Пусть размер перемножаемой матрицы 200x200. На вычислительной системе все операции сложения и умножения выполняются одинаковое время $\tau = 2$ нсек. Латентности сети $\alpha = 500$ нсек. Пропускная способность сети $\beta = 50$ Mбайт/сек. Элементы матрицы имеют тип double и занимают w = 8 байт. Если при распараллеливании использовать алгоритм Кеннона, чему будет равна теоретическая эффективность при использовании 4 процессоров:

Перейти

Какие коммуникационные операции используются при выполнении параллельного алгоритма Кэннона?

Перейти

Рассмотрим задачу поиска решения системы линейных уравнений. Размер матрицы системы линейных уравнений 10x10. На вычислительной системе все операции сложения и умножения выполняются одинаковое время $\tau = 2$ нсек. Латентности сети $\alpha = 50$ нсек. Пропускная способность сети $\beta = 60$ Mбайт/сек. Элементы матрицы системы линейных уравнений имеют тип double и в системе занимают w = 8 байт. Если при распараллеливании алгоритма Гауса использовалось 4 процессора, то какая в этом случае достигается теоретическая стоимость параллельного алгоритма:

Перейти

В худшем случае трудоемкость быстрой сортировки оценивается выражением:

Перейти

Метод бинарного деления для решения задачи оптимального разделения графов заключается:

Перейти