Ответы на ИНТУИТ

ИНТУИТ ответы на тесты

Решение тестов / курсов
База ответов ИНТУИТ.RU
Заказать решение курсов или тестов:
https://vk.com/id358194635
https://vk.com/public118569203

Теория и практика параллельных вычислений

Заказать решение
Количество вопросов 250

При разработке параллельного алгоритма умножения матриц, основанного на ленточной схеме разделения данных, может быть использован подход:

перейти к ответу ->>

За основу организации параллельных вычислений при реализации метода сопряженных градиентов выбирается:

перейти к ответу ->>

В обобщенном алгоритме быстрой сортировки в дополнение к обычному методу быстрой сортировки предлагается:

перейти к ответу ->>

В результате выполнения одной итерации параллельного алгоритма быстрой сортировки исходное множество процессоров разделяется на:

перейти к ответу ->>

Каковы причины значительного снижения полезной вычислительной нагрузки для процессоров при организации волновых вычислений в системах с распределенной памятью?

перейти к ответу ->>

При выполнении параллельного алгоритма, основанного на ленточной схеме разделения данных, основной коммуникационной операцией является:

перейти к ответу ->>

Матрица смежности это:

перейти к ответу ->>

С ростом числа процессоров, наибольшее ускорение демонстрирует:

перейти к ответу ->>

Пусть есть задача вычисление суммы следующего вида y=\sum\limits_{i=1}^N a_ib_ic_i. Пусть N = 4 и применяется каскадная схема, аналогичная схеме описанной в лекции для суммирования элементов вектора. Какая в этом случае минимально возможная высота дерева модели вычисления:

перейти к ответу ->>

Из представленных в лекции алгоритмов, лучшей масштабируемостью обладает:

перейти к ответу ->>

Базовая операция "сравнить и разделить" отличается от операции "сравнить и переставить":

перейти к ответу ->>

Под коллективными операциями в MPI понимаются:

перейти к ответу ->>

При выборе способа разделения вычислений при прочих равных условиях нужно отдавать предпочтение:

перейти к ответу ->>

Рассмотрение графа "подзадачи – сообщения" концентрирует внимание на вопросах:

перейти к ответу ->>

Эксперименты в режиме имитации возможно проводить:

перейти к ответу ->>

Задача поиска всех кратчайших путей обычно формулируется как:

перейти к ответу ->>

Режим передачи по готовности может быть использован только если:

перейти к ответу ->>

Под параллельной программой в рамках MPI понимается:

перейти к ответу ->>

Управление распределением нагрузки для процессоров необходимо:

перейти к ответу ->>

В чем состоят необходимые условия для возможности организации параллельных вычислений:

перейти к ответу ->>

Рассмотрим задачу поиска решения системы линейных уравнений. Пусть размер матрицы системы линейных уравнений 100x100. На вычислительной системе все операции сложения и умножения выполняются одинаковое время \tau = 2 нсек. Латентности сети \alpha = 500 нсек. Пропускная способность сети \beta = 50 Mбайт/сек. Элементы матрицы системы линейных уравнений имеют тип double и занимают w = 8 байт. Если при распараллеливании алгоритма Гауса использовалось 4 процессора, то какое в этом случае достигается теоретическое ускорение:

перейти к ответу ->>

Какие проблемы параллельного программирования являются общими для систем с общей и распределенной памятью?

перейти к ответу ->>

Метод покоординатного разбиения для решения задачи оптимального разделения графов отличается от метода бинарного деления тем, что:

перейти к ответу ->>

Двоичный код Грея используется для определения соответствия между:

перейти к ответу ->>

Время начальной подготовки (tн) характеризует:

перейти к ответу ->>

Пусть есть задача вычисления суммы следующего вида y=\sum\limits_{i=1}^N a_ib_i. Пусть N = 8 и применяется каскадная схема с минимально возможной высотой дерева модели вычисления. Чему в этом случае равна эффективность при использовании восьми вычислительных элементов:

перейти к ответу ->>

В методах покоординатной маршрутизации поиск путей передачи данных осуществляется:

перейти к ответу ->>

Для эффективного выполнения параллельного алгоритма умножения матриц, основанного на ленточной схеме разделения данных, необходимо, чтобы процессоры вычислительной системы были организованы в топологию:

перейти к ответу ->>

Какая коммуникационная операция используется в параллельном алгоритме умножения матрицы на вектор, основанном на блочном разделении матрицы, для получения блоков результирующего вектора на процессорах, составляющих одну строку процессорной решетки?

перейти к ответу ->>

Какие режимы передачи данных поддерживает система имитационного моделирования ПараЛаб:

перейти к ответу ->>

Распределенные вычислительные системы:

перейти к ответу ->>

Суперкомпьютеры:

перейти к ответу ->>

Кластерные вычислительные системы:

перейти к ответу ->>

Под мультикомпьютером понимается:

перейти к ответу ->>

Типовые топологии сети передачи данных определяются:

перейти к ответу ->>

Какая из приведенных в лекции топологий (при одинаковом количестве процессоров) обладает наименьшей стоимостью:

перейти к ответу ->>

В модели вычислений вершинами графа являются:

перейти к ответу ->>

Стоимость вычислений - это:

перейти к ответу ->>

При вычислении общей суммы последовательности числовых значений стоимостно-оптимальным алгоритмом является:

перейти к ответу ->>

Пусть есть задача вычисления суммы следующего вида y=\sum\limits_{i=1}^N a_i. Пусть N = 6 и применяется каскадная схема с минимально возможной высотой дерева модели вычисления. Чему в этом случае равна стоимость вычислений при использовании восьми вычислительных элементов:

перейти к ответу ->>

Пусть в решаемой задаче последовательная часть составляет четыре единицы времени, а часть, допускающая линейное распараллеливание, шесть единицы времени. Если использовать закон Амдаля, сколько потребуется процессоров для достижения ускорения в два раза:

перейти к ответу ->>

Метод покоординатной маршрутизации в приложении к топологии типа гиперкуб состоит:

перейти к ответу ->>

Основной набор параметров, описывающих время передачи данных, состоит из следующего набора величин:

перейти к ответу ->>

При использовании метода передачи сообщений:

перейти к ответу ->>

Задача редукции определяется в общем виде как:

перейти к ответу ->>

Уплотнение дуг это:

перейти к ответу ->>

Соседние вершины в нумерации кода Грея имеют:

перейти к ответу ->>

Для кластерных систем характерна:

перейти к ответу ->>

Масштабирование разрабатываемого параллельного алгоритма это процесс:

перейти к ответу ->>

Граф "процессы – каналы" используется:

перейти к ответу ->>

Для снижения сложности моделирования и анализа параллельных методов операции передачи и приема данных считаются выполняющимися:

перейти к ответу ->>

Выбор способа разделения вычислений на независимые части основывается:

перейти к ответу ->>

В статической схеме передачи данных:

перейти к ответу ->>

Этап распределения подзадач между процессорами является избыточным, если:

перейти к ответу ->>

Для организации параллельных вычислений в вычислительных системах с распределенной памятью необходимо:

перейти к ответу ->>

Под коммуникатором в MPI понимается:

перейти к ответу ->>

Процессы, между которыми выполняется передача данных:

перейти к ответу ->>

Функция MPI_Recv:

перейти к ответу ->>

В синхронном режиме передачи завершение функции отправки сообщения происходит:

перейти к ответу ->>

Функция блокирующего ожидания завершения одного обмена в MPI называется:

перейти к ответу ->>

Коллективные операции MPI:

перейти к ответу ->>

Обобщенная передача данных от всех процессов всем процессам может быть описана как:

перейти к ответу ->>

Протяженность производного типа в MPI это:

перейти к ответу ->>

H-векторный и H-индексный способы создания данных отличаются от векторного и индексного способов тем, что:

перейти к ответу ->>

MPI поддерживает топологии вида:

перейти к ответу ->>

Какие способы распределения элементов матрицы между процессорами вычислительной системы изложены в данной лекции?

перейти к ответу ->>

Какая коммуникационная операция используется при выполнении параллельного алгоритма умножения матрицы на вектор, основанного на разделении матрицы на вертикальные полосы?

перейти к ответу ->>

Для эффективного выполнения параллельного алгоритма умножения матрицы на вектор, основанного на разделении матрицы на вертикальные полосы, необходимо, чтобы процессоры вычислительной системы были объединены в топологию:

перейти к ответу ->>

Какие алгоритмы обладают наилучшими теоретическими показателями ускорения и эффективности (в случае, когда не учитываются затраты на передачу данных между процессорами):

перейти к ответу ->>

Рассмотрим задачу перемножения матрицы на вектор. Пусть размер перемножаемой матрицы 100x100. На вычислительной системе все операции сложения и умножения выполняются одинаковое время \tau = 2 нсек. Латентности сети \alpha = 40 нсек. Пропускная способность сети 60 Мбайт/сек. Элементы матрицы имеют тип double и занимают w = 8 байт. Если при распараллеливании использовать разделение матрицы на строки, чему будет равна теоретическая стоимость при использовании 2 процессоров:

перейти к ответу ->>

Пусть перед программистом поставлена задача перемножения матрицы на вектор. Размер перемножаемой матрицы 100x100. На вычислительной системе все операции сложения и умножения выполняются одинаковое время \tau = 2 нсек. Латентности сети \alpha = 50 нсек. Пропускная способность сети 60 Мбайт/сек. Элементы матрицы имеют тип double и в системе занимают w = 8 байт. Если при распараллеливании использовать разделение матрицы на блоки (количество блоков по строкам и по строкам равно и равно q=\sqrt{p}, где p – количество процессоров), чему будет равно теоретическое ускорение при использовании 16 процессоров:

перейти к ответу ->>

Какие схемы разделения данных используются при разработке параллельных алгоритмов умножения матриц?

перейти к ответу ->>

С ростом числа процессоров, наибольшее ускорение демонстрируют:

перейти к ответу ->>

Рассмотрим задачу перемножения матриц. Пусть размер перемножаемой матрицы 100x100. На вычислительной системе все операции сложения и умножения выполняются одинаковое время \tau = 2 нсек. Латентности сети \alpha = 500 нсек. Пропускная способность сети \beta = 50 Mбайт/сек. Элементы матрицы имеют тип double и занимают w = 8 байт. Если при распараллеливании использовать разделение матрицы на ленты, чему будет равно теоретическое ускорение при использовании 4 процессоров:

перейти к ответу ->>

Рассмотрим задачу перемножения матриц. Пусть размер перемножаемой матрицы 200x200. На вычислительной системе все операции сложения и умножения выполняются одинаковое время \tau = 2 нсек. Латентности сети \alpha = 500 нсек. Пропускная способность сети \beta = 50 Mбайт/сек. Элементы матрицы имеют тип double и занимают w = 8 байт. Если при распараллеливании использовать алгоритм Фокса, чему будет равна теоретическая эффективность при использовании 4 процессоров:

перейти к ответу ->>

Какая схема разделения данных используется при реализации параллельного алгоритма Гаусса?

перейти к ответу ->>

На каждой итерации прямого хода алгоритма Гаусса для нахождения ведущей строки используется

перейти к ответу ->>

За основу организации параллельных вычислений при реализации метода сопряженных градиентов выбирается параллельное выполнение операции умножения матрицы на вектор, потому что:

перейти к ответу ->>

Рассмотрим задачу поиска решения системы линейных уравнений. Пусть размер матрицы системы линейных уравнений 100x100. На вычислительной системе все операции сложения и умножения выполняются одинаковое время \tau = 2 нсек. Латентности сети \alpha = 50 нсек. Пропускная способность сети \beta = 60 Mбайт/сек. Элементы матрицы системы линейных уравнений имеют тип double и занимают w = 8 байт. Если при распараллеливании алгоритма Гауса использовалось 4 процессора, то какая в этом случае достигается теоретическая эффективность:

перейти к ответу ->>

Рассмотрим задачу поиска решения системы линейных уравнений. Пусть размер матрицы системы линейных уравнений 20x20. На вычислительной системе все операции сложения и умножения выполняются одинаковое время \tau = 2 нсек. Латентности сети \alpha = 50 нсек. Пропускная способность сети \beta = 60 Mбайт/сек. Элементы матрицы системы линейных уравнений имеют тип double и занимают w = 8 байт. Если при распараллеливании алгоритма сопряженных градиентов использовалось 4 процессора, то какая в этом случае достигается теоретическая стоимость параллельного алгоритма:

перейти к ответу ->>

Внутренняя сортировка это:

перейти к ответу ->>

Базовая операция "сравнить и переставить" состоит из:

перейти к ответу ->>

Общее число итераций параллельного алгоритма чет-нечетной сортировки при использовании p процессоров равно:

перейти к ответу ->>

Параллельный вариант алгоритма Шелла состоит в следующем:

перейти к ответу ->>

При надлежащем выборе ведущих элементов в алгоритме быстрой сортировки исходный массив данных оказывается упорядоченным после выполнения:

перейти к ответу ->>

Три схемы распараллеливания алгоритма быстрой сортировки различаются:

перейти к ответу ->>

Один из этапов параллельного алгоритма быстрой сортировки состоит том, что:

перейти к ответу ->>

Для поддержки упорядоченности в ходе выполнения алгоритма обобщенной быстрой сортировки процессоры должны выполнять:

перейти к ответу ->>

Взвешенный граф это:

перейти к ответу ->>

Сложность последовательного алгоритма Флойда имеет порядок:

перейти к ответу ->>

При горизонтальном разбиении матрицы исходных данных на каждой итерации алгоритма Флойда потребуется передавать между подзадачами:

перейти к ответу ->>

Охватывающим деревом (или остовом) неориентированного графа называется:

перейти к ответу ->>

Трудоемкость нахождения МОД характеризуется:

перейти к ответу ->>

Задача оптимального разделения графа состоит в разбиении вершин графа на непересекающиеся подмножества:

перейти к ответу ->>

Для разбиения графа на k частей в методе бинарного деления для решения задачи оптимального разделения графов необходимо выполнить:

перейти к ответу ->>

На одном из этапов метода покоординатного разбиения для решения задачи оптимального разделения графов:

перейти к ответу ->>

Основное отличие комбинаторных алгоритмов от геометрических методов, применяемых для решения задачи оптимального разделения графов, заключается:

перейти к ответу ->>

При разработке параллельных алгоритмов решения дифференциальных уравнений в частных производных за основу выбирается разделение данных, потому что:

перейти к ответу ->>

Каким образом обеспечивается балансировка вычислительной нагрузки процессоров для параллельных алгоритмов для систем с общей памятью,?

перейти к ответу ->>

Чем определяется эффективность параллельных вычислений?

перейти к ответу ->>

В чем состоит первая проблема, которую приходится решать при организации параллельных вычислений на системах с распределенной памяти?

перейти к ответу ->>

Какие механизмы передачи данных могут быть задействованы?

перейти к ответу ->>

К числу параметров вычислительной системы в системе ПараЛаб относятся:

перейти к ответу ->>

В каком из режимов можно провести вычислительный эксперимент?

перейти к ответу ->>

При построении графических зависимостей для экспериментов, проведенных в режиме удаленного доступа к параллельной вычислительной системы, используется:

перейти к ответу ->>

Какие топологий сети не поддерживает система имитационного моделирования ПараЛаб:

перейти к ответу ->>

На каких топологиях сети в системе ПараЛаб не реализованы алгоритмы обработки графов:

перейти к ответу ->>

Помимо выполнения экспериментов в режиме имитации, в системе ПараЛаб предусмотрена возможность проведения реальных экспериментов в режиме удаленного доступа к вычислительному кластеру. Какие возможны операции после выполнения реальных параллельных вычислений:

перейти к ответу ->>

При выполнении параллельного алгоритма, основанного на разделении данных на горизонтальные полосы, сбор данных полученных результатов выполняется при помощи:

перейти к ответу ->>

Операция широковещательной рассылки данных это:

перейти к ответу ->>

Базовая операция "сравнить и переставить" обычно используется в:

перейти к ответу ->>

Какие из перечисленных ниже классы задач поддерживает система имитационного моделирования ПараЛаб:

перейти к ответу ->>

Комбинаторные методы решения задачи оптимального разделения графов обычно обеспечивают:

перейти к ответу ->>

Разработка параллельных алгоритмов включает в себя этапы:

перейти к ответу ->>

При проведении серии экспериментов системой ПараЛаб может автоматически варьироваться:

перейти к ответу ->>

Трудоемкость параллельного алгоритма чет-нечетной сортировки оценивается выражением:

перейти к ответу ->>

Каскадная схема используется для:

перейти к ответу ->>

Для эффективного выполнения алгоритма Фокса необходимо, чтобы процессоры вычислительной системы были организованы в топологию:

перейти к ответу ->>

В рамках системы ПараЛаб какие допускаются схемы выполнения вычислений при проведении экспериментов:

перейти к ответу ->>

Для того чтобы выбрать ведущий элемент в параллельном алгоритме быстрой сортировки выполняются следующие действия:

перейти к ответу ->>

Один из возможных способов агрегации вычислений для увеличения эффективности параллельного алгоритма Флойда состоит:

перейти к ответу ->>

В методе передачи пакетов:

перейти к ответу ->>

Рассмотрим задачу перемножения матрицы на вектор. Пусть размер перемножаемой матрицы 100x100. На вычислительной системе все операции сложения и умножения выполняются одинаковое время \tau = 2 нсек. Латентности сети \alpha = 50 нсек. Пропускная способность сети 60 Мбайт/сек. Элементы матрицы имеют тип double и занимают w = 8 байт. Если при распараллеливании использовать разделение матрицы на строки чему будет равно теоретическое ускорение при использовании 2 процессоров:

перейти к ответу ->>

Под процессом понимают:

перейти к ответу ->>

Основным показателем успешности выполнения этапа распределения подзадач между процессорами является:

перейти к ответу ->>

Рассмотрим задачу перемножения матриц. Пусть размер перемножаемой матрицы 100x100. На вычислительной системе все операции сложения и умножения выполняются одинаковое время \tau = 2 нсек. Латентности сети \alpha = 500 нсек. Пропускная способность сети \beta = 50 Mбайт/сек. Элементы матрицы имеют тип double и в системе занимают w = 8 байт. Если при распараллеливании использовать алгоритм Кеннона, чему будет равно теоретическое ускорение при использовании 4 процессоров:

перейти к ответу ->>

При разработке параллельных алгоритмов для матричных вычислений за основу выбирается разделение данных, потому что:

перейти к ответу ->>

Пусть есть задача вычисления произведения всех элемента вектора y= \prod\limits_{i=1}^N a_i. Пусть N = 6 и применяется каскадная схема с минимально возможной высотой дерева модели вычисления. Чему в этом случае равно ускорение при использовании неограниченного числа вычислительных элементов:

перейти к ответу ->>

Для эффективного выполнения параллельного алгоритма умножения матрицы на вектор, основанного на разделении матрицы на горизонтальные полосы, необходимо, чтобы процессоры вычислительной системы были объединены в топологию:

перейти к ответу ->>

В рассматриваемой учебной задаче по решению задачи Дирихле при использовании разделенной памяти, какие возможны способы разделения данных?

перейти к ответу ->>

Алгоритмы маршрутизации определяют:

перейти к ответу ->>

Номер процесса в рамках MPI именуется:

перейти к ответу ->>

Для распределения вычислений между процессорами в вычислительных системах с распределенной памятью необходимо:

перейти к ответу ->>

Режим разделения времени:

перейти к ответу ->>

Под кластером обычно понимается:

перейти к ответу ->>

В основе классификации вычислительных систем в систематике Флинна используются:

перейти к ответу ->>

Среди рассмотренных в лекции типовых топологий приведены:

перейти к ответу ->>

Какая из приведенных в лекции топологий (при одинаковом количестве процессоров) обладает наименьшим диаметром:

перейти к ответу ->>

Ускорение параллельных вычислений – это:

перейти к ответу ->>

Пусть в решаемой задаче последовательная часть составляет четыре единицы времени, а часть, допускающая линейное распараллеливание, шесть единицы времени. Если использовать закона Густавсона-Барсиса, сколько потребуется процессоров для достижения ускорения в два раза (результат округлите в большую сторону):

перейти к ответу ->>

Метод передачи пакетов в большинстве случаев приводит к:

перейти к ответу ->>

Для рассылки от одного процессора всем остальным процессорам сети при использовании топологии типа гиперкуб достаточно (N=log2p):

перейти к ответу ->>

Способы логического представления (отображения) топологий характеризуются следующими тремя основными характеристиками:

перейти к ответу ->>

Соседние вершины в кольцевой топологии отображаются кодом Грея:

перейти к ответу ->>

В модели Хокни используются параметры:

перейти к ответу ->>

Распределение подзадач между процессорами должно быть выполнено таким образом, чтобы:

перейти к ответу ->>

Граф "подзадачи – сообщения" представляет собой:

перейти к ответу ->>

Канал передачи данных можно рассматривать как:

перейти к ответу ->>

Для локальной схемы передачи данных характерно:

перейти к ответу ->>

Все данные для передачи в качестве сообщения MPI описываются с помощью триады:

перейти к ответу ->>

Сигнатурой производного типа в MPI именуется:

перейти к ответу ->>

При выполнении параллельного алгоритма, основанного на разделении матрицы на горизонтальные полосы, сбор данных результирующего вектора выполняется при помощи:

перейти к ответу ->>

Пусть перед программистом поставлена задача перемножения матрицы на вектор. Размер перемножаемой матрицы 100x100. На вычислительной системе все операции сложения и умножения выполняются одинаковое время \tau = 2 нсек. Латентности сети \alpha = 50 нсек. Пропускная способность сети 60 Мбайт/сек. Элементы матрицы имеют тип double и в системе занимают w = 8 байт. Если при распараллеливании использовать разделение матрицы на блоки (количество блоков по строкам и по строкам равно и равно q=\sqrt{p}, где p – количество процессоров), чему будет равно теоретическая эффективность при использовании 4 процессоров:

перейти к ответу ->>

Какая схема разделения данных используется при разработке параллельных алгоритмов Фокса и Кэннона?

перейти к ответу ->>

Какие коммуникационные операции используются при выполнении параллельного алгоритма Фокса?

перейти к ответу ->>

Какое расположение вектора правых частей и вектора неизвестных используется при реализации параллельного алгоритма Гаусса:

перейти к ответу ->>

При выполнении параллельного алгоритма Гаусса основными коммуникационными операциями являются:

перейти к ответу ->>

При реализации параллельного алгоритма для метода сопряженных градиентов вычисления над векторами дублируются на всех процессорах для того, чтобы:

перейти к ответу ->>

Задача сортировки данных обычно формулируется как:

перейти к ответу ->>

Алгоритм быстрой сортировки основан на:

перейти к ответу ->>

Оптимальная стратегия выбора ведущего элемента при применении параллельных алгоритмов быстрой сортировки состоит в выборе такого значения ведущего элемента, при котором:

перейти к ответу ->>

Минимально охватывающим деревом называется:

перейти к ответу ->>

Количество выполняемых операций при определении номера ближайшей вершины до охватывающего дерева и корректировке расстояний после расширения МОД ограничивается сверху величиной:

перейти к ответу ->>

Для разбиения графа на k частей в методе бинарного деления для решения задачи оптимального разделения графов необходимо:

перейти к ответу ->>

С какими проблемами сталкивается программист, разрабатывая параллельные программы для систем с общей памятью?

перейти к ответу ->>

Какой способ наиболее эффективен при подсчете общей для всех процессоров погрешности вычислений, которые используются в параллельной реализации метода сеток на системах с распределенной памятью?

перейти к ответу ->>

За счет чего увеличивается число передач данных между процессорами при блочном представлении сетки области расчетов на системах с распределенной памятью?

перейти к ответу ->>

Какие достоинства имеет синхронный механизм передачи сообщений?

перейти к ответу ->>

Для постановки задачи в системе ПараЛаб необходимо выбрать:

перейти к ответу ->>

При анализе результатов проведенных экспериментов пользователю предоставляется возможность:

перейти к ответу ->>

В рамках системы ПараЛаб какие присутствуют средства для детального изучения и исследования параллельных алгоритмов решения сложных вычислительных задач:

перейти к ответу ->>

Процессы параллельной программой в рамках MPI:

перейти к ответу ->>

При индексном способе новый производный тип создается как:

перейти к ответу ->>

Для эффективного выполнения алгоритма Кэннона необходимо, чтобы процессоры вычислительной системы были организованы в топологию:

перейти к ответу ->>

В коллективных операциях передачи данных обязаны принимать участие:

перейти к ответу ->>

Задача разделения вычислительной сети, на которую разбивается область обрабатываемых данных, между процессорами может быть сведена:

перейти к ответу ->>

Применение неблокирующего способа выполнения обменов позволяет:

перейти к ответу ->>

В модифицированной каскадной схеме:

перейти к ответу ->>

Модель вычислений – это:

перейти к ответу ->>

При асинхронном способе взаимодействия участники взаимодействия:

перейти к ответу ->>

При реализации параллельного алгоритма Гаусса рекомендуется использовать ленточную циклическую схему разделения данных, потому что

перейти к ответу ->>

Завершение функции MPI_Send означает, что:

перейти к ответу ->>

Пусть в решаемой задаче последовательная часть составляет четыре единицы времени, а часть, допускающая линейное распараллеливание, шесть единицы времени. Если использовать закон Амдаля, какая достигается эффективность, если используются три вычислительных элемента:

перейти к ответу ->>

Какие способы разделения элементов матрицы между процессорами вычислительной системы используются для разработки параллельных алгоритмов умножения матрицы на вектор?

перейти к ответу ->>

Какие алгоритмы обладают наилучшими теоретическими показателями ускорения и эффективности (в случае, когда не учитываются затраты на передачу данных между процессорами):

перейти к ответу ->>

Показатели ускорения и эффективности параллельного алгоритма Прима имеют вид (без учета затрат на передачу данных):

перейти к ответу ->>

К основным преимуществам кластерных вычислительных систем относится:

перейти к ответу ->>

Операцию редукции данных MPI_Reduce можно описать:

перейти к ответу ->>

Показатели ускорения и эффективности параллельного алгоритма Флойда имеют вид (без учета затрат на передачу данных):

перейти к ответу ->>

Равновесность подмножеств вершин в задаче оптимального разделения графа:

перейти к ответу ->>

На каждой итерации обратного хода метода Гаусса используется

перейти к ответу ->>

Какую компьютерную систему можно отнести к суперкомпьютерам:

перейти к ответу ->>

Общее наименьшее количество итераций параллельного алгоритма Шелла равно:

перейти к ответу ->>

Какие способы распределения данных между процессорами вычислительной системы изложены в данной лекции?

перейти к ответу ->>

Рассмотрим задачу перемножения матрицы на вектор. Пусть размер перемножаемой матрицы 100x100. На вычислительной системе все операции сложения и умножения выполняются одинаковое время \tau = 2 нсек. Латентности сети \alpha = 50 нсек. Пропускная способность сети 60 Мбайт/сек. Элементы матрицы имеют тип double и занимают w = 8 байт. Если при распараллеливании использовать разделение матрицы на строки чему будет равно ускорение при использовании 4 процессоров:

перейти к ответу ->>

При выполнении алгоритма обобщенной быстрой сортировки в качестве ведущего элемента обычно выбирается:

перейти к ответу ->>

В модели вычислений дуги графа определяют:

перейти к ответу ->>

Прием сообщений при помощи функции MPI_Recv может быть осуществлен:

перейти к ответу ->>

Пусть есть задача вычисления произведения всех элементов вектора y= \prod\limits_{i=1}^N a_i. Пусть N = 10 и применяется каскадная схема, аналогичная схеме описанной в лекции для суммирования элементов вектора. Какая в этом случае минимально возможная высота дерева модели вычисления:

перейти к ответу ->>

На основании результатов экспериментов, представленных в лекции, можно сказать, что наибольшее ускорение демонстрирует:

перейти к ответу ->>

Топология типа тор в MPI является частным видом топологии типа:

перейти к ответу ->>

Минимально необходимый набор операций для организации информационного взаимодействия между процессорами в вычислительных системах с распределенной памятью включает в себя только:

перейти к ответу ->>

К числу суперкомпьютеров относятся:

перейти к ответу ->>

Какая из приведенных в лекции топологий (при одинаковом количестве процессоров) обладает наибольшей связностью:

перейти к ответу ->>

Эффективность параллельных вычислений – это:

перейти к ответу ->>

Циклический q-сдвиг, это операция, при которой:

перейти к ответу ->>

Увеличение вершин:

перейти к ответу ->>

Указание используемого коммуникатора является:

перейти к ответу ->>

Прием сообщения при помощи функции MPI_Recv может быть инициирован:

перейти к ответу ->>

При векторном способе новый производный тип создается как:

перейти к ответу ->>

С ростом числа процессоров, согласно теоретической оценке, наибольшее ускорение демонстрирует:

перейти к ответу ->>

Можно ли утверждать, что представленные в лекции алгоритмы обладают идеальными теоретическими показателями ускорения и эффективности (в случае, когда не учитываются затраты на передачу данных между процессорами):

перейти к ответу ->>

Рассмотрим задачу поиска решения системы линейных уравнений. Пусть размер матрицы системы линейных уравнений 100x100. На вычислительной системе все операции сложения и умножения выполняются одинаковое время \tau = 2 нсек. Латентности сети \alpha = 5 нсек. Пропускная способность сети \beta = 500 Mбайт/сек. Элементы матрицы системы линейных уравнений имеют тип double и занимают w = 8 байт. Если при распараллеливании алгоритма сопряженных градиентов использовалось 4 процессора, то какое в этом случае достигается теоретическое ускорение:

перейти к ответу ->>

Нижняя оценка необходимого количества операций для упорядочивания набора из n значений определяется выражением:

перейти к ответу ->>

Основными отличиями параллельного алгоритма Шелла от метода чет-нечетной перестановки являются:

перейти к ответу ->>

При применении параллельных алгоритмов быстрой сортировки одним из основных моментов является:

перейти к ответу ->>

Задача нахождения МОД формулируется как:

перейти к ответу ->>

Вычислительный эксперимент в системе ПараЛаб – это:

перейти к ответу ->>

На каких топологиях сети в системе ПараЛаб реализованы алгоритмы перемножения матриц:

перейти к ответу ->>

Для параллельных алгоритмов для систем с общей памятью при проведении вычислительных экспериментов может наблюдаться сверхлинейное ускорение. Каковы возможные причины достижения этого эффекта?

перейти к ответу ->>

Трудоемкость алгоритма пузырьковой сортировки оценивается выражением:

перейти к ответу ->>

В декартовой топологии множество процессов представляется в виде:

перейти к ответу ->>

При построении графических зависимостей для экспериментов, проведенных в режиме имитации, используются:

перейти к ответу ->>

Под мультипроцессором понимается:

перейти к ответу ->>

Пусть есть задача вычисление суммы следующего вида y=\sum\limits_{i=1}^N a_ib_i. Пусть N = 8 и применяется каскадная схема, аналогичная схеме описанной в лекции для суммирования элементов вектора. Какая в этом случае минимально возможная высота дерева модели вычисления:

перейти к ответу ->>

Производным типом данных в MPI называется:

перейти к ответу ->>

Число итераций параллельного алгоритма Флойда равно:

перейти к ответу ->>

На каких топологиях сети в системе ПараЛаб реализована быстрая сортировка:

перейти к ответу ->>

Из представленных в лекции алгоритмов, лучшей масштабируемостью обладает:

перейти к ответу ->>

Топология полный граф сети кластерной вычислительной системы может иметь ограничения на:

перейти к ответу ->>

Рассмотрим задачу перемножения матриц. Пусть размер перемножаемой матрицы 100x100. На вычислительной системе все операции сложения и умножения выполняются одинаковое время \tau = 2 нсек. Латентности сети \alpha = 500 нсек. Пропускная способность сети \beta = 50 Mбайт/сек. Элементы матрицы имеют тип double и занимают w = 8 байт. Если при распараллеливании использовать алгоритм Фокса, чему будет равно теоретическое ускорение при использовании 4 процессоров:

перейти к ответу ->>

Рассмотрим задачу перемножения матриц. Пусть размер перемножаемой матрицы 200x200. На вычислительной системе все операции сложения и умножения выполняются одинаковое время \tau = 2 нсек. Латентности сети \alpha = 500 нсек. Пропускная способность сети \beta = 50 Mбайт/сек. Элементы матрицы имеют тип double и в системе занимают w = 8 байт. Если при распараллеливании использовать разделение матрицы на ленты, чему будет равна теоретическая эффективность при использовании 4 процессоров:

перейти к ответу ->>

Рассмотрим задачу поиска решения системы линейных уравнений. Пусть размер матрицы системы линейных уравнений 200x200. На вычислительной системе все операции сложения и умножения выполняются одинаковое время \tau = 2 нсек. Латентности сети \alpha = 50 нсек. Пропускная способность сети \beta = 50 Mбайт/сек. Элементы матрицы системы линейных уравнений имеют тип double и занимают w = 8 байт. Если при распараллеливании алгоритма сопряженных градиентов использовалось 4 процессора, то какая в этом случае достигается теоретическая эффективность:

перейти к ответу ->>

Завершение вызова функции неблокирующего обмена приводит:

перейти к ответу ->>

Среди предусмотренных в составе MPI операций передачи сообщений различают:

перейти к ответу ->>

Длительность времени передачи одного слова данных по одному каналу передачи данных определяется:

перейти к ответу ->>

Какие достоинства и недостатки имеет асинхронный механизм передачи сообщений?

перейти к ответу ->>

К числу характеристик топологии сети передачи данных относятся:

перейти к ответу ->>

Качество разрабатываемых параллельных методов определяется:

перейти к ответу ->>

Как исключается неоднозначность вычислений в параллельном алгоритме метода сеток на системах с общей памятью?

перейти к ответу ->>

Для определения угла поворота в рекурсивном инерционном методе деления пополам при решении задачи оптимального разделения графов, используется:

перейти к ответу ->>

В отличие от геометрических схем комбинаторные методы решения задачи оптимального разделения графов не принимают во внимание:

перейти к ответу ->>

В буферизованном режиме функция отправки сообщения завершается:

перейти к ответу ->>

Для эффективного выполнения параллельного алгоритма умножения матрицы на вектор, основанного на блочном разделении матрицы, необходимо, чтобы процессоры вычислительной системы были объединены в топологию:

перейти к ответу ->>

Рассмотрим задачу перемножения матриц. Пусть размер перемножаемой матрицы 200x200. На вычислительной системе все операции сложения и умножения выполняются одинаковое время \tau = 2 нсек. Латентности сети \alpha = 500 нсек. Пропускная способность сети \beta = 50 Mбайт/сек. Элементы матрицы имеют тип double и занимают w = 8 байт. Если при распараллеливании использовать алгоритм Кеннона, чему будет равна теоретическая эффективность при использовании 4 процессоров:

перейти к ответу ->>

Какие коммуникационные операции используются при выполнении параллельного алгоритма Кэннона?

перейти к ответу ->>

Рассмотрим задачу поиска решения системы линейных уравнений. Размер матрицы системы линейных уравнений 10x10. На вычислительной системе все операции сложения и умножения выполняются одинаковое время \tau = 2 нсек. Латентности сети \alpha = 50 нсек. Пропускная способность сети \beta = 60 Mбайт/сек. Элементы матрицы системы линейных уравнений имеют тип double и в системе занимают w = 8 байт. Если при распараллеливании алгоритма Гауса использовалось 4 процессора, то какая в этом случае достигается теоретическая стоимость параллельного алгоритма:

перейти к ответу ->>

В худшем случае трудоемкость быстрой сортировки оценивается выражением:

перейти к ответу ->>

Метод бинарного деления для решения задачи оптимального разделения графов заключается:

перейти к ответу ->>