Введение в методы параллельного программирования - ответы

Количество вопросов - 249

Соседние вершины в кольцевой топологии отображаются кодом Грея:

Перейти

Нижняя оценка необходимого количества операций для упорядочивания набора из n значений определяется выражением:

Перейти

Метод покоординатной маршрутизации в приложении к топологии типа гиперкуб состоит:

Перейти

При применении параллельных алгоритмов быстрой сортировки одним из основных моментов является:

Перейти

Номер процесса в рамках MPI именуется:

Перейти

Сложность последовательного алгоритма Флойда имеет порядок:

Перейти

Операция широковещательной рассылки данных это:

Перейти

Задача редукции определяется в общем виде как:

Перейти

Какая из приведенных в лекции топологий (при одинаковом количестве процессоров) обладает наименьшей стоимостью:

Перейти

Основное отличие комбинаторных алгоритмов от геометрических методов, применяемых для решения задачи оптимального разделения графов, заключается:

Перейти

Какая коммуникационная операция используется при выполнении параллельного алгоритма умножения матрицы на вектор, основанного на разделении матрицы на вертикальные полосы?

Перейти

Пусть есть задача вычисление суммы следующего вида $y=\sum\limits_{i=1}^N a_ib_i$ . Пусть N = 8 и применяется каскадная схема, аналогичная схеме описанной в лекции для суммирования элементов вектора. Какая в этом случае минимально возможная высота дерева модели вычисления:

Перейти

Для распределения вычислений между процессорами в вычислительных системах с распределенной памятью необходимо:

Перейти

Под мультикомпьютером понимается:

Перейти

Матрица смежности это:

Перейти

На одном из этапов метода покоординатного разбиения для решения задачи оптимального разделения графов:

Перейти

Какие способы распределения элементов матрицы между процессорами вычислительной системы изложены в данной лекции?

Перейти

В результате выполнения одной итерации параллельного алгоритма быстрой сортировки исходное множество процессоров разделяется на:

Перейти

Пусть есть задача вычисления произведения всех элемента вектора $y= \prod\limits_{i=1}^N a_i$ . Пусть N = 6 и применяется каскадная схема с минимально возможной высотой дерева модели вычисления. Чему в этом случае равно ускорение при использовании неограниченного числа вычислительных элементов:

Перейти

На основании результатов экспериментов, представленных в лекции, можно сказать, что наибольшее ускорение демонстрирует:

Перейти

Распределенные вычислительные системы:

Перейти

В рассматриваемой учебной задаче по решению задачи Дирихле при использовании разделенной памяти, какие возможны способы разделения данных?

Перейти

Под коллективными операциями в MPI понимаются:

Перейти

Для разбиения графа на k частей в методе бинарного деления для решения задачи оптимального разделения графов необходимо:

Перейти

На каждой итерации обратного хода метода Гаусса используется

Перейти

Показатели ускорения и эффективности параллельного алгоритма Прима имеют вид (без учета затрат на передачу данных):

Перейти

В модели вычислений дуги графа определяют:

Перейти

В методе передачи пакетов:

Перейти

Из представленных в лекции алгоритмов, лучшей масштабируемостью обладает:

Перейти

Какой способ наиболее эффективен при подсчете общей для всех процессоров погрешности вычислений, которые используются в параллельной реализации метода сеток на системах с распределенной памятью?

Перейти

Какую компьютерную систему можно отнести к суперкомпьютерам:

Перейти

Под кластером обычно понимается:

Перейти

В основе классификации вычислительных систем в систематике Флинна используются:

Перейти

Типовые топологии сети передачи данных определяются:

Перейти

Какая из приведенных в лекции топологий (при одинаковом количестве процессоров) обладает наибольшей связностью:

Перейти

В модели вычислений вершинами графа являются:

Перейти

Эффективность параллельных вычислений – это:

Перейти

В модифицированной каскадной схеме:

Перейти

Пусть есть задача вычисление суммы следующего вида $y=\sum\limits_{i=1}^N a_ib_ic_i$ . Пусть N = 4 и применяется каскадная схема, аналогичная схеме описанной в лекции для суммирования элементов вектора. Какая в этом случае минимально возможная высота дерева модели вычисления:

Перейти

Пусть в решаемой задаче последовательная часть составляет четыре единицы времени, а часть, допускающая линейное распараллеливание, шесть единицы времени. Если использовать закон Амдаля, сколько потребуется процессоров для достижения ускорения в два раза:

Перейти

В методах покоординатной маршрутизации поиск путей передачи данных осуществляется:

Перейти

Основной набор параметров, описывающих время передачи данных, состоит из следующего набора величин:

Перейти

Метод передачи пакетов в большинстве случаев приводит к:

Перейти

Увеличение вершин:

Перейти

Топология полный граф сети кластерной вычислительной системы может иметь ограничения на:

Перейти

Процессы параллельной программой в рамках MPI:

Перейти

Под коммуникатором в MPI понимается:

Перейти

Завершение функции MPI_Send означает, что:

Перейти

Прием сообщения при помощи функции MPI_Recv может быть инициирован:

Перейти

В синхронном режиме передачи завершение функции отправки сообщения происходит:

Перейти

Завершение вызова функции неблокирующего обмена приводит:

Перейти

Обобщенная передача данных от всех процессов всем процессам может быть описана как:

Перейти

Производным типом данных в MPI называется:

Перейти

При индексном способе новый производный тип создается как:

Перейти

MPI поддерживает топологии вида:

Перейти

Распределение подзадач между процессорами должно быть выполнено таким образом, чтобы:

Перейти

Граф "подзадачи – сообщения" представляет собой:

Перейти

Канал передачи данных можно рассматривать как:

Перейти

При выборе способа разделения вычислений при прочих равных условиях нужно отдавать предпочтение:

Перейти

Для локальной схемы передачи данных характерно:

Перейти

Основным показателем успешности выполнения этапа распределения подзадач между процессорами является:

Перейти

При выполнении параллельного алгоритма, основанного на разделении матрицы на горизонтальные полосы, сбор данных результирующего вектора выполняется при помощи:

Перейти

Для эффективного выполнения параллельного алгоритма умножения матрицы на вектор, основанного на разделении матрицы на вертикальные полосы, необходимо, чтобы процессоры вычислительной системы были объединены в топологию:

Перейти

С ростом числа процессоров, согласно теоретической оценке, наибольшее ускорение демонстрирует:

Перейти

Рассмотрим задачу перемножения матрицы на вектор. Пусть размер перемножаемой матрицы 100x100. На вычислительной системе все операции сложения и умножения выполняются одинаковое время $\tau = 2$ нсек. Латентности сети $\alpha = 50$ нсек. Пропускная способность сети 60 Мбайт/сек. Элементы матрицы имеют тип double и занимают w = 8 байт. Если при распараллеливании использовать разделение матрицы на строки чему будет равно теоретическая эффективность при использовании 4 процессоров:

Перейти

Рассмотрим задачу перемножения матрицы на вектор. Пусть размер перемножаемой матрицы 100x100. На вычислительной системе все операции сложения и умножения выполняются одинаковое время $\tau = 2$ нсек. Латентности сети $\alpha = 40$ нсек. Пропускная способность сети 60 Мбайт/сек. Элементы матрицы имеют тип double и занимают w = 8 байт. Если при распараллеливании использовать разделение матрицы блоки (количество блоков по строкам и по строкам равно и равно $q=\sqrt{p}$ , где p – количество процессоров), чему будет равно теоретическая стоимость при использовании 4 процессоров:

Перейти

Какие схемы разделения данных используются при разработке параллельных алгоритмов умножения матриц?

Перейти

Какие коммуникационные операции используются при выполнении параллельного алгоритма Фокса?

Перейти

Для эффективного выполнения параллельного алгоритма умножения матриц, основанного на ленточной схеме разделения данных, необходимо, чтобы процессоры вычислительной системы были организованы в топологию:

Перейти

Из представленных в лекции алгоритмов, лучшей масштабируемостью обладает:

Перейти

Рассмотрим задачу перемножения матриц. Пусть размер перемножаемой матрицы 100x100. На вычислительной системе все операции сложения и умножения выполняются одинаковое время $\tau = 2$ нсек. Латентности сети $\alpha = 500$ нсек. Пропускная способность сети $\beta = 50$ Mбайт/сек. Элементы матрицы имеют тип double и занимают w = 8 байт. Если при распараллеливании использовать разделение матрицы на ленты, чему будет равно теоретическое ускорение при использовании 4 процессоров:

Перейти

Рассмотрим задачу перемножения матриц. Пусть размер перемножаемой матрицы 200x200. На вычислительной системе все операции сложения и умножения выполняются одинаковое время $\tau = 2$ нсек. Латентности сети $\alpha = 500$ нсек. Пропускная способность сети $\beta = 50$ Mбайт/сек. Элементы матрицы имеют тип double и занимают w = 8 байт. Если при распараллеливании использовать алгоритм Фокса, чему будет равна теоретическая эффективность при использовании 4 процессоров:

Перейти

Какое расположение вектора правых частей и вектора неизвестных используется при реализации параллельного алгоритма Гаусса:

Перейти

На каждой итерации прямого хода алгоритма Гаусса для нахождения ведущей строки используется

Перейти

За основу организации параллельных вычислений при реализации метода сопряженных градиентов выбирается параллельное выполнение операции умножения матрицы на вектор, потому что:

Перейти

Рассмотрим задачу поиска решения системы линейных уравнений. Пусть размер матрицы системы линейных уравнений 100x100. На вычислительной системе все операции сложения и умножения выполняются одинаковое время $\tau = 2$ нсек. Латентности сети $\alpha = 500$ нсек. Пропускная способность сети $\beta = 50$ Mбайт/сек. Элементы матрицы системы линейных уравнений имеют тип double и занимают w = 8 байт. Если при распараллеливании алгоритма Гаусса использовалось 4 процессора, то какое в этом случае достигается теоретическое ускорение:

Перейти

Рассмотрим задачу поиска решения системы линейных уравнений. Пусть размер матрицы системы линейных уравнений 200x200. На вычислительной системе все операции сложения и умножения выполняются одинаковое время $\tau = 2$ нсек. Латентности сети $\alpha = 50$ нсек. Пропускная способность сети $\beta = 50$ Mбайт/сек. Элементы матрицы системы линейных уравнений имеют тип double и занимают w = 8 байт. Если при распараллеливании алгоритма сопряженных градиентов использовалось 4 процессора, то какая в этом случае достигается теоретическая эффективность:

Перейти

Внутренняя сортировка это:

Перейти

Базовая операция "сравнить и переставить" состоит из:

Перейти

Трудоемкость алгоритма пузырьковой сортировки оценивается выражением:

Перейти

Основными отличиями параллельного алгоритма Шелла от метода чет-нечетной перестановки являются:

Перейти

В худшем случае трудоемкость быстрой сортировки оценивается выражением:

Перейти

Оптимальная стратегия выбора ведущего элемента при применении параллельных алгоритмов быстрой сортировки состоит в выборе такого значения ведущего элемента, при котором:

Перейти

Один из этапов параллельного алгоритма быстрой сортировки состоит том, что:

Перейти

При выполнении алгоритма обобщенной быстрой сортировки в качестве ведущего элемента обычно выбирается:

Перейти

Взвешенный граф это:

Перейти

Задача поиска всех кратчайших путей обычно формулируется как:

Перейти

Один из возможных способов агрегации вычислений для увеличения эффективности параллельного алгоритма Флойда состоит:

Перейти

Задача нахождения МОД формулируется как:

Перейти

Трудоемкость нахождения МОД характеризуется:

Перейти

Задача оптимального разделения графа состоит в разбиении вершин графа на непересекающиеся подмножества:

Перейти

Метод бинарного деления для решения задачи оптимального разделения графов заключается:

Перейти

Метод покоординатного разбиения для решения задачи оптимального разделения графов отличается от метода бинарного деления тем, что:

Перейти

Комбинаторные методы решения задачи оптимального разделения графов обычно обеспечивают:

Перейти

С какими проблемами сталкивается программист, разрабатывая параллельные программы для систем с общей памятью?

Перейти

Каким образом обеспечивается балансировка вычислительной нагрузки процессоров для параллельных алгоритмов для систем с общей памятью,?

Перейти

Для параллельных алгоритмов для систем с общей памятью при проведении вычислительных экспериментов может наблюдаться сверхлинейное ускорение. Каковы возможные причины достижения этого эффекта?

Перейти

Какие проблемы параллельного программирования являются общими для систем с общей и распределенной памятью?

Перейти

В чем состоит первая проблема, которую приходится решать при организации параллельных вычислений на системах с распределенной памяти?

Перейти

Какие механизмы передачи данных могут быть задействованы?

Перейти

Для постановки задачи в системе ПараЛаб необходимо выбрать:

Перейти

В каком из режимов можно провести вычислительный эксперимент?

Перейти

При анализе результатов проведенных экспериментов пользователю предоставляется возможность:

Перейти

Какие режимы передачи данных поддерживает система имитационного моделирования ПараЛаб:

Перейти

На каких топологиях сети в системе ПараЛаб не реализованы алгоритмы обработки графов:

Перейти

Помимо выполнения экспериментов в режиме имитации, в системе ПараЛаб предусмотрена возможность проведения реальных экспериментов в режиме удаленного доступа к вычислительному кластеру. Какие возможны операции после выполнения реальных параллельных вычислений:

Перейти

В коллективных операциях передачи данных обязаны принимать участие:

Перейти

С ростом числа процессоров, наибольшее ускорение демонстрирует:

Перейти

При векторном способе новый производный тип создается как:

Перейти

При проведении серии экспериментов системой ПараЛаб может автоматически варьироваться:

Перейти

Каскадная схема используется для:

Перейти

Режим разделения времени:

Перейти

В модели Хокни используются параметры:

Перейти

К числу суперкомпьютеров относятся:

Перейти

Пусть перед программистом поставлена задача перемножения матрицы на вектор. Размер перемножаемой матрицы 100x100. На вычислительной системе все операции сложения и умножения выполняются одинаковое время $\tau = 2$ нсек. Латентности сети $\alpha = 50$ нсек. Пропускная способность сети 60 Мбайт/сек. Элементы матрицы имеют тип double и в системе занимают w = 8 байт. Если при распараллеливании использовать разделение матрицы на блоки (количество блоков по строкам и по строкам равно и равно $q=\sqrt{p}$ , где p – количество процессоров), чему будет равно теоретическая эффективность при использовании 4 процессоров:

Перейти

Время начальной подготовки (tн) характеризует:

Перейти

На каких топологиях сети в системе ПараЛаб реализована быстрая сортировка:

Перейти

В статической схеме передачи данных:

Перейти

Рассмотрим задачу перемножения матрицы на вектор. Пусть размер перемножаемой матрицы 100x100. На вычислительной системе все операции сложения и умножения выполняются одинаковое время $\tau = 2$ нсек. Латентности сети $\alpha = 50$ нсек. Пропускная способность сети 60 Мбайт/сек. Элементы матрицы имеют тип double и занимают w = 8 байт. Если при распараллеливании использовать разделение матрицы на строки чему будет равно теоретическое ускорение при использовании 2 процессоров:

Перейти

Для снижения сложности моделирования и анализа параллельных методов операции передачи и приема данных считаются выполняющимися:

Перейти

Уплотнение дуг это:

Перейти

В рамках системы ПараЛаб какие допускаются схемы выполнения вычислений при проведении экспериментов:

Перейти

Под параллельной программой в рамках MPI понимается:

Перейти

Для того чтобы выбрать ведущий элемент в параллельном алгоритме быстрой сортировки выполняются следующие действия:

Перейти

Рассмотрим задачу поиска решения системы линейных уравнений. Пусть размер матрицы системы линейных уравнений 100x100. На вычислительной системе все операции сложения и умножения выполняются одинаковое время $\tau = 2$ нсек. Латентности сети $\alpha = 50$ нсек. Пропускная способность сети $\beta = 60$ Mбайт/сек. Элементы матрицы системы линейных уравнений имеют тип double и занимают w = 8 байт. Если при распараллеливании алгоритма Гауса использовалось 4 процессора, то какая в этом случае достигается теоретическая эффективность:

Перейти

Какие из перечисленных ниже классы задач поддерживает система имитационного моделирования ПараЛаб:

Перейти

Для эффективного выполнения алгоритма Фокса необходимо, чтобы процессоры вычислительной системы были организованы в топологию:

Перейти

Коллективные операции MPI:

Перейти

Функция MPI_Recv:

Перейти

Кластерные вычислительные системы:

Перейти

Количество выполняемых операций при определении номера ближайшей вершины до охватывающего дерева и корректировке расстояний после расширения МОД ограничивается сверху величиной:

Перейти

На каких топологиях сети в системе ПараЛаб реализованы алгоритмы перемножения матриц:

Перейти

Общее число итераций параллельного алгоритма чет-нечетной сортировки при использовании p процессоров равно:

Перейти

Какие алгоритмы обладают наилучшими теоретическими показателями ускорения и эффективности (в случае, когда не учитываются затраты на передачу данных между процессорами):

Перейти

К основным преимуществам кластерных вычислительных систем относится:

Перейти

Под мультипроцессором понимается:

Перейти

К числу характеристик топологии сети передачи данных относятся:

Перейти

Пусть есть задача вычисления суммы следующего вида $y=\sum\limits_{i=1}^N a_i$ . Пусть N = 6 и применяется каскадная схема с минимально возможной высотой дерева модели вычисления. Чему в этом случае равна стоимость вычислений при использовании восьми вычислительных элементов:

Перейти

Пусть в решаемой задаче последовательная часть составляет четыре единицы времени, а часть, допускающая линейное распараллеливание, шесть единицы времени. Если использовать закон Амдаля, какая достигается эффективность, если используются три вычислительных элемента:

Перейти

Алгоритмы маршрутизации определяют:

Перейти

Для рассылки от одного процессора всем остальным процессорам сети при использовании топологии типа гиперкуб достаточно (N=log₂p):

Перейти

Двоичный код Грея используется для определения соответствия между:

Перейти

Для кластерных систем характерна:

Перейти

Минимально необходимый набор операций для организации информационного взаимодействия между процессорами в вычислительных системах с распределенной памятью включает в себя только:

Перейти

Указание используемого коммуникатора является:

Перейти

Режим передачи по готовности может быть использован только если:

Перейти

Функция блокирующего ожидания завершения одного обмена в MPI называется:

Перейти

Сигнатурой производного типа в MPI именуется:

Перейти

H-векторный и H-индексный способы создания данных отличаются от векторного и индексного способов тем, что:

Перейти

Топология типа тор в MPI является частным видом топологии типа:

Перейти

Качество разрабатываемых параллельных методов определяется:

Перейти

Рассмотрение графа "подзадачи – сообщения" концентрирует внимание на вопросах:

Перейти

При асинхронном способе взаимодействия участники взаимодействия:

Перейти

При разработке параллельных алгоритмов для матричных вычислений за основу выбирается разделение данных, потому что:

Перейти

Какая коммуникационная операция используется в параллельном алгоритме умножения матрицы на вектор, основанном на блочном разделении матрицы, для получения блоков результирующего вектора на процессорах, составляющих одну строку процессорной решетки?

Перейти

Для эффективного выполнения параллельного алгоритма умножения матрицы на вектор, основанного на разделении матрицы на горизонтальные полосы, необходимо, чтобы процессоры вычислительной системы были объединены в топологию:

Перейти

При разработке параллельного алгоритма умножения матриц, основанного на ленточной схеме разделения данных, может быть использован подход:

Перейти

Какие коммуникационные операции используются при выполнении параллельного алгоритма Кэннона?

Перейти

Рассмотрим задачу перемножения матриц. Пусть размер перемножаемой матрицы 100x100. На вычислительной системе все операции сложения и умножения выполняются одинаковое время $\tau = 2$ нсек. Латентности сети $\alpha = 500$ нсек. Пропускная способность сети $\beta = 50$ Mбайт/сек. Элементы матрицы имеют тип double и в системе занимают w = 8 байт. Если при распараллеливании использовать алгоритм Кеннона, чему будет равно теоретическое ускорение при использовании 4 процессоров:

Перейти

За основу организации параллельных вычислений при реализации метода сопряженных градиентов выбирается:

Перейти

Рассмотрим задачу поиска решения системы линейных уравнений. Пусть размер матрицы системы линейных уравнений 100x100. На вычислительной системе все операции сложения и умножения выполняются одинаковое время $\tau = 2$ нсек. Латентности сети $\alpha = 5$ нсек. Пропускная способность сети $\beta = 500$ Mбайт/сек. Элементы матрицы системы линейных уравнений имеют тип double и занимают w = 8 байт. Если при распараллеливании алгоритма сопряженных градиентов использовалось 4 процессора, то какое в этом случае достигается теоретическое ускорение:

Перейти

Базовая операция "сравнить и переставить" обычно используется в:

Перейти

Общее наименьшее количество итераций параллельного алгоритма Шелла равно:

Перейти

Алгоритм быстрой сортировки основан на:

Перейти

Три схемы распараллеливания алгоритма быстрой сортировки различаются:

Перейти

Показатели ускорения и эффективности параллельного алгоритма Флойда имеют вид (без учета затрат на передачу данных):

Перейти

При горизонтальном разбиении матрицы исходных данных на каждой итерации алгоритма Флойда потребуется передавать между подзадачами:

Перейти

Для разбиения графа на k частей в методе бинарного деления для решения задачи оптимального разделения графов необходимо выполнить:

Перейти

Какие способы распределения данных между процессорами вычислительной системы изложены в данной лекции?

Перейти

Вычислительный эксперимент в системе ПараЛаб – это:

Перейти

Эксперименты в режиме имитации возможно проводить:

Перейти

При построении графических зависимостей для экспериментов, проведенных в режиме имитации, используются:

Перейти

Рассмотрим задачу перемножения матриц. Пусть размер перемножаемой матрицы 200x200. На вычислительной системе все операции сложения и умножения выполняются одинаковое время $\tau = 2$ нсек. Латентности сети $\alpha = 500$ нсек. Пропускная способность сети $\beta = 50$ Mбайт/сек. Элементы матрицы имеют тип double и в системе занимают w = 8 байт. Если при распараллеливании использовать разделение матрицы на ленты, чему будет равна теоретическая эффективность при использовании 4 процессоров:

Перейти

Каковы причины значительного снижения полезной вычислительной нагрузки для процессоров при организации волновых вычислений в системах с распределенной памятью?

Перейти

В обобщенном алгоритме быстрой сортировки в дополнение к обычному методу быстрой сортировки предлагается:

Перейти

Под процессом понимают:

Перейти

Число итераций параллельного алгоритма Флойда равно:

Перейти

Граф это:

Перейти

Равновесность подмножеств вершин в задаче оптимального разделения графа:

Перейти

Какие топологий сети не поддерживает система имитационного моделирования ПараЛаб:

Перейти

Какие достоинства и недостатки имеет асинхронный механизм передачи сообщений?

Перейти

Какая схема разделения данных используется при реализации параллельного алгоритма Гаусса?

Перейти

Процессы, между которыми выполняется передача данных:

Перейти

Какие достоинства имеет синхронный механизм передачи сообщений?

Перейти

В рамках системы ПараЛаб какие присутствуют средства для детального изучения и исследования параллельных алгоритмов решения сложных вычислительных задач:

Перейти

Пусть есть задача вычисления произведения всех элемента вектора $y= \prod\limits_{i=1}^N a_i$ . Пусть N = 10 и применяется каскадная схема, аналогичная схеме описанной в лекции для суммирования элементов вектора. Какая в этом случае минимально возможная высота дерева модели вычисления:

Перейти

Для эффективного выполнения параллельного алгоритма умножения матрицы на вектор, основанного на блочном разделении матрицы, необходимо, чтобы процессоры вычислительной системы были объединены в топологию:

Перейти

Какая из приведенных в лекции топологий (при одинаковом количестве процессоров) обладает наименьшим диаметром:

Перейти

Ускорение параллельных вычислений – это:

Перейти

При использовании метода передачи сообщений:

Перейти

Циклический q-сдвиг, это операция, при которой:

Перейти

Для организации параллельных вычислений в вычислительных системах с распределенной памятью необходимо:

Перейти

Протяженность производного типа в MPI это:

Перейти

Выбор способа разделения вычислений на независимые части основывается:

Перейти

Этап распределения подзадач между процессорами является избыточным, если:

Перейти

При выполнении параллельного алгоритма, основанного на ленточной схеме разделения данных, основной коммуникационной операцией является:

Перейти

Рассмотрим задачу перемножения матриц. Пусть размер перемножаемой матрицы 200x200. На вычислительной системе все операции сложения и умножения выполняются одинаковое время $\tau = 2$ нсек. Латентности сети $\alpha = 500$ нсек. Пропускная способность сети $\beta = 50$ Mбайт/сек. Элементы матрицы имеют тип double и занимают w = 8 байт. Если при распараллеливании использовать алгоритм Кеннона, чему будет равна теоретическая эффективность при использовании 4 процессоров:

Перейти

С ростом числа процессоров, наибольшее ускорение демонстрирует:

Перейти

Рассмотрим задачу поиска решения системы линейных уравнений. Размер матрицы системы линейных уравнений 10x10. На вычислительной системе все операции сложения и умножения выполняются одинаковое время $\tau = 2$ нсек. Латентности сети $\alpha = 50$ нсек. Пропускная способность сети $\beta = 60$ Mбайт/сек. Элементы матрицы системы линейных уравнений имеют тип double и в системе занимают w = 8 байт. Если при распараллеливании алгоритма Гауса использовалось 4 процессора, то какая в этом случае достигается теоретическая стоимость параллельного алгоритма:

Перейти

Задача сортировки данных обычно формулируется как:

Перейти

Базовая операция "сравнить и разделить" отличается от операции "сравнить и переставить":

Перейти

При надлежащем выборе ведущих элементов в алгоритме быстрой сортировки исходный массив данных оказывается упорядоченным после выполнения:

Перейти

Охватывающим деревом (или остовом) неориентированного графа называется:

Перейти

При построении графических зависимостей для экспериментов, проведенных в режиме удаленного доступа к параллельной вычислительной системы, используется:

Перейти

Для поддержки упорядоченности в ходе выполнения алгоритма обобщенной быстрой сортировки процессоры должны выполнять:

Перейти

Стоимость вычислений - это:

Перейти

Соседние вершины в нумерации кода Грея имеют:

Перейти

При реализации параллельного алгоритма для метода сопряженных градиентов вычисления над векторами дублируются на всех процессорах для того, чтобы:

Перейти

В чем состоят необходимые условия для возможности организации параллельных вычислений:

Перейти

Модель вычислений – это:

Перейти

Пусть в решаемой задаче последовательная часть составляет четыре единицы времени, а часть, допускающая линейное распараллеливание, шесть единицы времени. Если использовать закона Густавсона-Барсиса, сколько потребуется процессоров для достижения ускорения в два раза (результат округлите в большую сторону):

Перейти

Длительность времени передачи одного слова данных по одному каналу передачи данных определяется:

Перейти

Применение неблокирующего способа выполнения обменов позволяет:

Перейти

Операцию редукции данных MPI_Reduce можно описать:

Перейти

Разработка параллельных алгоритмов включает в себя этапы:

Перейти

Управление распределением нагрузки для процессоров необходимо:

Перейти

При выполнении параллельного алгоритма Гаусса основными коммуникационными операциями являются:

Перейти

Параллельный вариант алгоритма Шелла состоит в следующем:

Перейти

Задача разделения вычислительной сети, на которую разбивается область обрабатываемых данных, между процессорами может быть сведена:

Перейти

Как исключается неоднозначность вычислений в параллельном алгоритме метода сеток на системах с общей памятью?

Перейти

Пусть есть задача вычисления суммы следующего вида $y=\sum\limits_{i=1}^N a_ib_i$ . Пусть N = 8 и применяется каскадная схема с минимально возможной высотой дерева модели вычисления. Чему в этом случае равна эффективность при использовании восьми вычислительных элементов:

Перейти

В отличие от геометрических схем комбинаторные методы решения задачи оптимального разделения графов не принимают во внимание:

Перейти

Трудоемкость параллельного алгоритма чет-нечетной сортировки оценивается выражением:

Перейти

В декартовой топологии множество процессов представляется в виде:

Перейти

Граф "процессы – каналы" используется:

Перейти

Какие способы разделения элементов матрицы между процессорами вычислительной системы используются для разработки параллельных алгоритмов умножения матрицы на вектор?

Перейти

Какая схема разделения данных используется при разработке параллельных алгоритмов Фокса и Кэннона?

Перейти

Для эффективного выполнения алгоритма Кэннона необходимо, чтобы процессоры вычислительной системы были организованы в топологию:

Перейти

При выполнении параллельного алгоритма, основанного на разделении данных на горизонтальные полосы, сбор данных полученных результатов выполняется при помощи:

Перейти

Чем определяется эффективность параллельных вычислений?

Перейти

К числу параметров вычислительной системы в системе ПараЛаб относятся:

Перейти

Рассмотрим задачу поиска решения системы линейных уравнений. Пусть размер матрицы системы линейных уравнений 20x20. На вычислительной системе все операции сложения и умножения выполняются одинаковое время $\tau = 2$ нсек. Латентности сети $\alpha = 50$ нсек. Пропускная способность сети $\beta = 60$ Mбайт/сек. Элементы матрицы системы линейных уравнений имеют тип double и занимают w = 8 байт. Если при распараллеливании алгоритма сопряженных градиентов использовалось 4 процессора, то какая в этом случае достигается теоретическая стоимость параллельного алгоритма:

Перейти

Среди предусмотренных в составе MPI операций передачи сообщений различают:

Перейти

При вычислении общей суммы последовательности числовых значений стоимостно-оптимальным алгоритмом является:

Перейти

Способы логического представления (отображения) топологий характеризуются следующими тремя основными характеристиками:

Перейти

Все данные для передачи в качестве сообщения MPI описываются с помощью триады:

Перейти

В буферизованном режиме функция отправки сообщения завершается:

Перейти

Масштабирование разрабатываемого параллельного алгоритма это процесс:

Перейти

Какие алгоритмы обладают наилучшими теоретическими показателями ускорения и эффективности (в случае, когда не учитываются затраты на передачу данных между процессорами):

Перейти

При реализации параллельного алгоритма Гаусса рекомендуется использовать ленточную циклическую схему разделения данных, потому что

Перейти

Для определения угла поворота в рекурсивном инерционном методе деления пополам при решении задачи оптимального разделения графов, используется:

Перейти

При разработке параллельных алгоритмов решения дифференциальных уравнений в частных производных за основу выбирается разделение данных, потому что:

Перейти

Рассмотрим задачу перемножения матрицы на вектор. Пусть размер перемножаемой матрицы 100x100. На вычислительной системе все операции сложения и умножения выполняются одинаковое время $\tau = 2$ нсек. Латентности сети $\alpha = 40$ нсек. Пропускная способность сети 60 Мбайт/сек. Элементы матрицы имеют тип double и занимают w = 8 байт. Если при распараллеливании использовать разделение матрицы на строки чему будет равно теоретическая стоимость при использовании 2 процессоров:

Перейти

Минимально охватывающим деревом называется:

Перейти

Суперкомпьютеры:

Перейти

Прием сообщений при помощи функции MPI_Recv может быть осуществлен:

Перейти

Рассмотрим задачу перемножения матриц. Пусть размер перемножаемой матрицы 100x100. На вычислительной системе все операции сложения и умножения выполняются одинаковое время $\tau = 2$ нсек. Латентности сети $\alpha = 500$ нсек. Пропускная способность сети $\beta = 50$ Mбайт/сек. Элементы матрицы имеют тип double и занимают w = 8 байт. Если при распараллеливании использовать алгоритм Фокса, чему будет равно теоретическое ускорение при использовании 4 процессоров:

Перейти

За счет чего увеличивается число передач данных между процессорами при блочном представлении сетки области расчетов на системах с распределенной памятью?

Перейти

Среди рассмотренных в лекции типовых топологий приведены:

Перейти