Quark Publishing System - это
Universal network Language - это
WebSOM - это
Автоматическая классификация документов - это
Автоматический индекс в сети Интернет состоит из: 1) программы-робота; 2) базы данных; 3) иерархически упорядоченного набора категорий; 4) пользовательского интерфейса; 5) поисковой службы-каталога
Базовая аксиома машинного индексирования состоит в том, что
Более узкие, специфичные по содержанию, индексные термины положительно влияют на такую характеристику информационного поиска, как
Будущее машинного перевода связывают с
В качестве языка-посредника могут использоваться: 1) искусственный язык типа эсперанто; 2) язык представления синтаксической и семантической структуры; 3) любой из естественных языков; 4) языки глубинной семантики и концептуальных представлений; 5) специальные языки, полученные на основе естественных путем сокращения словаря и упрощения грамматики
В наши дни спрос на системы машинного перевода связан с
В основе квантитативного тематического анализа лежит
В основе систем статистического распознавания речи лежат: 1) словарь фонетических и/или фонемных транскрипций; 2) модель языка, задающая ограничения на построение предложений; 3) набор слов-гипотез; 4) набор вероятностей для различных последовательностей слов языка; 5) основные надежные признаки звуковых единиц, используемые для первичной грубой сегментации звукового сигнала; 6) метод определения ударных слогов
В процессе машинного индексирования индексные дескрипторы
В России первый эксперимент по машинному переводу прошел в
В России работы по созданию семейства систем ЭТАП начались в
В системах типа FAMT компьютер
В системах типа HAMT компьютер
В системах типа MAHT компьютер
Вес индексного термина - это
Визуальные средства информационного поиска - это
Вопросно-ответные системы - это
Выявление скрытых правил и закономерностей в наборах данных называется
Гипертекст - это
Гипертекстовая среда - это
Два основных направления разработки систем анализа речи - это: 1) распознавание ограниченного набора слов; 2) дикторозависимое распознавание; 3) дикторонезависимое распознавание; 4) декодирование языковой структуры речевого сигнала; 5) распознавание на основе математической модели распознавания образов
Две основные стратегии машинного перевода - это: 1) стратегия MAHT; 2) стратегия FAMT; 3) стратегия трансфера; 4) стратегия языка-посредника; 5) стратегия эксперимента; 6) стратегия коммерческой системы
Джорджтаунский эксперимент - это
Диалоговый компонент вопросно-ответной системы отвечает за
Для выполнения морфологического анализа на основе статистических алгоритмов необходимо иметь: 1) неразмеченный корпус текстов определенного размера; 2) размеченный корпус текстов, где каждому слову приписана грамматическая информация; 3) определенный набор продукционных правил морфологического анализа; 4) информацию о частоте встречаемости последовательностей лексико-грамматических классов
Значимые слова, которые действительно описывают содержание текста, лежат в ______________ части графика зависимости ранга слова от частоты
Идея гипертекста была предложена в ХХ веке
Идея самой возможности создания машинного перевода возникла в связи с тем, что
Из перечисленного: 1) база знаний; 2) модуль интеллектуальной обработки данных; 3) модуль ведения диалога; 4) модуль планирования дискурса; 5) модуль понимания высказываний; 6) модуль трансфера; 7) модуль генерации высказываний - базовыми компонентами диалоговой системы являются
Из перечисленного: 1) генерации смысла; 2) оформления смысла в предложение; 3) извлечения смысла; 4) интерпретации высказываний; 5) анализа высказываний; 6) формирования стратегии диалога - компонент генерации высказываний в вопросно-ответной (или диалоговой) системе в идеале должен решать задачи
Из перечисленного: 1) гипертекстовый протокол передачи; 2) база данных; 3) гипертекстовый язык разметки; 4) редактор просмотра; 5) сервер WWW; 6) информационная сеть; 7) язык Java - основными компонентами WWW являются
Из перечисленного: 1) идентифицировать и выделить слова в тексте; 2) обратиться к словарю за словарной информацией о слове; 3) определить значение слова; 4) разбить текст на синтаксические единицы - морфологический анализ нужен для того, чтобы
Из перечисленного: 1) информационно-поисковые системы; 2) системы машинного перевода; 3) системы обработки графической информации; 4) системы анализа запросов к базам данных; 5) вопросно-ответные системы; 6) операционные системы - морфологический и синтаксический анализ могут использоваться в
Из перечисленного: 1) конечность; 2) нелинейность; 3) однородность; 4) отсутствие автора в привычном смысле этого слова; 5) противопоставление автора и читателя; 6) субъективность; 7) творческое участие читателя - основные отличия гипертекста от обычного текста - это
Из перечисленного: 1) модуль обработки графической информации; 2) база знаний; 3) модуль текстового анализа; 4) модуль синтеза звучащей речи; 5) модуль поиска и сравнения; 6) модуль решения задач; 7) модуль аналитической обработки данных - архитектура систем полного понимания текста должна включать в себя
Из перечисленного: 1) повествовательные; 2) описательные; 3) критические; 4) информативные; 5) предписывающие; 6) сжатые - по своей функции выделяются следующие типы рефератов:
Из перечисленного: 1) понятия; 2) вероятностные характеристики понятий; 3) связи между ними; 4) веса понятий; 5) веса связей; 6) частоты понятий; 7) длина связей - основными характеристиками семантической сети при квантитативном анализе являются
Из перечисленного: 1) прогнозирование; 2) классификация; 3) анализ смысла текста; 4) кластеризация; 5) нахождение исключений; 6) поиск зависимостей; 7) сортировка данных - технология Data mining обычно используется для решения следующих задач
Из перечисленного: 1) система обеспечения безопасности; 2) диалоговая система; 3) приложения интеллектуальной обработки данных; 4) модуль управления отношениями с клиентом; 5) средства визуализации информационных массивов; 6) системы ERP; 7) модуль синтаксического анализа - корпоративный портал содержит следующие компоненты
Из перечисленного: 1) формирование высказываний; 2) понимание высказываний; 3) проверка правильности высказываний; 4) формирование краткого изложения; 5) интерпретация высказываний; 6) генерация высказываний - блок понимания вопросно-ответной системы имеет две основных функции
Из перечисленных уровней анализа: 1) дискурсивный; 2) синтаксический; 3) досинтаксический; 4) морфологический; 5) концептуальный; 6) фонологический; 7) семантический - в системах машинного перевода могут быть следующие
Информационная сеть состоит из двух основных компонентов: 1) абонентских систем; 2) центра управления; 3) территории, покрываемой сетью; 4) коммуникационной сети; 5) протокола передачи данных по сети
Информационное обеспечение системы МП - это
К источникам вариативности звуковых единиц относятся 1) коартикуляционные явления; 2) болезни органов слуха; 3) междикторская вариативность; 4) внутридикторская вариативность; 5) несовершенство современных анализаторов звучащей речи; 6) технические условия записи речи; 7) уровень технической оснащенности
Квантитативные модели тематического анализа текстов - это модели
Комплекс программных средств, предназначенных для организации единого информационного пространства внутри компании, называется
Компьютерные системы, позволяющие решать задачи, связанные с интеллектуальным анализом данных, называются
Компьютерный программный продукт, обеспечивающий ту часть редакционно-издательской деятельности, которая связана с подготовкой рукописей к печати, называется
Лингвистическая теория речеобразования в системах синтеза речи рассматривает
Лингвистическое обеспечение системы МП включает: 1) базу знаний; 2) словари; 3) блок дискурсивного анализа; 4) грамматики; 5) формализованные промежуточные представления единиц анализа; 6) эксперта в определенной предметной области; 7) услуги квалифицированного лингвиста
Логическое обеспечение системы МП - это
Машинный перевод в Интернете осуществляют: 1) система Systran; 2) все поисковые машины; 3) российские разработчики - компании ПРОМТ и Арсеналъ; 4) все поисковые службы и каталоги; 5) ВИНИТИ и ИППИ
Метод кластеризации применяется для
Метод составления выдержек основан на вычислении весовых коэффициентов для блоков текста, которое базируется на следующих факторах: 1) место данного фрагмента в тексте; 2) тема данного фрагмента; 3) наличие ключевых фразовых шаблонов; 4) концентрация ключевых слов; 5) лексическое значение ключевых слов; 6) наличие терминов в заголовке, колонтитуле и др.; 7) средняя длина предложения в данном фрагменте
Модель гипертекста основана на гипотезе о том, что
Модуль CRM - это
На визуальной тематической карте
На этапе акустического синтеза происходит
На этапе лингвистической обработки в процессе синтеза речи происходит: 1) проверка орфографии и пунктуации; 2) построение сегментно-фонетической транскрипции; 3) придание звучанию текста эмоциональной окраски; 4) нормализация текста; 5) полный семантико-синтаксический анализ текста; 6) просодическая параметризация текста; 7) приписывание интонационно-просодических характеристик сегментам текста
Набор рубрик для автоматической классификации может задаваться пользователем; каждая рубрика в этом случае описывается через: 1) набор ключевых слов; 2) определенную тематику; 3) краткий реферат; 4) обучающие эталонные документы; 5) иерархический каталог
Навигация - это
Наиболее доступным для обработки на компьютере видом информации является
Недостатки существующих систем автоматического реферирования связаны с тем, что они: 1) могут составлять реферат только из выдержек из исходного текста; 2) могут составлять реферат только с опорой на базу знаний; 3) могут работать только с текстами на русском языке; 4) не могут обрабатывать источники нетекстовой информации; 5) не могут делать реферат по нескольким источникам, передающим одну и ту же информацию; 6) могут совместно работать только с определенными операционными системами
Новая волна интереса к проблемам машинного перевода возникла в
Новые сферы применения автоматического реферирования - это: 1) многоязычные средства реферирования; 2) средства реферирования для языков с нестандартной графикой (иероглифы, слоговое письмо, арабское письмо и пр.); 3) реферирование с голоса; 4) реферирование неоднородно представленной информации; 5) реферирование на больших корпусах документов; 6) реферирование в Интернете
Обучение статистических систем, в процессе которого строятся акустико-фонетические и фонетические модели, происходит с помощью
Объект сети, участвующий в процессе, т. е. в ее работе, называется
Основной задачей синтаксического анализа является
Основной категорией потребителей систем МП сейчас является(-ются)
Основные направления развития электронной коммерции - это: 1) управление отношениями с клиентом; 2) интеграция сети отношений поставщиков и потребителей; 3) сближение виртуальной коммерции с реальной; 4) адаптация бизнес-процессов к Интернету; 5) сокращение персонала, работающего в сфере электронной коммерции; 6) создание корпоративных порталов; 7) увеличение сети электронных магазинов
Основные трудности в построении систем понимания текста машиной связаны с тем, что
Основные этапы автоматического порождения текста - это: 1) выбор нужной информации из базы знаний; 2) составление плана текста и выбор стиля; 3) выдача ответа на определенный запрос пользователя; 4) непосредственное порождение последовательности предложений; 5) изложение краткого содержания текста; 6) описание тематики текста через набор ключевых слов
Отражение всех аспектов содержания анализируемого текста описывается параметром
Оценка компьютерного реферата «изнутри» - это оценка: 1) того, насколько реферат отражает основные идеи оригинала; 2) связности реферата; 3) длины реферата; 4) того, насколько реферат полезен для определенных целей; 5) выразительности реферата; 6) стоимости реферата
Оценка реферата «извне» - это оценка: 1) того, насколько реферат отражает основные идеи оригинала; 2) связности реферата; 3) длины реферата; 4) того, насколько реферат полезен для определенных целей; 5) выразительности реферата; 6) стоимости реферата
Последовательность преобразований, применяемых к тексту на входном языке и превращающих его в текст на выходном языке, называется
Построение визуальных тематических карт складывается из двух основных этапов: 1) подготовка категорий смысловых единиц; 2) обращение к иерархическому представлению знаний в данной области; 3) автоматическое построение карты на основе частот категорий; 4) разбиение документов на классы в зависимости от содержания; 5) закраска экспертом областей карты в зависимости от количества документов по данной теме
Представление системы в виде связанных между собою блоков, отвечающих за определенные типы операций, называется
Преимущества языка-посредника: 1) возможность более формализованного представления входных предложений; 2) язык-посредник делает излишним трансфер и тем самым оптимизирует процедуру перевода; 3) сокращение числа пар языков, между которыми надо выполнять перевод; 4) это удобное средство хранения документов, которые надо представлять в многоязычной форме; 5) язык-посредник дает возможность представлять концептуальные структуры предметной области
При квантитативном анализе количественной характеристикой значимости темы в тексте является
При определении основы слова в английском языке в процессе морфологического анализа система должна: 1) попытаться отсечь у слова суффикс максимально возможной длины; 2) выделить в слове как можно больше суффиксов; 3) учитывать контекстные правила, запрещающие выделение суффиксов в некоторых словах; 4) учитывать правила орфографии для получения основы стандартного вида; 5) действовать только на основе базового правила
Примером информационно-аналитической системы может служить программный продукт, называющийся
Приписывание тексту набора ключевых слов, отражающих его содержание, называется
Причиной «замораживания» государственных программ машинного перевода в Европе и в Америке
Протокол - это
Процесс вербализации определенного содержания по законам определенного жанра, выполняемый на компьютере, называется
Разложение получаемой системой на вход информации на базовые составные элементы называется
Результатом индексирования является
Речевые технологии могут быть использованы для: 1) создания устройств устного ввода/вывода информации; 2) усовершенствования систем обработки письменного текста; 3) организации автоматических информационно-справочных служб, обрабатывающих устные запросы; 4) создания систем речевого управления техникой; 5) создания систем интеллектуальной обработки данных; 6) разработки приспособлений, помогающих инвалидам
Семантическая сеть - это
Сеть, предназначенная для хранения, обработки и передачи данных, называется
Синтаксический анализ нужен для решения следующих задач: разрешение морфологической омонимии; разрешение лексико-семантической омонимии; 1) выделение связных словосочетаний; 2) членение текста на слова; 3) определение значимости слов на основе синтаксических ролей; 4) выявление в предложении предикатно-аргументных отношений
Синтез - это
Синтезаторы «текст-речь»
Система ERP - это
Система машинного перевода имеет три основных составляющих: 1) лингвистическое обеспечение; 2) штат сотрудников; 3) математико-алгоритмическое обеспечение; 4) выходной язык; 5) программное обеспечение; 6) техническое обеспечение; 7) входной язык
Система, распознающая в потоке речи ее смысловые элементы, называется
Системы автоматической классификации могут: 1) классифицировать набор документов по определенным рубрикам; 2) приписывать рубрикам определенный набор ключевых слов; 3) выделять рубрики на основании анализа входного потока документов; 4) распределять документы на кластеры в зависимости от близости их содержания; 5) находить эталонные документы, представляющие ту или иную рубрику
Системы морфологического анализа призваны решать следующие задачи: 1) определение всех грамматических характеристик слова (часть речи, род, число, падеж, одушевленность, спряжение и т.п.); 2) определение словарных эквивалентов слова на другом языке; 3) получение всех грамматических форм слова; 4) построение дерева синтаксических зависимостей; 5) разрешение лексической неоднозначности; 6) приведение различных грамматических форм слова к словарной форме
Создание полноценного машинного перевода, не ограниченного определенной тематикой, затруднено
Составление компьютером реферата в форме краткого изложения возможно только при наличии
Существует два основных подхода к автоматическому аннотированию: 1) статистический; 2) физико-акустический; 3) динамический; 4) подход с опорой на знания; 5) генеративный; 6) редукционный
Существует два основных подхода к составлению краткого изложения: 1) манипуляции с синтактико-семантическим деревом; 2) генерация изложения статистическими методами; 3) составление риторической структуры текста; 4) составление краткого изложения из предварительно полученных выдержек; 5) составление концептуальной структуры текста
Существует два основных типа синтезаторов «текст-речь» 1) коартикуляционные; 2) формантные; 3) акустико-просодические; 4) конкатенативные; 5) параметрические
Существуют следующие основные подходы к декодированию языковой структуры речевого сообщения: 1) использование лингвистических знаний; 2) использование статистических методов; 3) использование физико-акустических методов; 4) сравнение с эталонными образцами
Текст, представленный в виде ассоциативно связанных блоков, называют
Технология, позволяющая реализовывать на компьютере организацию информации в виде ассоциативных связей между блоками информации, - называется
Трансфер - это
Трансфер имеет следующее лингвистическое обеспечение: 1) двуязычный словарь лексических замен; 2) одноязычный толковый словарь; 3) словарь соответствий грамматических структур; 4) тезаурус предметной области; 5) грамматическое описание выходного языка; 6) грамматическое описание входного языка; 7) база знаний
Требования к языку-посреднику: 1) он должен радикально отличаться от любого из существующих естественных языков; 2) он должен иметь все выразительные возможности естественного языка; 3) он должен иметь ограниченный словарь и грамматику; 4) перевод на него и с него должен осуществляться без потерь и искажений; 5) он не должен быть ограничен какой-либо предметной областью; 6) он должен быть таким, чтобы им легко мог овладеть человек
Трифон - это
Улучшение качества машинного перевода требует: 1) вовлечения в процесс перевода человека-переводчика; 2) развития возможностей самообучения машины в процессе взаимодействия с человеком; 3) использования базы знаний предметной области; 4) отказа от концепции трансфера и языка-посредника; 5) более совершенных компьютеров; 6) автоматизации процесса распознавания значения слова в зависимости от контекста; 7) повышения квалификации переводчиков
Установите правильную последовательность процесса порождения текста: 1) модуль организации дискурса разбивает информацию на предложения в соответствии с инструкциями; 2) в зависимости от назначения текста берутся фрагменты информации из базы данных или знаний; 3) модуль порождения предложений организует абзацы и предложения внутри них в соответствии с определенными правилами; 4) модуль решения задач формирует план и стиль текста, а также инструкции по организации информации в соответствии с планом и стилем; 5) получение выходного текста
Установите соответствия
Установите соответствия
Установите соответствия
Установите соответствия
Установите соответствия
Установите соответствия
Установите соответствия:
Установите соответствия:
Устройства, предназначенные для преобразования кодовой последовательности, поступающей с компьютера, в непрерывный речевой сигнал, называются
Фонетические модели в статистических системах распознавания речи задают ограничения на
Формализованное промежуточное представление предложения - это
Формальной датой начала эры машинного перевода считается
Формула wij = tfij log(N/dfj) приписывания веса индексным терминам учитывает: 1) частоту слова в документе; 2) ранг слова; 3) вероятность встретить слово в документе; 4) количество документов в базе, содержащих данное слово; 5) количество индексных терминов; 6) входит ли слово в стоп-список
Формула, соответствующая первому закону Ципфа, - это
Функционально-ориентированное хранилище данных, предназначенное для решения аналитических задач отдельных подразделений, называется
Хранилища данных - это
Целью построения корпоративных хранилищ данных является
Электронная коммерция определяется как
Язык-посредник - это