Выпуск № 4 (2023)
Системный анализ, управление и обработка информации
Аннотация: В статье изложены примеры современных больших лингвистических моделей для реализации человекомашинного интерфейса на естественном языке. Рассмотрены возможные решения, а также проблемы
реализации человеко-машинного интерфейса c интеллектуальным роботом. Предложены алгоритмы
реализации человеко-машинного интерфейса с интеллектуальным роботом на естественном языке.
Ключевые слова: ChatGPT, GPT-3, GigaChatPro, YandexGPT, человеко-машинный интерфейс, интеллектуальные
роботы, генеративный искусственный интеллект, автономная робототехника.
Номера страниц: 4-12.
Аннотация: Рассматривается задача поиска подходов к созданию наборов данных на основе признаков, извлекаемых
из временных рядов, регистрируемых при работе с 14-канальным нейроинтерфейсом EMOTIV EPOC+ в
процессе формирования независимыми субъектами моторных образов по управлению курсором мыши
компьютера. Целью работы является исследование ряда показателей, значения которых вычисляются
посредством выполнения тех или иных математических операций над различными фрагментами 14
временных рядов, в качестве инструментов для формирования значений признаков. Исследование
должно помочь выявить те показатели, использование которых для формирования признаков в наборах
данных обеспечивает разработку классификаторов моторных образов, отличающихся максимально
возможным качеством классификации данных. Предварительно временные ряды подвергались
фильтрации с применением фильтра Баттерворта 5-го порядка, что позволило решить проблему
удаления шумовых артефактов из временных рядов. Для оценки влияния длины фрагмента временного
ряда, используемого при формировании значения признака на основе того или иного показателя, на
итоговое качество классификации данных были рассмотрены интервалы времени (таймфреймы)
размером в 1, 2 и 3 секунды. В ходе исследований была выполнена разработка SVM (Support Vector
Machine), RF (Random Forest) и MLP (Multi Layer Perceptrone) классификаторов моторных образов.
Результаты экспериментов показали целесообразность работы показателями, вычисляемыми на основе
энтропии Шеннона и фрактальной размерности Хигучи при таймфрейме размером в 3 секунды. В этом
случае удается обеспечить высокое качество классификации моторных образов, оцениваемое с
применением F-меры. В частности, максимальные значения F-меры имеют SVM, RF и MLP
классификаторы разработанные на основе наборов данных, признаки в которых вычислены с
применением энтропии Шеннона. Эти значения F-меры равны соответственно 0.82, 0.88 и 0.73.
Ключевые слова: нейроинтерфейс, электроэнцефалография, моторный образ, временные ряды, извлечения
признаков, машинное обучение
Номера страниц: 13-24.
Аннотация: В статье представлен метод сегментации облака точек сцены, состоящей из неизвестных объектов, на
основе использования метода сегментации Voxel Cloud Connectivity Segmentation (VCCS) и двухэтапной
обработки векторов признаков с применением нейронной сети PointNet и динамической графовой
сверточной нейронной сети (Dynamic Graph Convolutional Neural Network, DGCNN). В ряде случаев
практическое применение манипуляционных роботов сопряжено с захватом объектов, форма, цвет и
другие признаки которых не известны заранее. В частности, примерами таких задач могут служить
уборка помещения, аварийно-спасательные операции по разбору завалов, работа в складских
помещениях или в почтовых отделениях. В предлагаемом подходе по набору изображений
загроможденной сцены, получаемому с RGBD-камер, составляется образ сцены в виде облака точек,
затем данное облако точек подвергается обработке с помощью эвристического алгоритма VCCS и
методов машинного обучения. Результатом работы подхода является сегментированное облако точек,
для каждой точки которого имеется метка, определяющая ее принадлежность к отдельному объекту
сцены. Новизна подхода заключается в совмещении эвристического алгоритма VCCS и новой
архитектуры нейронной сети, представляющей собой комбинацию модифицированных сетей PointNet и
DGCNN. Проведенные экспериментальные исследования подтверждают работоспособность
предлагаемого решения.
Ключевые слова: машинное обучение, сегментация облака точек, графовая нейронная сеть, сегментация
неизвестных объектов, супервоксели, VCCS, PointNet, DGCNN
Номера страниц: 25-35.
Аннотация: В данной статье предлагается новый подход к решению задачи кластеризации с отсечением выбросов,
неинформативных аномальных данных и прочего информационного шума для потоковых данных в
пространстве признаков любой размерности и с памятью всех обработанных точек данных. Для
реализации поставленной задачи была разработана оригинальная модификация алгоритма DBSCAN,
использующая гибридный подход к поиску границ кластеров произвольной формы и определению,
находится ли каждая из точек данных внутри или снаружи такой границы. При разработке были
применены как технологии машинного обучения, так и математические методы, в частности метод
вычисления выпуклой оболочки конечного набора точек в n-мерном пространстве Quickhull.
Результирующий алгоритм состоит из нескольких блоков, активирующихся в зависимости от природы
распределения данных полученных из входного потока. Применение разработанного алгоритма
гарантирует создание замкнутой границы кластера произвольной формы. Использование механизма
адаптивного разбиения на фреймы, позволяет проводить кластеризацию данных разной размерности и
больших объемов, с памятью всех входящих точек. В результате авторам удалось создать модификацию
алгоритма DBSCAN для потоковых данных эффективного по скорости выполнения и используемой
памяти. Для иллюстрации прироста эффективности разработанной модификации алгоритма по
сравнению с классическим вариантом DBSCAN проведена расчетная оценка производительности и
требований к памяти. Правильность полученных оценок подтверждена экспериментально.
Представленная модификация алгоритма DBSCAN для потоковых данных не только, позволяет
получить общий прирост производительности при более низких требованиях к памяти по сравнению с
классическим алгоритмом DBSCAN, но и имеет функциональные преимущества, связанные с
возможностью эффективной работы с потоковыми данными при наличии информационного шума.
Указанные преимущества делают представленную модификацию алгоритма DBSCAN полезной для
решения сложных задач в системах обработки потоковых данных как, например, поиск корреляций и
аномалий в статистических показателях распределенных систем сбора данных или для обнаружения
устойчивых состояний моделей массового обслуживания, применяемых в логистике и на транспорте.
Ключевые слова: машинное обучение, обучение без учителя, гибридный алгоритм, кластеризация, алгоритм
DBSCAN, потоковые данные, алгоритм вычисления выпуклой оболочки, плотность распределения данных,
границы кластера, адаптивные фреймы данных, отсечение информационного шума, оценка
производительности
Номера страниц: 36-57.
Аннотация: В статье описывается создание модели прогнозирования успеваемости студентов на основе анализа
данных о результатах измерительных материалов и посещаемости занятий. В ходе исследования были
использованы методы корреляционного анализа и машинного обучения, в результате чего была выбрана
модель линейного дискриминантного анализа (LDA), показавшая хорошие результаты. Разработанная
модель может помочь улучшить качество образования, а также может быть адаптирована для применения
в других областях прогнозирования на основе множественных переменных.
Ключевые слова: прогнозирование, корреляционный анализ, машинное обучение, линейный дискриминантный
анализ, образовательный процесс
Номера страниц: 68-72.
Методы и системы защиты информации
Аннотация: Показана актуальность необходимости разработки моделей и методов исследования хакерских кибератак
как облачных систем класса IaaS, используемых внешне для вполне легальных целей. По результатам
проведённого анализа структуры хакерских кибератак, моделей расчётного обоснования ресурсного
обеспечения и развёртывания как IaaS, так и сервисов IaaS постановлена и формализована научная
задача оценки числа виртуальных соединений IaaS в интересах мониторинга идентификации хакерских
кибератак. По результатам решения задачи получена новая оптимизационная модель системы
"источники информации различных категорий контента – фрагмент IaaS" . Развит метод покрывающих
областей, для расчёта общего количества виртуальных соединений IaaS. Полученные научные результаты
могут быть положены в основу автоматизации расчётного обоснования многовариантных проектных
решений IaaS на предпроектной стадии.
Ключевые слова: модель, облачные вычисления, IaaS, Система уравнений, подход, неравенство, показатель,
метод, сходимость, невырожденность, оптимизация, бот-кибератака, мониторинг, облачный кластер
Номера страниц: 58-67.
Архив выпусков
№ 3
2024
№ 2
2024
№ 1
2024
№ 4
2023
№ 3
2023
№ 2
2023
№ 1
2023
№ 4
2022
№ 3
2022
№ 2
2022
№ 1
2022
№ 4
2021
№ 3
2021
№ 2
2021
№ 1
2021
№ 4
2020
№ 3
2020
№ 2
2020
№ 1
2020
№ 4
2019
№ 3
2019
№ 2
2019
№ 1
2019
№ 4
2018
№ 3
2018
№ 2
2018
№ 1
2018
№ 4
2017
№ 3
2017
№ 2
2017
№ 1
2017
№ 4
2016
№ 3
2016
№ 2
2016
№ 1
2016
№ 4
2015
№ 3
2015
№ 2
2015
№ 1
2015
№ 3
2014