В статье представлено исследование, посвящённое созданию
эмоционального лексикона узбекского языка с учётом его культурно-языковых особенностей. Эмоциональная лексика узбекского языка отражает сложное взаимодействие между языком, национальной идентичностью и коллективным эмоциональным опытом. Цель исследования – разработать культурно чувствительный
подход к идентификации и классификации эмоциональных выражений в узбекском языке в различных коммуникативных контекстах. В работе анализируются как традиционные источники (фольклор, пословицы, классическая литература), так и современные
дискурсивные практики (СМИ, интернет-форумы, социальные сети). Особое внимание уделяется диалектным вариантам и культурно обусловленным коннотациям, например, двойному значению слов «achchiq» (горький вкус и горечь как эмоция) и « suyanmoq»
(опора физическая и надежда эмоциональная). Методология исследования включает три компонента: корпусную лингвистику, социолингвистические опросы и автоматизированный анализ тональности на базе ИИ. Такой подход обеспечивает эмпирическую обоснованность и культурную глубину. В результате предлагается
прототип узбекского эмоционального лексикона, учитывающий эмоциональную полярность, интенсивность и контекстуальное употребление. Практическая значимость проекта связана с улучшением взаимодействия человек – компьютер (например, чат-
боты), совершенствованием средств преподавания языка и поддержкой исследований в области социолингвистики и аффективных вычислений. Исследование вносит вклад в развитие тюркской аффективной лингвистики и подчёркивает важность интеграции
культурной семантики в вычислительные модели.
В данной статье проводится сравнительный анализ методов машинного обучения (SVM), глубокого обучения (LSTM) и трансформерных моделей (BERT) для классификации тональности узбекских текстов с использованием распознавания именованных сущностей (NER). Исследование направлено на решение проблемы точного определения эмоциональной окраски в морфологически сложных языках с ограниченными ресурсами, на примере узбекского – тюркского языка с агглютинативной структурой. Для экспериментов использован датасет из 10 000 пользовательских комментариев из социальных сетей, аннотированных вручную (тональность: положительная, отрицательная,
нейтральная) и автоматически (NER через CRF-модель для идентификации брендов, локаций и публичных лиц). Интеграция NER позволила устранить контекстуальные неоднозначности, например, разграничение предложений: «Обожаю историю Самарканда» (положительный оттенок) и «Пробки в Самарканде невыносимы» (отрицательный). Результаты показали, что BERT, дообученный на узбекских текстах, достиг наивысшей точности (90.2%) благодаря контекстуализированным эмбеддингам, связывающим сущности с тональностью. LSTM продемонстрировал конкурентоспособную точность (85.1%) в анализе последовательностей, но требовал больших объёмов данных. SVM, несмотря на вычислительную эффективность, показал скромные результаты (78.3%) из-за неспособности учитывать лингвистические нюансы. Исследование подчеркивает важность NER для низкоресурсных языков в устранении неоднозначности и предлагает рекомендации по внедрению BERT в прикладные задачи (например, анализ отзывов). Обсуждаются ограничения, включая недостаток данных и высокие вычислительные затраты, что определяет направления будущих исследований для оптимизации моделей под узбекский язык.
Актуальность задачи интегрированного управления качеством данных возрастает в условиях увеличения объемов, разнообразия и критичности используемых данных. Несмотря на это, в организациях есть пробелы в понимании взаимосвязей между качеством данных, качеством процессов и информационных систем. Целью настоящего исследования является систематический анализ существующих методологий и концепций управления качеством данных, а также выявление ключевых проблем при их внедрении. В работе проведен обзор научных источников, представлены стандартные элементы и схема интегрированного подхода к качеству данных. На основе архитектуры Data Lakehouse разработана высокоуровневая схема потоков данных, отражающая взаимодействие компонентов системы. Обоснована необходимость разработки новых методов и алгоритмов для оптимизации качества больших данных, выходящих за рамки традиционных парадигм, ориентированных на структурированные данные. Определены и систематизированы ключевые проблемы, часто игнорируемые на практике, и сформированы критерии для успешного внедрения интегрированного подхода к управлению качеством данных.
Рассматривается задача исследования плоского напряжённого состояния методом фотоупругости. Методика основывается на решении уравнений равновесия. Граничные условия для них задаются, исходя из зарегистрированной интерференционной картины. На неё накладывается равномерная сетка. Для каждого узла определяется
порядок интерференционной полосы, которой он принадлежит. К настоящему времени проблема автоматизации этой процедуры не решена в полном объёме. Для её решения разработан и программно реализован алгоритм, устанавливающий принадлежность узла полосе по расцветке окружающей его области. В основе алгоритма лежит проверка статистической гипотезы о принадлежности выборки заданному распределению по критерию Пирсона. Для этого количественно сравниваются гистограммы яркости во всех трёх цветовых каналах полосы каждого порядка с соответствующими гистограммами, построенными для области в окрестности рассматриваемого узла. Применение метода к данным, снятым на установке ППУ-7, показало его эффективность. В частности, для интерференционных картин от простых объектов (диск, пластинка) были получены следующие результаты. Из 210-ти точек (узлов прямоугольной сетки), для которых определялась принадлежность интерференционной полосе, было правильно классифицировано примерно 95%. Более того, в некоторых случаях неправильно классифицированных пикселей не было вовсе. Пиксели, не классифицированные по причине того, что были отклонены гипотезы о соответствии цветности их окрестности цветовой гамме какой-либо из полос, составили 5–10%.
Данная работа является частью цикла статей, отражающих модель АТМО (анализа территориальных мультисекторных объектов). Здесь раннее описанные продуктовый и финансовый компоненты этой модели, реализующие Леонтьевскую схему «затраты–выпуск», дополняются моделью торгового баланса. Она комплексно отображает для каждого сектора региона доли поставок выпускаемой продукции и транзитного импорта в определенной территориальной системе. Данные поставки поддерживаются имеющимися резервами продукции. Далее указанные товарные потоки балансируются поставками в другие, не входящие в эту систему регионы и экспортом зарубеж.Особенностью модели является то, что в ней одновременно учитываются встречные потоки собственной и зарубежной продукции в моделируемый регион со стороны рассматриваемого кластера, образуя при этом показатель ввоза в него. Эта величина используется в блоке продукционного баланса, также входящего в модель АТМО, замыкая тем самым комплекс блоков, в неё входящий. В блоке торгового баланса товарные потоки в другие регионы определяются коэффициентами поставок (транзита), в соответствии с которыми распределяется вывоз (импорт) из конкретного региона в кластер регионов для отдельно взятого сектора. Они построены как доли распределения поставок продукции регионального и иностранного производства по регионам соответствующего кластера, базирующиеся на ретроспективном анализе подобных поставок в прошлом. Построены выражения для отражения связи вложений в транспортную инфраструктуру и затрат на межрегиональные поставки с товаров и оборудования. Целевые показатели данного блока определяют развитие системы регионов, направленное на увеличение экспорта продукции, производимой в регионах.Он же, в свою очередь, опирается на условия промышленного роста, обеспечиваемые за счет все более возрастающей потребности в поставках продукции за пределы каждого региона и на экспорт.
В статье представлено исследование погрешностей бесконтактного
измерения разновысотности головок тепловыделяющих сборок методом параллакс-сдвига при дуговой траектории перемещения телевизионной камеры. Рассмотрены основные источники ошибок: радиационные и шумовые искажения видеопотока,неточности выделения контуров, субпиксельные отклонения центров окружностей,
геометрические погрешности движения перемещения камеры и вариации её углового положения. Построена модель влияния этих факторов на результирующую точность определения высоты головок. Проведена оценка чувствительности высотных измерений к ключевым параметрам системы. Показано, что метод параллакс-сдвига сохраняет метрологическую надёжность при типовых эксплуатационных отклонениях, характерных для условий АЭС.
В условиях роста сложности информационных систем и требований к
обеспечению информационной безопасности возникает необходимость не только в сборе и анализе мониторинговых данных, но и в гарантированной неизменности этих данных во времени. Традиционные системы мониторинга не обеспечивают защиту от несанкционированных изменений истории метрик, что ограничивает их применение в контексте, требующего прозрачного аудита. В данной работе предлагается решить эту проблему за счет технологии блокчейн. Предложенный метод предполагает ежедневную выборку ключевых метрик мониторинга за прошедшие сутки с последующим хэшированием агрегированных данных. Полученный хэш передаётся в смарт-контракт, развёрнутый в публичном блокчейне Ethereum, где сохраняется вместе с меткой времени. Для верификации реализован программный модуль, повторно извлекающий данные из системы мониторинга и сравнивающий их хэш с зафиксированным в блокчейне значением. В ходе реализации прототипа была достигнута полная автоматизация процесса фиксации и последующей проверки агрегированных метрик. Верификация успешно определяет случаи подмены данных путём сравнения хэшей. Предложенный метод не исключает возможности фиксации подменённых данных в случае
компрометации доверенной стороны, однако обеспечивает прозрачную и неизменяемую историю фиксаций, позволяя выявлять нарушения ретроспективно. Преимуществом является независимость от внутренней инфраструктуры организации и возможность верификации с использованием открытых инструментов.
















