Preview

Вестник СибГУТИ

Расширенный поиск

Решение задачи классификации слухов в интернет-новостях

https://doi.org/10.55648/1998-6920-2025-19-3-122-138

Аннотация

Рассматривается подход к решению задачи классификации слухов в новостях на основе продукционных правил. Непроверенная информация, появляющаяся на новостных сайтах, имеет характер информационного мусора и способна в отдельных случаях нанести существенный вред потребителям. Решаемая задача носит нетривиальный характер, актуальна и не имеет стандартного решения.

Об авторах

Александр Дмитриевич Худобин
Воронежский государственный университет
Россия

Студент 2 курса магистратуры Воронежского государственного университета, факультет — Прикладной математики, информатики и механики, направление — прикладная информатика



Ирина Евгеньевна Воронина
Воронежский государственный университет
Россия

д-р. техн. наук, доц., профессор кафедры программного обеспечения и администрирования информационных систем Воронежского государственного университета



Список литературы

1. Лингвистическая экспертиза в трудах Воронежской ассоциации экспертов-лингвистов : монография / Ж. В. Грачева [и др.] ; под ред. М. Е. Новичихиной, А. В. Рудаковой. – Воронеж : Издательский дом ВГУ, 2023. – 357 с.

2. Худобин А. Д. TF-IDF, Bag-of-words, Word2Vec и N-граммы для решения задачи классификации слухов в новостях / А. Д. Худобин, И. Е. Воронина // Информатика: проблемы, методы, технологии. – 2024. – С. 1285–1294.

3. Осетрова Е. В. Слухи в парадигме лингвистической генристики / Е. В. Осетрова // Жанры речи. – 2015. – Т. 12, № 2. – С. 80–89.

4. Osetrova E. V. Rumours as a Subject of Scientific Analysis: Social Psychology, History, Philology / E. V. Osetrova // Journal of Siberian Federal University. Humanities & Social Sciences. – 2013. – № 9. – С. 1265–1280.

5. Русакова И. Б. Концепт слух и его репрезентация в русских и английских пословицах / И. Б. Русакова // Международный аспирантский вестник. Русский язык за рубежом. – 2024. – № 1. – С. 60–67.

6. Иванова С. В. Жанр светских слухов в дискурсе англоязычных массмедиа / С. В. Иванова, Г. Ш Хакимова // Russian Journal of Linguistics. – 2020. – Т. 24, № 2. – С. 386–418.

7. Khakimova G. Rumour Text Constructing Techniques In Media Discourse: Case Study Of Gossip Columns / The European Proceedings of Social and Behavioural Sciences. – 2019. – С. 346–357.

8. Хакимова Г. Ш. Концепт «слух» в фокусе лексикографического анализа. Часть 1 / Г. Ш. Хакимова // Вестник ЮУрГУ. Серия «Лингвистика». – 2016. – № 2. – С. 29–36.

9. Хакимова Г. Ш. Концепт «слух» в фокусе лексикографического анализа. Часть 2 / Г. Ш. Хакимова // Вестник ЮУрГУ. Серия «Лингвистика». – 2016. – № 3. – С. 38–46.

10. Li X. Dice Loss for Data-imbalanced NLP Tasks / X. Li [и др.] // Proceedings of the 58th Annual Meeting of the Association for Computational Linguistics. – 2020. – С. 465–476.

11. Duncan J. The Sensitivity of Word Embeddings-based Author Detection Models to Semantic-preserving Adversarial Perturbations / J. Duncan [и др.] // arXiv preprint arXiv:2102.11917. – 2021. – 22 с.

12. Хобсон Л. Обработка естественного языка в действии / Л. Хобсон, Х. Хапке, К. Ховард. – СПб.: Питер, 2020. – 576 с.

13. Mohare R. V. ‘Bag of Words’ to ‘Bag of Concepts’: Improving Text Categorization using SVM / R. V. Mohare [и др.] // Nanotechnology Perceptions. – 2024. – № S6. – С. 419–426.

14. Suhasini V. A Hybrid TF-IDF and N-Grams Based Feature Extraction Approach for Accurate Detection of Fake News on Twitter Data / V. Suhasini, Dr. N. Vimala // Turkish Journal of Computer and Mathematics Education. – 2021. – vol. 12, no. 06. – С. 5710–5723.

15. Cahyani D. E. Performance comparison of TF-IDF and Word2Vec models for emotion text classification / D. E. Cahyani, I. Patasik // Bulletin of Electrical Engineering and Informatics. – 2021. – № 5 – С. 2780–2788.

16. Abubakar H. D. Sentiment Classification: Review of Text Vectorization Methods: Bag of Words, Tf-Idf, Word2vec and Doc2vec / H. D. Abubakar, M. Umar, M. A. Bakale // Sule Lamido University Journal of Science & Technology. – 2022. – № 1 & 2. – С. 27–33.

17. Линькова Г. В. Сравнение методов векторных представлений текстов в задачах классификации вакансий / Г. В. Линькова, Д. С. Ботов // Научное сообщество студентов XXI столетия. Технические науки. – 2018. – № 6 – С. 96–113.

18. Santos R. F. Long Term-short Memory Neural Networks and Word2vec for Self-admitted Technical Debt Detection / R. F. Santos [и др.] // Proceedings of the 22nd International Conference on Enterprise Information Systems. – 2020. – С. 157–165.

19. Devlin J. BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding / J. Devlin [и др.] // Proceedings of NAACL-HLT. – 2019. С. 4171–4186.

20. Wang L. Multilingual E5 Text Embeddings: A Technical Report / L. Wang [и др.] // arXiv pre-print arXiv:2402.05672. – 2024. – 6 с.

21. Bi X. DeepSeek LLM: Scaling Open-Source Language Models with Longtermism / X. Bi [и др.] // arXiv preprint arXiv:2401.02954. – 2024. – 48 с.


Рецензия

Для цитирования:


Худобин А.Д., Воронина И.Е. Решение задачи классификации слухов в интернет-новостях. Вестник СибГУТИ. 2025;19(3):122-138. https://doi.org/10.55648/1998-6920-2025-19-3-122-138

For citation:


Khudobin A.D., Voronina I.E. Solving the problem of rumors classification in online news. The Herald of the Siberian State University of Telecommunications and Information Science. 2025;19(3):122-138. (In Russ.) https://doi.org/10.55648/1998-6920-2025-19-3-122-138

Просмотров: 0


Creative Commons License
Контент доступен под лицензией Creative Commons Attribution 4.0 License.


ISSN 1998-6920 (Print)