Дослідження ефективності парсингу даних з використанням великих мовних моделей
Дата
2025
Автори
Левченко Юрій Іванович
Флегантов, Леонід Олексійович
Назва журналу
Номер ISSN
Назва тому
Видавець
Полтавський державний аграрний університет (ПДАУ)
Анотація
Робота присвячена вирішенню актуальної задачі підвищення ефективності парсингу неструктурованих та слабкоструктурованих даних із використанням великих мовних моделей. Досліджено теоретичні основи семантичного парсингу та обґрунтовано доцільність застосування LLM як універсального інструменту аналізу текстових даних. Робота складається з трьох розділів, що охоплюють теоретико-методологічні аспекти, аналітичний огляд існуючих методів та експериментальне дослідження з формуванням практичних рекомендацій. У першому розділі розглянуто концепцію семантичного парсингу, принципи побудови та архітектурні особливості LLM, методи оцінювання їх якості та підходи до навчання і донавчання моделей для задач парсингу. Другий розділ присвячено аналізу традиційних методів парсингу та порівнянню їх можливостей із підходами на основі LLM, а також дослідженню гібридних архітектур і шляхів їх оптимізації. У третьому розділі наведено методику та результати порівняльного експерименту, виконано оцінювання ефективності базових і донавчених LLM у реальних сценаріях парсингу, сформульовано практичні рекомендації та виконано техніко-економічне обґрунтування доцільності застосування запропонованих рішень. Результати дослідження мають практичну цінність для розробників інформаційних систем та аналітичних платформ, забезпечуючи підвищення точності, гнучкості та економічної ефективності процесів парсингу даних.
Опис
Левченко Ю.І. Дослідження ефективності парсингу даних з використанням великих мовних моделей : кваліфікаційна робота на здобуття ступеня вищої освіти Магістр за ОПП Інформаційні управляючі системи та технології 126 Інформаційні системи та технології. Полтава: Полтавський державний аграрний університет. 2025. 89 с.
Ключові слова
парсинг даних, великі мовні моделі, LLM, семантичний парсинг, гібридні методи, донавчання моделей, обробка природної мови, оптимізація
Бібліографічний опис
Левченко Ю.І. Дослідження ефективності парсингу даних з використанням великих мовних моделей : кваліфікаційна робота на здобуття ступеня вищої освіти Магістр за ОПП Інформаційні управляючі системи та технології 126 Інформаційні системи та технології. Полтава: Полтавський державний аграрний університет. 2025. 89 с.