Publication:
Принципи та архітектури LLM для парсингу даних

dc.contributor.authorФлегантов, Леонід Олексійович
dc.contributor.authorЛевченко Юрій Іванович
dc.date.issued2025
dc.descriptionФлегантов Л., Левченко Ю. Принципи та архітектури LLM для парсингу даних // The Future of Science, Technology and Economy : збірник наукових праць з матеріалами 3-ї Міжнар. наук.-практ. конф. (29–31 жовтня 2025 р.). Софія, Болгарія : International Scientific Unity, 2025. С. 164–168. DOI: 10.70286/ISU-29.10.2025.
dc.description.abstractРозглянуто принципи побудови та архітектурні особливості великих мовних моделей (Large Language Models, LLM), що застосовуються для автоматизованого парсингу даних. Проаналізовано обмеження традиційних детермінованих методів парсингу та обґрунтовано переваги використання LLM для семантичного аналізу й структурованого вилучення інформації з неструктурованих і напівструктурованих джерел. Розглянуто трансформерну архітектуру як основу сучасних LLM, зокрема механізм self-attention, позиційне кодування та генеративний підхід до формування результатів. Проведено порівняльний аналіз моделей BERT, GPT, T5 та LLaMA з точки зору їх придатності до задач парсингу даних, виділення сутностей і генерації структурованих форматів (JSON, XML, SQL). Показано, що генеративні моделі типу GPT і LLaMA є найбільш перспективними для автоматизованого парсингу завдяки підтримці few-shot та zero-shot навчання і високій контекстуальній чутливості. Зроблено висновок про доцільність використання LLM як універсального інструменту структуризації даних у сучасних інформаційних системах.
dc.identifier.citationФлегантов Л., Левченко Ю. Принципи та архітектури LLM для парсингу даних // The Future of Science, Technology and Economy : збірник наукових праць з матеріалами 3-ї Міжнар. наук.-практ. конф. (29–31 жовтня 2025 р.). Софія, Болгарія : International Scientific Unity, 2025. С. 164–168. DOI: 10.70286/ISU-29.10.2025.
dc.identifier.otherDOI: 10.70286/ISU-29.10.2025
dc.identifier.urihttps://dspace.pdau.edu.ua/handle/123456789/20005
dc.language.isouk
dc.publisherСофія, Болгарія : International Scientific Unity
dc.subjectвеликі мовні моделі
dc.subjectпарсинг даних
dc.subjectтрансформерна архітектура
dc.subjectсемантичний аналіз
dc.subjectGPT
dc.subjectBERT
dc.subjectLLaMA
dc.titleПринципи та архітектури LLM для парсингу даних
dc.typeThesis
dspace.entity.typePublication
Files
Original bundle
Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
Тези_3_Флегантов_Левченко_Sofia_Bulgaria_29.10.25.pdf
Size:
474.57 KB
Format:
Adobe Portable Document Format
License bundle
Now showing 1 - 1 of 1
No Thumbnail Available
Name:
license.txt
Size:
17.09 KB
Format:
Item-specific license agreed upon to submission
Description: