Publication: Принципи та архітектури LLM для парсингу даних
| dc.contributor.author | Флегантов, Леонід Олексійович | |
| dc.contributor.author | Левченко Юрій Іванович | |
| dc.date.issued | 2025 | |
| dc.description | Флегантов Л., Левченко Ю. Принципи та архітектури LLM для парсингу даних // The Future of Science, Technology and Economy : збірник наукових праць з матеріалами 3-ї Міжнар. наук.-практ. конф. (29–31 жовтня 2025 р.). Софія, Болгарія : International Scientific Unity, 2025. С. 164–168. DOI: 10.70286/ISU-29.10.2025. | |
| dc.description.abstract | Розглянуто принципи побудови та архітектурні особливості великих мовних моделей (Large Language Models, LLM), що застосовуються для автоматизованого парсингу даних. Проаналізовано обмеження традиційних детермінованих методів парсингу та обґрунтовано переваги використання LLM для семантичного аналізу й структурованого вилучення інформації з неструктурованих і напівструктурованих джерел. Розглянуто трансформерну архітектуру як основу сучасних LLM, зокрема механізм self-attention, позиційне кодування та генеративний підхід до формування результатів. Проведено порівняльний аналіз моделей BERT, GPT, T5 та LLaMA з точки зору їх придатності до задач парсингу даних, виділення сутностей і генерації структурованих форматів (JSON, XML, SQL). Показано, що генеративні моделі типу GPT і LLaMA є найбільш перспективними для автоматизованого парсингу завдяки підтримці few-shot та zero-shot навчання і високій контекстуальній чутливості. Зроблено висновок про доцільність використання LLM як універсального інструменту структуризації даних у сучасних інформаційних системах. | |
| dc.identifier.citation | Флегантов Л., Левченко Ю. Принципи та архітектури LLM для парсингу даних // The Future of Science, Technology and Economy : збірник наукових праць з матеріалами 3-ї Міжнар. наук.-практ. конф. (29–31 жовтня 2025 р.). Софія, Болгарія : International Scientific Unity, 2025. С. 164–168. DOI: 10.70286/ISU-29.10.2025. | |
| dc.identifier.other | DOI: 10.70286/ISU-29.10.2025 | |
| dc.identifier.uri | https://dspace.pdau.edu.ua/handle/123456789/20005 | |
| dc.language.iso | uk | |
| dc.publisher | Софія, Болгарія : International Scientific Unity | |
| dc.subject | великі мовні моделі | |
| dc.subject | парсинг даних | |
| dc.subject | трансформерна архітектура | |
| dc.subject | семантичний аналіз | |
| dc.subject | GPT | |
| dc.subject | BERT | |
| dc.subject | LLaMA | |
| dc.title | Принципи та архітектури LLM для парсингу даних | |
| dc.type | Thesis | |
| dspace.entity.type | Publication |
Files
Original bundle
1 - 1 of 1
Loading...
- Name:
- Тези_3_Флегантов_Левченко_Sofia_Bulgaria_29.10.25.pdf
- Size:
- 474.57 KB
- Format:
- Adobe Portable Document Format
License bundle
1 - 1 of 1
No Thumbnail Available
- Name:
- license.txt
- Size:
- 17.09 KB
- Format:
- Item-specific license agreed upon to submission
- Description: