Анализ дел велся в 3 шага.
Шаг 1. Прямой запрос
Первичное извлечение ключевых данных из документов.
Я загрузил первую партию документов и дал простую, прямую команду на естественном языке: «Выбери пжл номер протокола, фамилию иностранного гражданина, данные разрешения на работу, фабулы нарушения с датами»*
Шаг 2. Контекстный запрос
Масштабирование: однотипные действия по всем новым файлам.
Для следующих пакетов документов я не повторял длинную инструкцию, а использовал контекст нашего диалога: «Сделай так же по этим»*
Шаг 3. Запрос на форматирование
Финальное структурирование: формирование Excel-таблицы с нужными колонками (номер протокола, ФИО, год рождения, номер и срок разрешения, дата подачи заявления и др.).
Когда все данные были извлечены в виде текстовых сводок, я дал финальную команду для приведения их к удобному формату: «Создай таблицу в эксель в 1 графе №протокола, во 2 графе фамилия иностранного гражданина, в 3 графе год рождения, в 4 графе №разрешения, в 5 графе срок разрешения, в 6 графе пропажа…, в 7 графе дата подачи заявления в УМВД»*
*Авторская стилистика запросов сохранена