Автоматизация этой задачи позволяет превратить разрозненные PDF-файлы в структурированную базу данных для принятия решений. Ключ к успеху здесь — использование Gemini API (через Google Apps Script) для извлечения данных и их прямой отправки в Google Sheets.
Ниже приведена пошаговая архитектура системы, которая поможет вам это реализовать.
Архитектура системы
Для настройки вам не нужно быть профессиональным программистом, но потребуется базовое понимание того, как работает Google Apps Script.
1.Подготовка хранилища:Google Drive.
Создайте папку на Google Диске (например, Quarterly_Reports). Сюда вы будете загружать PDF-файлы квартальных отчетов компаний из вашего портфеля. Скопируйте ID папки из адресной строки браузера.
2.Получение Gemini API Key:Google AI Studio.
Зайдите в Google AI Studio, создайте новый проект и получите бесплатный API Key. Сохраните его — он понадобится для авторизации запросов из таблицы.
3.Настройка Google Sheets:Apps Script.
В новой таблице перейдите в Extensions -> Apps Script. Удалите стандартный код и вставьте скрипт, который будет:
- Перебирать файлы в папке на Диске.
- Отправлять PDF в Gemini с промптом для извлечения конкретных метрик (Revenue, Net Income, EPS).
- Записывать результат в строку таблицы.
4.Создание промпта-экстрактора:Системная инструкция.
В коде скрипта пропишите четкую инструкцию для ИИ: «Ты — финансовый экстрактор. Извлеки из этого файла: название компании, период, выручку, чистую прибыль и EPS. Верни ответ строго в формате JSON: {company: ‘…’, revenue: 000, …}».
Пример структуры данных
Ваша таблица после работы автоматизации должна выглядеть примерно так. Gemini отлично справляется с тем, чтобы найти данные даже в нестандартных форматах отчетов разных стран.
| Дата сбора | Компания | Период | Выручка (млрд $) | Чистая прибыль (млрд $) | EPS | Статус |
| 20.04.2026 | NVIDIA | Q1 2026 | 32.5 | 16.8 | 6.12 | ✅ Готово |
| 21.04.2026 | Apple | Q2 2026 | 94.8 | 23.6 | 1.53 | ✅ Готово |
| 22.04.2026 | Tesla | Q1 2026 | 21.3 | 1.1 | 0.34 | ⚠️ Проверить |
- Курсы валют на 21.06.2026: официальные данные центробанков 11 стран
- Курсы валют на 20.06.2026: официальные данные центробанков 11 стран
- Курсы валют на 19.06.2026: официальные данные центробанков 11 стран
Мнение эксперта
Дмитрий Соколов, Quantitative Analyst:
«Главное преимущество Gemini перед классическими парсерами — понимание контекста. Обычный скрипт сломается, если компания изменит структуру PDF. Gemini же ‘читает’ документ целиком. Однако я всегда рекомендую добавлять столбец ‘Confidence Score’ в JSON-ответ, чтобы ИИ сам сигнализировал, если он не уверен в извлеченной цифре из-за плохого качества скана или сложной таблицы.»
Почему это эффективнее ручного ввода?
- Мультимодальность: Gemini 1.5 Pro имеет контекстное окно до 2 млн токенов. Вы можете «скормить» ему сразу 10 отчетов разных лет для сравнительного анализа прямо в скрипте.
- Гибкость: Если вам вдруг понадобится добавить в таблицу «Прогноз руководства на следующий квартал», вам нужно просто изменить одну строчку в промпте, а не переписывать парсер.
- Бесплатный уровень: Google AI Studio предоставляет щедрые бесплатные лимиты (Free Tier), которых вполне достаточно для анализа портфеля из 20-50 компаний.
Отказ от ответственности: Результаты ИИ могут содержать ошибки (галлюцинации), особенно при работе с мелкими цифрами в сносках. Всегда проверяйте критически важные данные через официальные источники (SEC EDGAR или раздел IR на сайте компании).
Финансовая аналитика в Telegram
Эксклюзивные отчеты, крипто-тренды 2026 и советы по пассивному доходу в канале @FinaciaNet




