Моя искусственная секретарша. Бот для проверки документов
По рабочим вопросам часто приходится анализировать документы. Они наваливаются кучей, а дедлайн - завтра утром. Обычно это коммерческие предложения и примеры договоров. И вот, в пятницу, когда вместо любимого хобби я был вынужден вычитывать очередную порцию маркетингового и юридического буллщита, мой мозг начал оказывать активное сопротивление этой тупой монотонной работе, выдавая одну идею офигительной другой, только чтобы не вычитывать очередные пару сотен страниц ерунды.
Главная идея была - как то это все автоматизировать с помощью ИИ. Вспомнив что я все таки программист, и, засучив рукава я за пару недель сделал себе искусственную секретаршу. И назвал ее "Проверь документ бот", оформив в виде телеграм бота, которым вы так же можете воспользоваться. Мне он уже сэкономил несколько выходных, надеюсь и вам поможет.
Я разработчик этого бота, так что можете в комментариях писать обратную связь и вопросы по нему :)
Для Лиги лени - несколько скриншотов анализа
А для Лиги Душнил - техническое описание
Бот может обрабатывать документы в различных форматах:
- PDF документы - С использованием продвинутого извлечения текста из PDF
- Документы Microsoft Word (.docx) - Полное извлечение текста и структуры
- Таблицы Excel** (.xlsx, .xls) - Включая книги с несколькими листами
- Файлы CSV и TSV - С автоматическим определением разделителя
- Форматы OpenDocument (.ods) - Поддержка открытого стандартного формата таблиц
Автоматическое определение типа документа
- Юридические документы (договоры, уставы, судебные решения)
- Медицинские документы (справки, заключения, больничные листы)
- Корпоративные документы (заявления, протоколы, приказы)
Анализ содержимого и создание резюме
- Определение типа документа с оценкой уверенности
- Автоматическое создание резюме с извлечением ключевых моментов
- Структурированные резюме с выделением важных деталей
Анализ обязательств
- Извлечение ключевых обязательств для каждой стороны
- Полный анализ обязательств с цветовой кодировкой:
- 🔵 Обязательства Стороны 1 (Заказчик/Покупатель)
- 🟡 Обязательства Стороны 2 (Исполнитель/Продавец)
- 🟢 Взаимные обязательства
- 🔴 Критичные обязательства (штрафы/санкции)
Проверка соответствия законодательству
- Анализ в соответствии с российским законодательством (ГК РФ, НК РФ, ТК РФ)
- Выявление потенциальных правонарушений
- Рекомендации по улучшению документа
- Ссылки на соответствующие законы и нормативные акты
Оценка рисков
- Выявление правовых рисков
- Анализ финансовых рисков
- Оценка операционных рисков
- Общая оценка уровня риска с рекомендациями по снижению
Финансовый анализ
- Извлечение финансовых показателей и условий
- Определение графика платежей
- Оценка финансовых рисков
- Анализ баланса
Защита конфиденциальности
- Автоматическое обнаружение и фильтрация персональных данных (PII)
- Маскировка:
- Имен физических лиц
- Номеров телефонов
- Адресов электронной почты
- Паспортных данных
- СНИЛС/ИНН
- Банковских реквизитов
- Номеров банковских карт
- Дат рождения
- Адресов регистрации
Анализ с помощью ИИ
- Интеграция с YandexGPT Pro в качестве основного провайдера LLM
- GigaChat Pro как резервный провайдер LLM для русского языка
- Автоматическое переключение между провайдерами для максимальной надежности
Пользуйтесь и пишите что сделать лучше или поменять :)