Моя искусственная секретарша. Бот для проверки документов

По рабочим вопросам часто приходится анализировать документы. Они наваливаются кучей, а дедлайн - завтра утром. Обычно это коммерческие предложения и примеры договоров. И вот, в пятницу, когда вместо любимого хобби я был вынужден вычитывать очередную порцию маркетингового и юридического буллщита, мой мозг начал оказывать активное сопротивление этой тупой монотонной работе, выдавая одну идею офигительной другой, только чтобы не вычитывать очередные пару сотен страниц ерунды.

Моя искусственная секретарша. Бот для проверки документов Проект, Документы, Анализ, Искусственный интеллект, Длиннопост

Мое лицо в пятницу вечером

Главная идея была - как то это все автоматизировать с помощью ИИ. Вспомнив что я все таки программист, и, засучив рукава я за пару недель сделал себе искусственную секретаршу. И назвал ее "Проверь документ бот", оформив в виде телеграм бота, которым вы так же можете воспользоваться. Мне он уже сэкономил несколько выходных, надеюсь и вам поможет.

Я разработчик этого бота, так что можете в комментариях писать обратную связь и вопросы по нему :)

Для Лиги лени - несколько скриншотов анализа

Моя искусственная секретарша. Бот для проверки документов Проект, Документы, Анализ, Искусственный интеллект, Длиннопост

Анализ моего трудового договора

Моя искусственная секретарша. Бот для проверки документов Проект, Документы, Анализ, Искусственный интеллект, Длиннопост

А вот какое-то очередное КП на 10 страниц :)

А для Лиги Душнил - техническое описание

Бот может обрабатывать документы в различных форматах:

- PDF документы - С использованием продвинутого извлечения текста из PDF

- Документы Microsoft Word (.docx) - Полное извлечение текста и структуры

- Таблицы Excel** (.xlsx, .xls) - Включая книги с несколькими листами

- Файлы CSV и TSV - С автоматическим определением разделителя

- Форматы OpenDocument (.ods) - Поддержка открытого стандартного формата таблиц

Автоматическое определение типа документа

- Юридические документы (договоры, уставы, судебные решения)

- Медицинские документы (справки, заключения, больничные листы)

- Корпоративные документы (заявления, протоколы, приказы)


Анализ содержимого и создание резюме

- Определение типа документа с оценкой уверенности

- Автоматическое создание резюме с извлечением ключевых моментов

- Структурированные резюме с выделением важных деталей

Анализ обязательств

- Извлечение ключевых обязательств для каждой стороны

- Полный анализ обязательств с цветовой кодировкой:

- 🔵 Обязательства Стороны 1 (Заказчик/Покупатель)

- 🟡 Обязательства Стороны 2 (Исполнитель/Продавец)

- 🟢 Взаимные обязательства

- 🔴 Критичные обязательства (штрафы/санкции)

Проверка соответствия законодательству

- Анализ в соответствии с российским законодательством (ГК РФ, НК РФ, ТК РФ)

- Выявление потенциальных правонарушений

- Рекомендации по улучшению документа

- Ссылки на соответствующие законы и нормативные акты

Оценка рисков

- Выявление правовых рисков

- Анализ финансовых рисков

- Оценка операционных рисков

- Общая оценка уровня риска с рекомендациями по снижению

Финансовый анализ

- Извлечение финансовых показателей и условий

- Определение графика платежей

- Оценка финансовых рисков

- Анализ баланса

Защита конфиденциальности

- Автоматическое обнаружение и фильтрация персональных данных (PII)

- Маскировка:

- Имен физических лиц

- Номеров телефонов

- Адресов электронной почты

- Паспортных данных

- СНИЛС/ИНН

- Банковских реквизитов

- Номеров банковских карт

- Дат рождения

- Адресов регистрации

Анализ с помощью ИИ

- Интеграция с YandexGPT Pro в качестве основного провайдера LLM

- GigaChat Pro как резервный провайдер LLM для русского языка

- Автоматическое переключение между провайдерами для максимальной надежности

Пользуйтесь и пишите что сделать лучше или поменять :)