Top.Mail.Ru
NestVision OCR 2.0 — AI OCR API
Обзор
API
Точность
Интеграция
+1 видео
API SOC 2 Type II Enterprise ready

NestVision OCR 2.0

AI OCR для извлечения текста из документов и изображений

Точность
до 99.8%
Быстро
от 1.2 сек
Безопасно
Шифрование и ISO
POST /v1/ocr/extract
POST /v1/ocr/extract
{
  "image": "document.jpg",
  "language": "ru",
  "detect_table": true
}

Что вы получите

Программный код
  • API и SDK
  • Примеры кода
  • Быстрый старт
Данные (дата-сеты)
  • Таблицы и формы
  • CSV, JSON, Excel
  • Валидация данных
Инструкции и документы
  • API документация
  • Руководства
  • Примеры интеграции

Как это работает

1. Загрузите
Отправьте файл через API
2. Обработка
AI извлекает текст, таблицы и данные
3. Данные
Получите структурированные данные
4. Результат
Используйте данные в своих системах

Описание

NestVision OCR 2.0 — высокоточный AI-движок для извлечения текста и структурированных данных из документов любого формата и качества.

Продукт создан для команд, которым нужна автоматизация документооборота без потери точности. Поддерживает русский, английский и 48 других языков, включая сложные случаи: рукописный текст, таблицы, печати и угловые штампы.

Подключается через REST API за один день. Все данные шифруются при передаче (TLS 1.3) и хранении (AES-256). Соответствует GDPR и ФЗ-152.

Типичные сценарии
📄
Счета и накладные
Суммы, даты, реквизиты — прямо в ERP или 1С
⚖️
Юридические договоры
Стороны, суммы, сроки в структурированном виде
🏥
Медицинские карты
Оцифровка архивов, поиск по пациентам
🏦
Банковские документы
Паспорта, выписки — KYC без ручного ввода
Ключевые характеристики
Точность (чистые PDF)до 99.8%
Точность (сканы)до 91%
Скорость обработкиот 1.2 с
Языков50+
Форматы входаPDF, JPG, PNG, TIFF, DOCX
Форматы выходаJSON, CSV, XML, TXT
Макс. файл50 MB / запрос
Пакетная обработкадо 100 файлов
✓ SOC 2 Type II
✓ ISO 27001
✓ GDPR
✓ ФЗ-152
REST API
  • Аутентификация через Bearer Token
  • Rate limit: 100 / мин (Pay-as-you-go), 1000 / мин (Enterprise)
  • Webhook для асинхронной обработки
  • SDK: Python, Node.js, PHP, Go, Java
  • OpenAPI 3.0 спецификация в комплекте
Безопасность
  • Передача данных: TLS 1.3
  • Хранение: AES-256
  • Файлы удаляются через 24 ч. после обработки
  • On-premise: Docker / Kubernetes
  • Изолированные окружения для Enterprise
Производительность
  • Среднее время: 1.2–3.8 с
  • Пакет: до 100 файлов за запрос
  • Async API для файлов >10 стр.
  • SLA: 99.7% / 99.95% (Enterprise)
  • CDN в 3 регионах: EU, US, Asia
Форматы
  • Вход: PDF, JPG, PNG, TIFF, BMP, DOCX, XLSX
  • Выход: JSON, CSV, XML, TXT
  • Макс. разрешение: 10 000 × 10 000 px
  • Мин. DPI сканов: 150 (рек. 300)
  • Многостраничные PDF до 500 стр.
Системные требования (on-premise)
CPU4 cores (рек. 8+)
RAM8 GB (рек. 16+)
GPUОпционально (ускорение ×4)
OSLinux Ubuntu 20+, Docker
Диск20 GB (модели + кэш)
СетьТолько для активации
v2.4.1Текущая3 дня назад
Исправлена обработка PDF с нестандартными шрифтами
Улучшена скорость webhook-уведомлений на 40%
v2.4.018 апреля 2025
Новый движок таблиц — точность +12%
Поддержка XLSX и PPTX на входе
SDK для Go и Java
Оптимизировано рукописное распознавание
Исправлен баг с Unicode в JSON
v2.3.02 марта 2025
Async API для файлов >10 страниц
Пакет до 100 файлов за запрос
Улучшена поддержка арабского и китайского
v2.0.0Мажорный15 января 2025
Переработанный AI-движок на трансформерах
Точность на PDF: 94% → 99.8%
On-premise: Docker, Kubernetes
50+ языков (было 18)
API v2 с совместимостью v1
Новое Улучшено Исправлено

Отзывы клиентов

4.9 · 48 отзывов
Топ продавец 2024
АМ
Алексей Морозов
CTO, FinDocs Pro
12 янв 2025
Проблема

Обрабатывали 4 000+ счетов в месяц вручную — бухгалтерия тратила 3 дня только на ввод данных.

Решение

Подключили API за один день, настроили вебхук — данные идут прямо в 1С.

Точность 99% на наших сложных PDF — включая таблицы со слиянием ячеек. Окупился за 2 недели.
−87%время обработки
×12скорость ввода
2 нед.окупаемость
ЕС
Екатерина Смирнова
Head of Ops, MedArchive
3 мар 2025
Проблема

Медицинские карты в скан-архиве за 10 лет — поиск по пациенту занимал до 20 минут.

Решение

NestVision оцифровал 200 000 страниц за 4 дня, поиск стал мгновенным.

Русский рукописный текст распознаётся с удивительной точностью. Поддержка отвечает за 15 минут.
200Kстр. за 4 дня
<1споиск по архиву
GDPRсоответствие
ДК
Дмитрий Козлов
Founder, LegalBot
18 апр 2025
Проблема

Юридические договоры в PDF — нужно было извлекать даты, стороны и суммы для реестра.

Решение

Настроили кастомные поля через API — система сама заполняет реестр из любого договора.

Единственный OCR, который правильно читает печати и угловые штампы на договорах. Рекомендую.
5K+договоров/мес.
−95%ручной ввод
0ошибок реестра
Специальное предложение

Получите бесплатную консультацию
и скидку 20% на первый месяц

Расскажите о вашей задаче — покажем как NestVision решит её, и рассчитаем стоимость под ваш объём.

✓ Ответим за 15 минут ✓ Без обязательств ✓ Тестовый доступ на 7 дней
Оставьте заявку

Нажимая кнопку, вы соглашаетесь с политикой конфиденциальности