• Дело
  • SharePoint
  • eDocLib
  • Trade In
  • Акции

Система «Поточное сканирование»

Решение «Поточное сканирование»  компании «Электронные Офисные Системы» помогает  легко и быстро перевести в электронный вид большой объем бумажных документов. Эффективная организация поточного сканирования позволяет значительно сократить время массового перевода документов в электронный вид.  Высокая  скорость достигается за счет автоматизации процесса сканирования и применения технологии  параллельных вычислений при распознавании текста. «Поточное сканирование»  это коробочное решение.  Продукт может использоваться совместно с любой системой электронного документооборота.

Как это работает? 

Документы загружаются в сканер одной пачкой. В процессе сканирования каждый отдельный  документ из пачки автоматически идентифицируются по штрих-коду. Таким образом,  начиная с загрузки документов в сканер, все дальнейшие операции могут выполняться автоматически, без участия оператора. Штрих-код для документа может быть сгенерирован системой и распечатан на документе или на отдельном листе бумаги. Если  на страницы документов уже нанесены  штрих-коды стандартного формата, то они также могут быть использованы для идентификации.

Распознавание текста(OCR). 

Распознавание отсканированного документа и его сохранение в текстовом виде существенно расширяет возможности по его дальнейшее обработке. К примеру, становится доступным быстрый поиск по содержанию документов. Механизм распознавания текста в «Поточном сканировании» базируется на возможностях продукта ABBYY FineReader Engine 9.0, по праву считающегося лучшим решением для распознавания.

Сканирование одной кнопкой.

Система поддерживает работу с сетевыми сканерами. Достаточно загрузить  документы в сканер и нажать кнопку сканирования на самом устройстве. Результаты сканирования будут автоматически сохранены и отправлены на дальнейшую обработку. Таким образом, управление сканированием сводиться к нажатию одной кнопки. А значит, не требуется специальных программ для управления сканером, не требуется отдельного рабочего места для управления  сканированием и  достигается существенная экономия времени.

Высокая скорость.

При традиционном подходе, обработка текста при распознавании  может занимать достаточно много времени. В решении «Поточное сканирование» предусмотрена возможность  параллельной обработки текста на нескольких серверах одновременно, что позволяет добиться любой необходимой скорости  обработки.

Интеграция с любыми системами.

Процедура регистрации сканируемых документов  практически не отличается от стандартной. Решение «Поточное сканирование»  запускается непосредственно из используемой системы документооборота.

Простая система лицензирования. 

При покупке системы лицензируется только один параметр:  «количество обрабатываемых страниц в месяц». Дополнительно, для выполнения задач OCR распознавания текста, в комплект могут быть включены лицензии на использование одного или нескольких экземпляров продукта ABBYY FineReader Engine 9.0

Возможность ручного контроля.

На этапе запуска системы в эксплуатацию предусмотрена возможность ручного управления работой системы. Это позволяет установить наиболее подходящие параметры настроек и подобрать оптимальное качество сканируемых документов.

Интеграция с решениями eDocLib и EOS for SharePoint.

Система может поставляться в качестве отдельного продукта или в виде дополнительной опции для  решений eDocLib и EOS for SharePoint.

API-интерфейс и подробная документация.

Продукт легко интегрируются с любыми приложениями, поддерживающими стандартную технологию обмена данными Windows Communication Foundation-WCF. В  В состав стандартной поставки входит пример интеграции с демонстрационным приложением СЭД в исходных кодах и комплект документации для разработчиков.

Меню настроек «Поточного сканирования». Предусмотрено создание нескольких профилей для различных размеров и расположения штрих-кода на документе. Сохранение отсканированного образа возможно в любом из распространенных текстовых или графических форматов.

Описание технологического процесса обработки документов

Принцип  поточного сканирования основан на том, что при регистрации на документ наносится штрих-код. После этого помеченные штрих-кодом документы сканируются и автоматически (по штрих-коду) связываются с регистрационной карточкой соответствующего документа. Если  на сканируемые документы уже нанесен  штрих-код стандартного формата, то он также может  быть использован для идентификации. Структурная схема работы системы представлена на рисунке.

Структурная схема работы системы

В процессе сканирования предусмотрены как опция сохранения  непосредственно графического образа документа, так и  возможность последующего распознавания и сохранения в текстовом формате, что существенно облегчает дальнейшую работу с документом  и расширяет возможности использования поиска. Распознавание и перевод в текстовый формат реализуется с помощью ABBYY FineReader Engine 9.0.

Многоязычные документы.

Решение  «Поточное сканирование» позволяет  обрабатывать документы на всех языках, поддерживаемых ABBYY FineReader, включающих к настоящему моменту: русский, английский, немецкий, французский, испанский, итальянский, шведский, финский, болгарский, венгерский, словацкий, чешский, башкирский, белорусский, казахский, украинский.

Интеграция произвольной СЭД с системой

Интеграция с системой «Поточное сканирование» предполагает реализацию со стороны произвольной СЭД только двух  функций:

1Формирование и отправка в систему «Поточное сканирование» заявки на сканирование.
Со стороны СЭД передается запрос, содержащий требования на обработку документа. Система «Поточное сканирование» регистрирует заявку и возвращает в СЭД ее уникальный идентификатор. На данном этапе осуществляется связка уникального идентификатора заявки на сканирование с штрих-кодом, уже существующем на документе, либо вновь сгенерированным.

2. Реализовать прием и сохранение итоговых результатов, сформированных системой «Поточное сканирование».
На данном этапе выполняется сопоставление результатов выполнения сканирования с объектами СЭД. Сопоставление осуществляется на основе уникального идентификатора заявки на сканирование и может быть расширено любой бизнес - логикой СЭД.

Регистрация и сканирование документов

Регистрация документа, т.е. создание регистрационной карточки, выполняется по обычным правилам используемой системы электронного документооборота. Далее, при обращении к системе «Поточное сканирование» происходит регистрация заявки на сканирование, генерация штрих кода и  указание параметров заявки (расположение штрих-кода, требуемые форматы, необходимость распознавания). После записи регистрационной карточки документа в базу данных на первую страницу документа или на отдельный лист бумаги с помощью принтера наносится штрих-код, содержащий уникальный идентификационный номер документа и устанавливающий правила его обработки (печать полученного изображения штрих-кода осуществляется средствами системы документооборота). Далее пакет зарегистрированных документов помещается в устройство подачи бумаги сканера, после чего вся обработка документов производится автоматически.

Назначение штрих-кода в системе eDocLib.

Применение штрих-кода.

В процессе сканирования, нанесенный штрих-код используется как признак окончания текущего документа и начала следующего, а содержащаяся в штрих-коде дополнительная информация применяется для дальнейшей идентификации обрабатываемого документа. 

Результаты сканирования

Графические документы.

При сохранении графического образа документов система обеспечивает возможность конвертации изображений сканируемых документов в следующие форматы:

  • BMP (Windows or OS/2 bitmap);
  • PNG (Portable Network Graphics);
  • TIFF (Tagged Image Format);
  • JPEG (Joint Photographic Experts Group);
  • PDF (Portable Document Format).

Для каждого формата предусмотрена возможность указания размеров изображения и дополнительных атрибутов (глубина цвета, тип сжатия и т.п.). Если размер требуемого формата отличается от текущего графического представления, то может быть выполнена конвертация с применением заданных параметров.

Рабочее окно системы eDocLib c интегрированной опцией «Поточное сканирование». Отсканированный документ прикреплен к регистрационной карточке.

Текстовые документы.

В случае применения технологии распознавания текста, предусмотрена возможность сохранения в большинстве наиболее  распространенных форматах файлов*:

  • Текстовый файл (.txt);
  • Rich Text Format (.rtf);
  • Microsoft Excel, Microsoft Excel 2007 (.xls, .xlsx);
  • Microsoft Word 2007 (.docx);
  • HTML (.html);
  • XML (.xml);
  • PDF (Portable Document Format).

Для каждого из форматов записи  предусмотрена возможность указания дополнительных атрибутов (размер страницы, кодировка и т.п.). Режим сохранения в виде PDF-файла поддерживает все четыре основных режима записи в PDF - только текст и изображение; только изображение; текст поверх изображения страницы; текст под изображением страницы.

Таким образом, система  «Поточное сканирование» реализует эффективную технологию  преобразования бумажных документов в электронный вид и позволяет в сжатые сроки осуществить переход к работе с электронными образами документов.  Продуманные настройки, гибкие механизмы управления и подробная документация для разработчиков делают работу с системой удобной и результативной.


*Список поддерживаемых текстовых форматов зависит от возможностей используемой системы распознавания и может изменяться.


Share |