Система «Поточное сканирование»

Решение «Поточное сканирование» компании «Электронные Офисные Системы» помогает легко и быстро перевести в электронный вид большой объем бумажных документов. Эффективная организация поточного сканирования позволяет значительно сократить время массового перевода документов в электронный вид. Высокая скорость достигается за счет автоматизации процесса сканирования и применения технологии параллельных вычислений при распознавании текста. «Поточное сканирование» это коробочное решение. Продукт может использоваться совместно с любой системой электронного документооборота.
Как это работает?
Документы загружаются в сканер одной пачкой. В процессе сканирования каждый отдельный документ из пачки автоматически идентифицируются по штрих-коду. Таким образом, начиная с загрузки документов в сканер, все дальнейшие операции могут выполняться автоматически, без участия оператора. Штрих-код для документа может быть сгенерирован системой и распечатан на документе или на отдельном листе бумаги. Если на страницы документов уже нанесены штрих-коды стандартного формата, то они также могут быть использованы для идентификации.
Распознавание текста(OCR).
Распознавание отсканированного документа и его сохранение в текстовом виде существенно расширяет возможности по его дальнейшее обработке. К примеру, становится доступным быстрый поиск по содержанию документов. Механизм распознавания текста в «Поточном сканировании» базируется на возможностях продукта ABBYY FineReader Engine 9.0, по праву считающегося лучшим решением для распознавания.
Сканирование одной кнопкой.
Система поддерживает работу с сетевыми сканерами. Достаточно загрузить документы в сканер и нажать кнопку сканирования на самом устройстве. Результаты сканирования будут автоматически сохранены и отправлены на дальнейшую обработку. Таким образом, управление сканированием сводиться к нажатию одной кнопки. А значит, не требуется специальных программ для управления сканером, не требуется отдельного рабочего места для управления сканированием и достигается существенная экономия времени.
Высокая скорость.
При традиционном подходе, обработка текста при распознавании может занимать достаточно много времени. В решении «Поточное сканирование» предусмотрена возможность параллельной обработки текста на нескольких серверах одновременно, что позволяет добиться любой необходимой скорости обработки.
Интеграция с любыми системами.
Процедура регистрации сканируемых документов практически не отличается от стандартной. Решение «Поточное сканирование» запускается непосредственно из используемой системы документооборота.
Простая система лицензирования.
При покупке системы лицензируется только один параметр: «количество обрабатываемых страниц в месяц». Дополнительно, для выполнения задач OCR распознавания текста, в комплект могут быть включены лицензии на использование одного или нескольких экземпляров продукта ABBYY FineReader Engine 9.0
Возможность ручного контроля.
На этапе запуска системы в эксплуатацию предусмотрена возможность ручного управления работой системы. Это позволяет установить наиболее подходящие параметры настроек и подобрать оптимальное качество сканируемых документов.
Интеграция с решениями eDocLib и EOS for SharePoint.
Система может поставляться в качестве отдельного продукта или в виде дополнительной опции для решений eDocLib и EOS for SharePoint.
API-интерфейс и подробная документация.
Продукт легко интегрируются с любыми приложениями, поддерживающими стандартную технологию обмена данными Windows Communication Foundation-WCF. В В состав стандартной поставки входит пример интеграции с демонстрационным приложением СЭД в исходных кодах и комплект документации для разработчиков.
Меню настроек «Поточного сканирования». Предусмотрено создание нескольких профилей для различных размеров и расположения штрих-кода на документе. Сохранение отсканированного образа возможно в любом из распространенных текстовых или графических форматов.
Описание технологического процесса обработки документов
Принцип поточного сканирования основан на том, что при регистрации на документ наносится штрих-код. После этого помеченные штрих-кодом документы сканируются и автоматически (по штрих-коду) связываются с регистрационной карточкой соответствующего документа. Если на сканируемые документы уже нанесен штрих-код стандартного формата, то он также может быть использован для идентификации. Структурная схема работы системы представлена на рисунке.
Структурная схема работы системы
В процессе сканирования предусмотрены как опция сохранения непосредственно графического образа документа, так и возможность последующего распознавания и сохранения в текстовом формате, что существенно облегчает дальнейшую работу с документом и расширяет возможности использования поиска. Распознавание и перевод в текстовый формат реализуется с помощью ABBYY FineReader Engine 9.0.
Многоязычные документы.
Решение «Поточное сканирование» позволяет обрабатывать документы на всех языках, поддерживаемых ABBYY FineReader, включающих к настоящему моменту: русский, английский, немецкий, французский, испанский, итальянский, шведский, финский, болгарский, венгерский, словацкий, чешский, башкирский, белорусский, казахский, украинский.
Интеграция произвольной СЭД с системой
Интеграция с системой «Поточное сканирование» предполагает реализацию со стороны произвольной СЭД только двух функций:
1. Формирование и отправка в систему «Поточное сканирование» заявки на сканирование.
Со стороны СЭД передается запрос, содержащий требования на обработку документа. Система «Поточное сканирование» регистрирует заявку и возвращает в СЭД ее уникальный идентификатор. На данном этапе осуществляется связка уникального идентификатора заявки на сканирование с штрих-кодом, уже существующем на документе, либо вновь сгенерированным.2. Реализовать прием и сохранение итоговых результатов, сформированных системой «Поточное сканирование».
На данном этапе выполняется сопоставление результатов выполнения сканирования с объектами СЭД. Сопоставление осуществляется на основе уникального идентификатора заявки на сканирование и может быть расширено любой бизнес - логикой СЭД.
Регистрация и сканирование документов
Регистрация документа, т.е. создание регистрационной карточки, выполняется по обычным правилам используемой системы электронного документооборота. Далее, при обращении к системе «Поточное сканирование» происходит регистрация заявки на сканирование, генерация штрих кода и указание параметров заявки (расположение штрих-кода, требуемые форматы, необходимость распознавания). После записи регистрационной карточки документа в базу данных на первую страницу документа или на отдельный лист бумаги с помощью принтера наносится штрих-код, содержащий уникальный идентификационный номер документа и устанавливающий правила его обработки (печать полученного изображения штрих-кода осуществляется средствами системы документооборота). Далее пакет зарегистрированных документов помещается в устройство подачи бумаги сканера, после чего вся обработка документов производится автоматически.
Назначение штрих-кода в системе eDocLib.
Применение штрих-кода.
В процессе сканирования, нанесенный штрих-код используется как признак окончания текущего документа и начала следующего, а содержащаяся в штрих-коде дополнительная информация применяется для дальнейшей идентификации обрабатываемого документа.
Результаты сканирования
Графические документы.
При сохранении графического образа документов система обеспечивает возможность конвертации изображений сканируемых документов в следующие форматы:
-
BMP (Windows or OS/2 bitmap);
-
PNG (Portable Network Graphics);
-
TIFF (Tagged Image Format);
-
JPEG (Joint Photographic Experts Group);
-
PDF (Portable Document Format).
Для каждого формата предусмотрена возможность указания размеров изображения и дополнительных атрибутов (глубина цвета, тип сжатия и т.п.). Если размер требуемого формата отличается от текущего графического представления, то может быть выполнена конвертация с применением заданных параметров.
Рабочее окно системы eDocLib c интегрированной опцией «Поточное сканирование». Отсканированный документ прикреплен к регистрационной карточке.
Текстовые документы.
В случае применения технологии распознавания текста, предусмотрена возможность сохранения в большинстве наиболее распространенных форматах файлов*:
-
Текстовый файл (.txt);
-
Rich Text Format (.rtf);
-
Microsoft Excel, Microsoft Excel 2007 (.xls, .xlsx);
-
Microsoft Word 2007 (.docx);
-
HTML (.html);
-
XML (.xml);
-
PDF (Portable Document Format).
Для каждого из форматов записи предусмотрена возможность указания дополнительных атрибутов (размер страницы, кодировка и т.п.). Режим сохранения в виде PDF-файла поддерживает все четыре основных режима записи в PDF - только текст и изображение; только изображение; текст поверх изображения страницы; текст под изображением страницы.
Таким образом, система «Поточное сканирование» реализует эффективную технологию преобразования бумажных документов в электронный вид и позволяет в сжатые сроки осуществить переход к работе с электронными образами документов. Продуманные настройки, гибкие механизмы управления и подробная документация для разработчиков делают работу с системой удобной и результативной.
*Список поддерживаемых текстовых форматов зависит от возможностей используемой системы распознавания и может изменяться.










