Как распознать текст с картинки в Word

Как распознать текст с картинки в Word

Представьте себе функцию, позволяющую извлечь текст из изображения и быстро вставить его в другой документ. На самом деле это возможно. Вам больше не нужно терять время, набирая все, потому что есть программы, которые используют оптическое распознавание символов (OCR) для анализа букв и слов в изображении, а затем конвертируют их в текст.

В наши дни существует так много бесплатных и эффективных опций, позволяющих извлечь текст из изображения, а не печатать его вручную. Ниже представлены самые удобные и эффективные программы и их сравнение.

Видео — распознавание текста с картинки в WORD

Извлечение текста с помощью OneNote

OneNote OCR уже на протяжении нескольких лет остается одной из самых лучших программ для распознавания текста. Однако, распознавание это одна из тех менее известных функций, которые пользователи редко используют, но как только вы начнете ее использовать, вы будете удивлены тем, насколько быстрой и точной она может быть. Действительно, способность извлекать текст — одна из особенностей, которая делает OneNote лучше Evernote.

Это стандартная программа, скорее всего вам не придется устанавливать ее самостоятельно. Найдите ее на компьютере в папке Microsoft Office или же с помощью поиска на панели «Пуск». Запустите программу.

Инструкции по извлечению текста:

    Шаг 1. Откройте любую страницу в OneNote, желательно пустую.

Теперь вы можете вставить его куда угодно. Удалите вставленное изображение, если оно вам больше не нужно.

На заметку! Это быстрый и удобный способ извлечения текста из картинки, но есть одно «но» — One Note работает подобным образом лишь с латиницей. Он не распознает русский текст.

Использование онлайн-сервисов

Онлайн-сервисы по распознаванию текста с изображения работают примерно по одному и тому же принципу. В примере ниже использовался Free Online OCR. На этом сайте стоит ограничение. Регистрация даст вам доступ к дополнительным функциям, недоступным для гостей: конвертировать многостраничный PDF (более 15 страниц) в текст, большие изображения и ZIP-архивы, выбирать языки распознавания, конвертировать в редактируемые форматы и многое другое. Распознать короткий тест можно и без регистрации.

    Шаг 1. Откройте сайт бесплатного OCR. Выберите изображение посредством кнопки «Select File». Это может быть и PDF файл.

Текст появится в поле ниже. Вы также можете скачать в формате Microsoft Word.

Этот способ имеет ряд преимуществ:

  1. Вам не придется скачивать и устанавливать стороннее программное обеспечение.
  2. Итог можно скачать в виде текстового документа.
  3. Это быстро.
  4. Более того на сайте можно распознавать текст на одном из множества предложенных языков.

Видео — Как распознавать текст с картинки, фотографии или PDF файла

Как извлечь текст из изображений с помощью ABBY FineReader

Существует две версии этой программы. Одна работает в автоматическом режиме онлайн, другая же — десктопная, ее придется скачать и установить на компьютер. Обе — платные. Однако в онлайн-версии можно бесплатно распознать текст с не более 5 страниц, а в установленной программе первое время действует пробный бесплатный период. На сегодня это один из лучших инструментов для распознавания текста с картинки.

Онлайн версия

  1. Шаг 1. Перейдите на сайт FineReader.

Текст сохранится в формате docs. Скачайте его.

Десктопная версия

  1. Шаг 1. Запустите FreeReader и нажмите «Сканировать изображение», чтобы выбрать файл, содержащий текст. Он загрузится в программу, при необходимости их можно отредактировать, чтобы улучшить распознаваемость текста. Программа предложит вам выделить область, текст с которой нужно распознать.
  2. Шаг 2. Извлечение текста. Нажмите «Распознать», чтобы извлечь текст из выделения. Выбранный текст будет отображаться в текстовом окне через несколько секунд.

Шаг 3. Проверка. В этой программе есть функция проверки. Нажав на эту кнопку, пользователь на экране будет видеть некорректно распознанные слова и фрагмент оригинала. На этом этапе можно быстро исправить практически все ошибки программы.

Шаг 4. Сохраните текст любым из предложенных способов.

  1. Во-первых, вам нужно убедиться, что исходное изображение четкое, хорошего качества.
  2. Во-вторых, выбор правильного механизма OCR важен, и вам нужно учитывать их сильные и слабые стороны.
  3. В-третьих, убедитесь, что ваши изображения масштабированы до нужного размера (не менее 300 DPI).
  4. Низкая контрастность приведет к плохому OCR, поэтому вам необходимо исправить это до распознавания.
  5. Удалите шумы и дефекты.
  6. Если изображение перекошено, отредактируйте его.

Видео — Как распознать PDF в Word

Источник:
http://pc-consultant.ru/microsoft-word/kak-raspoznat-tekst-s-kartinki-v-word/

Как сделать скан из word?

Переводим отсканированный текст в Word

Всем доброго времени суток!

В этой статье мы поговорим о том, что нужно сделать для того, чтобы можно было редактировать сканированный текст в популярных текстовых редакторах, таких как MS Word. Произвести простое сканирование – задача не сложная. Достаточно нажать кнопку на сканере, выбрать качество сканирования и сохранить получившийся файл в каком-либо графическом формате *.tiff, *.jpeg, *.bmp и т.д.

В таком формате редактирование текста не представляется возможным, т.к. получившийся файл является простой картинкой, ничем не отличающейся от рядовой фотографии. Сканер просто-напросто «не понимает» что буквы текста являются именно буквами. Для него это всего лишь пятна или точки черного цвета. Поэтому в этой статье мы разберем программу с помощью которой Вы сможете легко и просто сканировать в ворд.

Именно для того, чтобы «объяснить» компьютеру, что отсканированный файл является текстом и были созданы программы для распознавания текстов. Причем они позволяют распознавать текст введенный не только с помощью сканера, но и даже если этот текст был сфотографирован простым фотоаппаратом. Да, кстати, кто хочет узнать несколько полезных фишек по работе с Microsoft Word, может ознакомиться с моим мини видеокурсом.

А про он-лайн сервис распознавания сканированных текстов я рассказывал в этой статье. Почитайте ее и воспользуйтесь сервисом если нет желания устанавливать отдельную программу.

К современным программам для распознавания текстов предъявляется довольно широкий спектр задач. Сегодня эти программы должны уметь:

  1. Распознавать текст, набранный самыми различными шрифтами и даже рукописный текст;
  2. Распознавать текст, в котором содержатся слова на нескольких языках;
  3. Корректно распознавать таблицы и картинки;
  4. Распознавать некачественный текст (например, многократно ксерокопированные тексты);
  5. Самое главное – перевод сканированного текста в текстовые редакторы, такие как Word.

Самой актуальной программой, пожалуй, является ABBYY FineReader, созданной российскими программистами Дэвидом Яном и Александром Москалевым. Достоинств у «Файнридера» не перечесть, начиная от количества поддерживаемых языков, в числе которых и древние языки, до пакетной обработки многостраничных текстов. Файнридер, возможно, и справится с переводом, но это будет перевод электронного документа. А вот чтобы получить письменный перевод срочно, придется воспользоваться услугами экспертов.

Единственным недостатком является стоимость «Файнридера». Однако не стоит отчаиваться, ведь при покупке сканера, в зависимости от модели сканера, вполне может оказаться, что на диске с драйверами уже содержится стандартная модификация программы. Ну, а если у Вас еще нет Файнридера, то Вы можете приобрести его с 5% скидкой по этой ссылке. Скидка действует, если Вы введете промокод — computerlikbez.

Что ж, попробуем отсканировать и перевести текст в Word (рассмотрим эту процедуру на примере разворота книги):

Располагаем необходимый текст в сканере, запускаем FineReader и нажимаем кнопку «Сканировать»

В следующем окне задаем необходимые настройки. Для улучшения качества можно задать бОльшее разрешение сканирования. Затем нажимаем «Сканировать»

Далее запускается процесс автоматического сканирования и распознавания

В следующем окне мы можем видеть две большие области: слева – отсканированную картинку, а справа уже распознанный текст. В области «Страницы» можно также увидеть что FineReader не только перевернул разворот книги вертикально, но и разбил текст на две страницы

Далее, нажав на треугольник, справа от кнопки «Сохранить» выбираем необходимый формат

В следующем окне задаем имя будущего файла , указываем путь для сохранения. В нижней части окна можно выбрать дополнительные параметры сохранения

Как видим, FineReader отлично справился. Причем распознавание произошло пакетно, т.е. обе страницы нашего текста оказались в одном файле.

Кстати, недавно дописал, наконец-то , свою книгу! Ознакомиться с ней можно по ссылке.

Как из сканированного документа сделать word. Как отсканированный документ перевести в формат Word

Те люди, которые активно работают с документами и прочей текстовой информацией, однозначно видят необходимость в сканировании различных материалов. Важно помнить о том, что для получения качественных документов наличие сканера и вовсе не обсуждается. Однако в определенных ситуациях может сгодиться и фотография необходимого текста, однако снимок также должен отличаться высоким качеством.

Как отсканировать документ в Word

  • В первую очередь происходит сканирование документа. Для этого дела лучше выбирать формат png или jpg. Размер изображения также должен быть внушительным (от 400 dpi), чтобы при распознавании не было никаких проблем.
  • Полученные изображения сохраняются в конкретном месте, после чего потребуется сама программа для распознавания текста. Лучше всего сделать выбор в пользу Adobe FineReader. Это универсальное программное обеспечение, которое по качеству своей работы не вызывает никаких нареканий. Важно отметить, что после установки данной программы соответствующая вкладка должна появиться и в MS Word, соответственно, использование функционала существенно упрощается.
  • Через Adobe FineReader нужно выбрать пункт меню «Файл» и «Открыть», выбираем необходимые изображения. Далее появится меню обработки изображения, нам необходимо выбрать язык, который используется в документе, а также некоторые другие опции, среди которых словари и прочие настройки (не столь важные для получения результата).
  • Нажимаем кнопку «Распознать» и ждем, пока процесс завершится. Вполне вероятно, что распознается далеко не все, поэтому те слова, которые программа не смогла определить, будут выделены другим цветом, их можно редактировать прямо в программе.
  • Если текст в самом отсканированном документе немного смещен, то в Adobe FineReader необходимо выбрать те или иные абзацы текста при помощи выделения. Это позволит не пропустить текст при распознавании.
  • В итоге нужно нажать на кнопку «Сохранить», после чего появляется возможность выбрать место сохранения документа, а также его формат. Конечно же, в случае с MS Word нужно выбирать расширение doc или docx.
  • Если перед сохранением оказывается, что документ разбит на несколько колонок, то необходимо выбрать меню «Формат», далее перейти в «Колонки» и выбрать «Одна», чтобы документ смотрелся просто и гармонично. Также в «Параметрах страницы» присутствует возможность настройки полей, отступов и шрифтов.
Читайте также  Как изменить расстояние между словами в Ворде


В итоге документ можно свободно редактировать прямо в офисном пакете MS Office. Важно отметить, что при распознавании документа прямо в Word, форматирование происходит еще проще, так как функционал единый, как для исходных документов, так и для распознаваемых.

Что касается распознавания с фотографий или других материалов, то здесь не так уж просто получить высокое качество распознавания, так как речь идет о смещенных полях, отступах и прочих деталях документов, на исправление которых придется потратить немало времени.

С помощью стартового окна вы можете создавать документы Word при помощи сканера или фотоаппарата.

  1. На закладке Сканировать нажмите Сканировать в Microsoft Word.
  2. Выберите устройство и задайте параметры сканирования.
  3. Нажмите кнопку Просмотр или в любом месте области сканирования.
  4. Просмотрите полученное изображение, при необходимости измените параметры и снова нажмите Просмотр.
  5. Укажите настройки выбранного формата.Внешний вид и свойства полученного документа будут зависеть от выбранных вами настроек.
    1. Сохранять форматирование. Выбор режима сохранения форматирования зависит от того, как вы будете использовать созданный документ в дальнейшем:
  • Точная копияВозможность редактирования выходного документа ограничена, но при этом максимально точно сохраняется внешний вид документа.
  • Редактируемая копияОформление выходного документа может незначительно отличаться от оригинала. Полученный документ легко редактируется.
  • Форматированный текстСохраняются только шрифты, их размеры и начертание, разбиение на абзацы. Полученный документ содержит сплошной текст, записанный в одну колонку.
  • Простой текстСохраняется только разбиение на абзацы. Весь текст форматируется одним шрифтом и располагается в одной колонке.
  • Языки распознавания — необходимо правильно указать языки документа. Подробнее см. «Языки распознавания».
  • Сохранять картинки — отметьте эту опцию, если вы хотите сохранять иллюстрации в полученном документе.
  • Сохранять колонтитулы и номера страниц — в полученном документе будут сохранены колонтитулы и номера страниц.
  • Настройки предобработки изображений. — вы можете задать настройки обработки файлов изображений, включая определение ориентации страницы и автоматическую обработку изображений. Эти настройки позволяют значительно улучшить исходное изображение и получить более точные результаты конвертации. Подробнее см. «Параметры обработки изображений».
  • Другие настройки. — позволяет открыть Настройки форматов на закладке DOC(X)/RTF/ODT диалога Настройки (меню Инструменты > Настройки. ) и задать дополнительные настройки.
  • Нажмите Сканировать в Microsoft Word.
  • После запуска на экране появится панель выполнения задачи, содержащая индикатор выполнения и подсказки.
  • После завершения сканирования текущей страницы на экране появится диалог выбора дальнейшего действия. Нажмите Сканировать снова, чтобы запустить процесс сканирования следующих страниц с текущими настройками, или Завершить сканирование, чтобы закрыть диалог.
  • Укажите папку для сохранения полученного Word-документа.

    По завершении задачи документ Microsoft Word будет создан в указанной папке. Кроме того, все изображения будут добавлены в OCR-редактор и доступны для обработки.

    Загрузка и сканирование

    Для запуска процесса:

    Данная программа автоматом выделит фрагменты документа, рисунки и таблицы, при необходимости повернет сканированный текст по нужному направлению. После завершения сканирования, в данной программе требуется выбрать язык для расшифровки написанного.Выбрать его можно в выпадающем окне «Язык документа», если загруженный скан будет написан на нескольких иностранных языках – следует выбрать автоматический режим.

    Источник:
    http://brotc.ru/word/kak-sdelat-skan-iz-word.html

    Как сканировать документы напрямую из Word 2016, 2013, 2010

    Microsoft по какой-то причине убрала возможность сканировать напрямую из Word еще в версии Office 2010 (убрали вместе с полезной утилитой MODI — Microsoft Office Document). В более новых версиях Word 2013 и Word 2016 также нет кнопки сканирования напрямую из документа Word. Чтобы вставить изображение со сканера в Word приходится отсканированное изображение в графический файл на диск с помощью диалога утилиты сканирования от производителя сканера, а потом вставлять в документ Word сохраненный файл рисунка. Все это очень неудобно, особенно, когда приходится сканировать и вставлять в документы Word десятки изображений в день.

    В этой статье мы рассмотрим способ добавления собственной кнопки запуска мастера сканирования в Word и код небольшого VBA макроса, позволяющий автоматически сканировать и вставлять изображения со сканера напрямую в Word. Данная инструкция применима к Word 2016, 2013 и 2010 (учитывайте различия в интерфейсе).

    Итак, добавим новый макрос сканирования в наш Word 2016.

    1. Перейдите на вкладку Вид и выберите Макросы ->Макросы.
    2. В выпадающем списке Макросы из выберите Normal.dotm (общего шаблона). Укажите имя макроса WIA_Scan и нажмите кнопку Создать.
    3. В появившемся окне редактора Visual Basic выберите меню Tools ->References. References» srcset=»https://winitpro.ru/wp-content/uploads/2018/09/proekt-vba-tools-greater-references.png 523w, https://winitpro.ru/wp-content/uploads/2018/09/proekt-vba-tools-greater-references-300×122.png 300w» sizes=»(max-width: 523px) 100vw, 523px» />
    4. В списке подключается библиотек выберите Microsoft Windows Image Acquisition Library v2.0. Данная библиотека Windows полволяет получать доступ к сканерам из кода VBA. Поддерживаются только драйвера сканеров с поддержкой WIA (Windows Imaging Architecture). Тем самым мы сможем использовать классы библиотеки сканирования WIA (wiaaut.dll) в VBA коде.
    5. Вставьте в редактор Visual Basic следующий VBA код: Sub WIA_Scan()

      ‘ WIA_Scan макрос для MS Office 2016/2013


      On Error Resume Next
      Dim objWIADialog As WIA.CommonDialog
      Dim objScanImage As WIA.ImageFile
      Dim strDate
      ‘ инициализация объектов WIA
      Set objWIADialog = New WIA.CommonDialog
      Set objScanImage = objWIADialog.ShowAcquireImage
      ‘ путь к временному файлу
      strDate = Environ(«temp») & «Scan.jpg»
      If Not objScanImage Is Nothing Then
      ‘удаляем старый файл
      Kill strDate
      ‘ сохраняем скан во временный файл
      objScanImage.SaveFile strDate
      ‘ вставляем файл Scan.jpg в документ Word
      Selection.InlineShapes.AddPicture strDate
      Set objScanImage = Nothing
      End If
      Set objWIADialog = Nothing
      End Sub

    Попробуйте теперь нажать на новую кнопку сканирования.

    VBA макрос позволяет вызвать стандартное диалоговое окно интерфейса WIA. Если в системе имеется несколько источников WIA, вам будет предложено выбрать устройство, с которого нужно получить изображение.

    После того, как вы выбрали устройство WIA, появится стандартное диалоговое окно сканера с настройками сканирования и окном предпросмотра.

    После того, как вы выбрали настройки сканирования, нажмите кнопку Scan и дождитесь окончания сканирования.

    Макрос автоматически сохранит отсканированное изображение во временный jpg файл и вставит его в открытый документ Word. В документе Word вы можете изменить размер и положение вставленной сканированной картинки.

    Как вы видите, теперь вставлять изображение со сканера в документ Word стало гораздо удобнее.

    Источник:
    http://winitpro.ru/index.php/2018/09/20/dobavit-knopku-scanirovaniya-v-word/

    Как сканировать с принтера в Word

    Убеждаемся, что компьютер имеет драйвера, необходимые для принтера. Это делается во вкладке «диспетчер устройства», «устройство обработки изображений».

    Последовательность действий:

    1. Открыть и запустить инструменты «факсы и сканирование».
    2. На верхней панели надо отметить вкладку «новое сканирование» и задать его параметры.
    3. Отметить, что надо отсканировать — фото или текстовый документ.
    4. Начать сканирование с предварительным просмотром результата или без него. Нажать кнопку «сканировать». После этого документ стал доступен во вкладке «отсканированные документы».

    Дополнительное программное обеспечение

    Отсканировать документ более удобно, можно установив на компьютер программу «ScanLite» размером 3 мб.

    Программа проста в обращении, но позволяет выполнить минимальный набор опций:

    • ввести наименование документа — это придётся делать постоянно;
    • отметить папку, где будет сохранён документ;
    • отсканировать, нажав на кнопку запуска.

    Для того, чтобы быстро отсканировать и качественно распознать текст, картинку, PDF-файлы, нужно другое программное обеспечение. Хороша программа ABBYY FineReader.

    Может сохранять результаты сканирования в приложения:

    • Microsoft Word;
    • Excel;
    • PowerPoint;
    • Adobe Acrobat;
    • WordPerfect;
    • OpenOffice Writer.

    ABBYY FineReader имеет дружественный интерфейс, поддерживает около 200 языков и словарей.

    Более продвинутым пользователям, программа чтобы отсканировать документ на компьютер с принтера, позволяет воспользоваться вкладкой «настройки» и выбрать формат, цвет и качество.

    При стремлении получить фото хорошего качества надо пользоваться продуктом «VueScan».

    Принтер и многофункциональное устройство HP Deskjet 2130, Minolta, Nikon, Polaroid, Epson L210, Canon PIXMA MP 250, Canon i-SENSYS MF3010 хорошо дружат с этой программой.

    Преимущества:

    • — автоматически удаляет дефекты;
    • — подавляет зерно;
    • — позволяет сохранить файлы в raw file и работать с ними при выключенном устройстве;
    • — программа великолепно работает с негативами, слайдами, другими прозрачными изображениями.

    Особенности подключения различных марок оборудования

    Отсканировать документ на компьютер с принтера не составит труда, особенно если учесть особенности подключения. Очень много зависит от того, насколько хорошо компьютер видит принтер, копир, сканер, многофункциональные устройства.

    Как отсканировать документ на компьютер с принтера Canon: включить в сеть компьютер, принтер со сканером, установить необходимое программное обеспечение, открыть крышку сканера и положить на стеклянную поверхность документ и нажать «начать сканирование», при необходимости предварительно задав его параметры. Увидев результат на мониторе, нажать вкладку «импорт». Если документ-картинка, то этого достаточно, если — текс, то его надо распознать с помощью ABBYY FineReader, потом сохранить на компьютер.

    Как отсканировать документ на компьютер с принтера HP? Процедуры, которые надо выполнить не отличаются от особенностей работы с Canon. Но есть одна особенность: HP Deskjet 2130 — это струйное многофункциональное устройство, которое даёт возможность не только сканировать и копировать, но ещё содержит принтер. Имеется возможность цветной и фото печати. Скорость от 5,5 до 7,5 страниц в минуту. Всё зависит от бюджета, внешнего вида, от того какой нравится интерфейс. Отсканировать документ на компьютер с принтера Deskjet 2130 позволит та же программа, что и для Canon.

    Отсканировать при помощи Epson L210 можно этим отнюдь не бюджетным аппаратом, который великолепен как принтер и оставляет желать лучшего по своей способности отсканировать документ. По качеству сканирования фото, уступает HP.

    Если выбирать для дома или маленького офиса между MF3010 и Deskjet 2130 надо учесть, что изготовлены они оба из недорого пластика. Более эргономичные размеры MF3010, качество печати и сканирования, хуже, чем у Deskjet 2130, но лучше, чем у Sumsung.

    Для принятия решения в отношении покупки можно рассмотреть принтер PIXMA MP250, в котором новая технология изготовления чернильного сопла позволяет печатать документ и картинку без зернистости. Устройство MP250 быстро включается, может автоматически определить документ по формату, отсканировать и напечатать. Но в этом есть определённая опасность, когда на компьютер задан на печать 1 документ, может распечатать несколько.

    Хитрости сканирования

    Чтобы отсканировать документ надо знать маленькие нюансы:

    • — задать разрешение 300 dpi;
    • — рамкой выделить область, которую надо отсканировать;
    • — сохранять в формате tif или bmp, т. к. jpg имеет меньший формат.

    При сканировании фото обязательно пользуемся функцией предварительно просмотра, чтобы вовремя внести изменения. Ориентацию изображения можно выбрать любую, а вот разрешение определит качество картинки. Как сможет принтер передать этот чёткий и детальный снимок? Возможно ли отправить по почте это фото, или оно будет много весить и всё равно придется уменьшать размер файла? Ответив адекватно на эти вопросы, можно сэкономить своё время при сканировании фото.

    Для того, чтобы правильно выбрать принтер, надо понять для чего он необходим: для дома, офиса, школы, печатать фотографии, текстовые файлы, какой есть в наличии компьютер, какие требования к качеству. Каким он должен быть лазерным или струйным? В настоящее время есть компактный принтер, который имеет встроенный аккумулятор, его легко можно синхронизировать с планшетом, телефоном, ноутбуком через Wi-Fi. Мобильный принтер позволяет его хозяину не зависеть от постоянно изменяющихся обстоятельств нашей жизни.

    Компьютер в настоящее время можно выбрать игровой и профессиональный, для обычных повседневных нужд и серьёзных задач. Когда железо совместимо с привязанными к нему устройствами, жизнь владельца становится беззаботной и приятной.

    Источник:
    http://officeassist.ru/word/kak-skanirovat-s-printera-v-word/

    kak.manesu.com

    13.05.2019 admin Комментарии Нет комментариев

    Те люди, которые активно работают с документами и прочей текстовой информацией, однозначно видят необходимость в сканировании различных материалов. Важно помнить о том, что для получения качественных документов наличие сканера и вовсе не обсуждается. Однако в определенных ситуациях может сгодиться и фотография необходимого текста, однако снимок также должен отличаться высоким качеством.

    Как отсканировать документ в Word

    • В первую очередь происходит сканирование документа. Для этого дела лучше выбирать формат png или jpg. Размер изображения также должен быть внушительным (от 400 dpi), чтобы при распознавании не было никаких проблем.
    • Полученные изображения сохраняются в конкретном месте, после чего потребуется сама программа для распознавания текста. Лучше всего сделать выбор в пользу Adobe FineReader. Это универсальное программное обеспечение, которое по качеству своей работы не вызывает никаких нареканий. Важно отметить, что после установки данной программы соответствующая вкладка должна появиться и в MS Word, соответственно, использование функционала существенно упрощается.
    • Через Adobe FineReader нужно выбрать пункт меню «Файл» и «Открыть», выбираем необходимые изображения. Далее появится меню обработки изображения, нам необходимо выбрать язык, который используется в документе, а также некоторые другие опции, среди которых словари и прочие настройки (не столь важные для получения результата).
    • Нажимаем кнопку «Распознать» и ждем, пока процесс завершится. Вполне вероятно, что распознается далеко не все, поэтому те слова, которые программа не смогла определить, будут выделены другим цветом, их можно редактировать прямо в программе.
    • Если текст в самом отсканированном документе немного смещен, то в Adobe FineReader необходимо выбрать те или иные абзацы текста при помощи выделения. Это позволит не пропустить текст при распознавании.
    • В итоге нужно нажать на кнопку «Сохранить», после чего появляется возможность выбрать место сохранения документа, а также его формат. Конечно же, в случае с MS Word нужно выбирать расширение doc или docx.
    • Если перед сохранением оказывается, что документ разбит на несколько колонок, то необходимо выбрать меню «Формат», далее перейти в «Колонки» и выбрать «Одна», чтобы документ смотрелся просто и гармонично. Также в «Параметрах страницы» присутствует возможность настройки полей, отступов и шрифтов.


    В итоге документ можно свободно редактировать прямо в офисном пакете MS Office. Важно отметить, что при распознавании документа прямо в Word, форматирование происходит еще проще, так как функционал единый, как для исходных документов, так и для распознаваемых.

    Что касается распознавания с фотографий или других материалов, то здесь не так уж просто получить высокое качество распознавания, так как речь идет о смещенных полях, отступах и прочих деталях документов, на исправление которых придется потратить немало времени.

    Сканирование в Microsoft Word

    С помощью стартового окна вы можете создавать документы Word при помощи сканера или фотоаппарата.

    1. На закладке Сканировать нажмите Сканировать в Microsoft Word.
    2. Выберите устройство и задайте параметры сканирования.
    3. Нажмите кнопку Просмотр или в любом месте области сканирования.
    4. Просмотрите полученное изображение, при необходимости измените параметры и снова нажмите Просмотр.
    5. Укажите настройки выбранного формата.Внешний вид и свойства полученного документа будут зависеть от выбранных вами настроек.
    1. Сохранять форматирование. Выбор режима сохранения форматирования зависит от того, как вы будете использовать созданный документ в дальнейшем:
    • Точная копияВозможность редактирования выходного документа ограничена, но при этом максимально точно сохраняется внешний вид документа.
    • Редактируемая копияОформление выходного документа может незначительно отличаться от оригинала. Полученный документ легко редактируется.
    • Форматированный текстСохраняются только шрифты, их размеры и начертание, разбиение на абзацы. Полученный документ содержит сплошной текст, записанный в одну колонку.
    • Простой текстСохраняется только разбиение на абзацы. Весь текст форматируется одним шрифтом и располагается в одной колонке.
  • Языки распознавания — необходимо правильно указать языки документа. Подробнее см. «Языки распознавания».
  • Сохранять картинки — отметьте эту опцию, если вы хотите сохранять иллюстрации в полученном документе.
  • Сохранять колонтитулы и номера страниц — в полученном документе будут сохранены колонтитулы и номера страниц.
  • Настройки предобработки изображений… — вы можете задать настройки обработки файлов изображений, включая определение ориентации страницы и автоматическую обработку изображений. Эти настройки позволяют значительно улучшить исходное изображение и получить более точные результаты конвертации. Подробнее см. «Параметры обработки изображений».
  • Другие настройки… — позволяет открыть Настройки форматов на закладке DOC(X)/RTF/ODT диалога Настройки (меню Инструменты > Настройки…) и задать дополнительные настройки.
  • Нажмите Сканировать в Microsoft Word.
  • После запуска на экране появится панель выполнения задачи, содержащая индикатор выполнения и подсказки.
  • После завершения сканирования текущей страницы на экране появится диалог выбора дальнейшего действия. Нажмите Сканировать снова, чтобы запустить процесс сканирования следующих страниц с текущими настройками, или Завершить сканирование, чтобы закрыть диалог.
  • Укажите папку для сохранения полученного Word-документа.

    По завершении задачи документ Microsoft Word будет создан в указанной папке. Кроме того, все изображения будут добавлены в OCR-редактор и доступны для обработки.

    Загрузка и сканирование

    Для запуска процесса:

    Данная программа автоматом выделит фрагменты документа, рисунки и таблицы, при необходимости повернет сканированный текст по нужному направлению. После завершения сканирования, в данной программе требуется выбрать язык для расшифровки написанного.Выбрать его можно в выпадающем окне «Язык документа», если загруженный скан будет написан на нескольких иностранных языках – следует выбрать автоматический режим.

    Источник:
    http://kak.manesu.com/kak-vstavit-skan-v-vordovskij-dokument/

    Как отсканировать документ и распознать его в MS Word

    Если Вы выбрали быстрый путь написания теоретической главы, о котором мы говорили в параграфе 2.1., вероятней всего Вам не обойтись без сканирования документов. В ином случае, этот пункт можете пропустить и начинать конспектировать материалы найденные в библиотеке.

    Перед началом сканирования нужно определиться, что именно Вы хотите использовать при написании работы. А для этого нужно сначала просмотреть имеющуюся литературу и выделить карандашом нужные моменты.
    Когда я впервые сканировал статью из журнала для своей первой курсовой, для меня это занятие было невообразимо сложным. В результате нескольких часов работы со сканером и FineReader’ом у меня на выходе вышла бредятина, не поддающаяся редактированию. В итоге пришлось все набирать руками. Чтобы у Вас не случилось подобного, рассмотрим подробнее все технические моменты сканирования.

    Для сканирования вам понадобится:

    • Книга или журнал, который нужно отсканировать
    • Компьютер с установленным FineReader’ом
    • Качественный сканер

    Сканер не обязательно покупать. Можно, например, взять на время у товарища. Я пользуюсь сканером CanoScan Lide 60. Это хоть и не самая новая модель, но мне очень нравится этот компактный, быстрый и удобный в работе “девайс”. Если Вы взяли на время сканер, для того чтобы он работал нужно сначала установить программу-драйвер. Драйвера и руководство по установке всегда можно найти на установочном диске, который прилагается к устройству или скачать на сайте у производителя. После установки драйвера, подключите сканер к компьютеру с помощью соединительного шнура. Теперь можно уже непосредственно приступить к сканированию.

    Но сначала немного теории. Вы должны знать, что процесс сканирования состоит из двух этапов:

    1. Непосредственно сканирование документа. На этом этапе сканнер как бы фотографирует поверхность сканируемого документа и сохраняет полученное изображение на компьютер в виде обычного файла .jpg .gif или в другом формате;

    2. Распознавание документа. Это процесс преобразования текста из изображения сделанного сканером в обычный тест, который потом можно сохранить в Word и редактировать. Распознавание осуществляется без участия сканера, с помощью специальной программы (самая популярная Adobe FineReader). Таким образом, Вы можете сначала отсканировать несколько листов текста и сохранить их в виде изображения и только потом преобразовывать в текст.

    Итак, начнем этап первый – сканирование:

    Запускаем драйвер сканера:

    Пуск – Все программы – Canon – ScanGear (название драйвера я указываю для своего сканера). Появится окно драйвера:

    Открываем крышку сканера и кладем книгу. Книгу, журнал или что у вас там есть нужно класть текстом вниз, как можно ровнее по отношению к краям рабочей поверхности сканера:

    Очень важно сделать так, чтобы крышка сканера как можно плотнее прижимала сканируемый документ, не допуская попадания внешнего освещения не рабочую поверхность сканера, которая соприкасается с документом.

    Выполним необходимые установки в драйвере сканера.

    Первым делом нужно установить разрешение, в котором будет отсканирован документ. Разрешение – это показатель, который определяет уровень детализации объекта при сканировании и определяется в точках на дюйм (dpi, или т/д). Чем больше разрешение, тем качественнее получается изображение. Но, при сканировании текстовых документов нет смысла устанавливать максимальное разрешение, поскольку толку от этого будет ноль. Кроме того, сканирование с большим разрешением занимает больше времени. Я рекомендую устанавливать разрешение в пределах 400-500 т/д (dpi). При такой настройке изображения получаются достаточно качественными для хорошего их распознания, а сам процесс сканирования не занимает много времени. Посмотрите скриншот установок моего сканера:

    Для начала нужно перейти в “Расширенный режим”. Источником всегда будет “Планшет” (планшетный сканер). Цветной режим лучше установить “Черно-белый”, ведь для сканирования текста нам цвета не нужны, а это уменьшит размер изображений на выходе. Разрешение, как я уже сказал, следует установить 400 т/д. Выходной размер изображения – обязательно “А4”. Теперь можно смело жать на кнопку “Сканировать”. Мой сканер устроен таким образом, что сначала запоминает отсканированные изображения во внутренней памяти, и только при закрытии окна драйвера предлагает сохранить их на компьютер. Мне остается только указать место, куда будут сохранены результаты работы.

    У вас должны получаться файлы такого типа:

    При увеличении такого изображения должен быть отчетливо виден текст.

    Второй этапраспознание полученных изображений и их преобразование в текст. Как я уже говорил, для этого понадобится специальная программа – FineReader. Скачайте программу по этой ссылке (72Мб). Чтобы скачать нажмите на стрелочку в правом верхнем углу окна. Распакуйте архив и в папке afr_lrp найдите файл – ABBYY FineReader 12.0.101.exe. Двойной клик на этом файле запустит установку программы на вашем компьютере. Эта версия программы достаточно новая. Все скриншоты ниже я делал используя более старую версию, поэтому интерфейс программы будет немного отличаться от скриншотов. Учтите это при изучении данной инструкции.

    Окно FineReader имеет следующий вид:

    После установки языка, на котором напечатаны отсканированные Вами ранее документы, можно начинать распознание. Если в тексте присутствует сразу два языка (например, русский и английский) установку сделайте соответственно.

    Чтобы начать распознание нажмите на стрелку справа от первой кнопки Сканировать – а затем – Открыть изображение:

    Откроется окно выбора изображений. Откройте папку в которую Вы сохранили отсканированные изображения, нажмите CTRL + A (английское) на клавиатуре и нажмите на кнопку Открыть.

    После этого слева в окне FineReader’а появятся эскизы добавленных файлов, по центру – на данный момент выделенный эскиз в увеличенном виде, снизу – еще большее увеличение, а справа результат распознания:

    Для примера я взял всего два изображения. На скриншоте выше выделено первое из них, его сейчас и распознаем. Как видите, изображение отсканировано вертикально, чтобы распознать текст снимок нужно сначала развернуть на 90 градусов. Для этого воспользуемся кнопками и . Следующим шагом нужно указать программе, какую именно часть изображения нужно распознать, а также задать тип данных, которые должны получиться на выходе текст, таблица или изображение. Для этого существуют кнопки, соответственно: . Например, если нужно отметить текстовый блок, нажимаем левой кнопкой на , после этого нажимаем левой кнопкой мышки в левом верхнем углу текстового блока и, удерживая левую кнопку, перетягиваем в правый нижний угол. Для примера я полностью подготовил к распознанию одно изображение:

    Как видите, все текстовые блоки в примере выше выделены зеленым, а рисунки – красным. Таблицы подготавливаются к распознанию аналогично. Для этого предназначена кнопка . Для того, чтобы перейти к следующему снимку, кликните левой кнопкой мыши на его эскизе слева. Таким образом подготавливаются к распознанию все полученные в результате сканирования изображения. После того, как подготовка изображений завершена, следует выделить их все. Для этого кликните левой кнопкой в пустом месте на панели эскизов (она называется Пакет) и нажмите Ctrl+A (английское) на клавиатуре. Далее кликните на кнопку и подождите пока FineReader преобразует изображения в текст. После этого можно сохранять полученный текст в Word с помощью кнопки , после нажатия на которую откроется окно Мастер сохранения результатов. В нем необходимо выбрать формат для сохранения – Microsoft Word, а также поставить отметку чтобы сохранились все страницы:

    После нажатия кнопки ОК программа создаст документ Word и вставит в него текст из распознанных страниц в том порядке, в котором они находятся на панели эскизов (Пакет). Полученный документ сразу же сохраните в папку в файловой структуре дипломной работы и можете приступать к редактированию. Как это делается, описано в моем бесплатном курсе.

    И последний момент. Эсли Вы сканировали газету или журнал, текст там часто дается в виде колонок (как в рассматриваемом примере выше). Эти колонки в Ворде нужно преобразовать в одну. Выделите текст в виде колонок и выполните команду: Формат – Колонки – Одна – ОК. Только после этого можно ставить Книжную ориентацию в Параметрах страницы, отступы полей, шрифт и т.д.

    Источник:
    http://diplomguide.ru/teoriya/skanirovanie.html