Преобразование HTML-файла в текстовый документ MS Word

Преобразование HTML-файла в текстовый документ MS Word

HTML является стандартизированным языком гипертекстовой разметки на просторах интернета. Большая часть страниц во всемирной паутине содержат описание разметки, выполненное на HTML или XHTML. При этом, у многих пользователей возникает необходимость перевести HTML-файл в другой, не менее популярный и востребованный стандарт — текстовый документ Microsoft Word. О том, как это сделать, читайте далее.

Существует несколько методов, с помощью которых можно конвертировать HTML в Word. При этом, отнюдь не обязательно скачивать и устанавливать сторонний софт (но и такой способ тоже имеется). Собственно, мы расскажем обо всех доступных вариантах, а то, каким из них воспользоваться, решать только вам.

Открытие и пересохранение файла в текстовом редакторе

Текстовый редактор от Майкрософт может работать не только с собственными форматами DOC, DOCX и их разновидностями. На деле, в этой программе можно открывать и файлы совершенно других форматов, в их числе и HTML. Следовательно, открыв документ этого формата, его можно будет пересохранить в том, который вам нужен на выходе, а именно — DOCX.

1. Откройте папку, в которой находится HTML-документ.

2. Кликните по нему правой кнопкой мышки и выберите «Открыть с помощью»«Word».

3. HTML-файл будет открыт в окне Ворда точно в том же виде, в котором он бы отображался в HTML-редакторе или во вкладке браузера, но не на готовой веб-странице.

Примечание: Все теги, которые есть в документе, будут отображаться, но не будут выполнять своей функции. Все дело в том, что разметка в Ворде, как и форматирование текста, работает совсем по иному принципу. Вопрос лишь в том, нужны ли вам эти теги в конечном файле, а проблема в том, что убирать их все придется вручную.

4. Поработав над форматированием текста (если это необходимо), сохраните документ:

    Откройте вкладку «Файл» и выберите в ней пункт «Сохранить как»;

Измените имя файла (опционально), укажите путь для его сохранения;

  • Самое важное — в выпадающем меню под строкой с именем файла выберите формат «Документ Word (*docx)» и нажмите кнопку «Сохранить».
  • Таким образом вы сумели быстро и удобно преобразовать файл формата HTML в обычный текстовый документ программы Ворд. Это лишь один из способов, но отнюдь не единственный.

    Использование программы Total HTML Converter

    Total HTML Converter — это простая в использовании и очень удобная программа для конвертирования файлов HTML в другие форматы. В числе таковых электронные таблицы, сканы, графические файлы и текстовые документы, в том числе и так необходимый нам Word. Небольшой недостаток заключается лишь в том, что программа конвертирует HTML в DOC, а не в DOCX, но это уже можно исправить и непосредственно в Ворде.

    Узнать более подробно о функциях и возможностях HTML Converter, а также скачать ознакомительную версию этой программы можно на официальном сайте.

    1. Загрузив программу на свой компьютер, установите ее, внимательно следуя инструкции инсталлятора.

    2. Запустите HTML Converter и, используя встроенный браузер, расположенный слева, укажите путь к HTML-файлу, который вы хотите преобразовать в Word.

    3. Установите галочку напротив этого файла и нажмите на панели быстрого доступа кнопку со значком документа DOC.

    Примечание: В окне справа вы можете увидеть содержимое файла, который вы собираетесь преобразовать.

    4. Укажите путь для сохранения преобразуемого файла, если это необходимо, измените его имя.

    5. Нажав «Вперед», вы перейдете к следующему окну, где можно выполнить настройки конвертирования

    6. Снова нажав «Вперед», вы можете выполнить настройки экспортируемого документа, но лучше будет оставить там значения по умолчанию.

    7. Далее можно задать размеры полей.

    8. Перед вами появится долгожданное окно, в котором уже и можно будет начать конвертирование. Просто нажмите кнопку «Начать».

    9. Перед вами появится окно об удачном завершении преобразования, автоматически будет открыта папка, которую вы указали для сохранения документа.

    Откройте конвертированный файл в программе Microsoft Word.

    Если это требуется, отредактируйте документ, уберите теги (вручную) и пересохраните его в формате DOCX:

    • Перейдите в меню «Файл»«Сохранить как»;
    • Задайте имя файла, укажите путь для сохранения, в выпадающем меню под строкой с именем выберите «Документ Word (*docx)»;
    • Нажмите кнопку «Сохранить».

    Помимо конвертирования HTML-документов, программа Total HTML Converter позволяет перевести веб-страницу в текстовый документ или любой другой, поддерживаемый формат файлов. Для этого в главном окне программы достаточно просто вставить в специальную строку ссылку на страницу, а затем приступить к ее конвертированию аналогично тому, как это описано выше.

    Мы рассмотрели еще один возможный метод преобразования HTML в Ворд, но и это не последний вариант.

    Использование онлайн-конвертеров

    На безграничных просторах интернета есть немало сайтов, на которых можно конвертировать электронные документы. Возможность перевести HTML в Ворд на многих из них тоже присутствует. Ниже представлены ссылки на три удобных ресурса, просто выберите тот, который вам больше понравится.

    Рассмотрим методику преобразования на примере онлайн-конвертера ConvertFileOnline.

    1. Загрузите HTML-документ на сайт. Для этого нажмите виртуальную кнопку «Выберите файл», укажите путь к файлу и нажмите «Открыть».

    2. В окне ниже выберите формат, в который требуется преобразовать документ. В нашем с вами случае это MS Word (DOCX). Нажмите кнопку «Конвертировать».

    3. Начнется преобразование файла, по завершению которого будет автоматически открыто окно для его сохранения. Укажите путь, задайте имя, нажмите кнопку «Сохранить».

    Теперь вы можете открыть конвертированный документ в текстовом редакторе Майкрософт Ворд и выполнить с ним все те манипуляции, которые можно делать с обычным текстовым документом.

    Примечание: Файл будет открыт в режиме защищенного просмотра, более детально о котором вы можете узнать из нашего материала.

    Для отключения режима защищенного просмотра просто нажмите кнопку «Разрешить редактирование».

      Совет: Не забудьте сохранить документ, закончив работу с ним.

    Вот теперь уж мы точно можем закончить. Из этой статьи вы узнали о трех различных методах, с помощью которых можно быстро и удобно преобразовать HTML-файл в текстовый документ Word, будь то DOC или DOCX. То, какой из описанных нами методов выбрать, решать вам.

    Источник:
    http://lumpics.ru/how-to-convert-html-to-word/

    Как сделать сайт в ворде (Word)

    Как сделать сайт в ворде

    Как сделать сайт в ворде (Word)

    Первая моя попытка сделать сайт была выполнена именно в ворде.
    Проблема была скорее не как сделать сайт, а на какую тему сделать.
    Ниже мы рассмотрим все вопросы, которые связаны с созданием сайта в ворд.

    Что нужно делать, чтобы создать сайт

    1. Запускам Word.

    2. Создаем меню.
    Можно сделать так: Главная | Моя музыка | О сайте

    Для этого, нажимаем «Вставка» — «Гиперссылка»
    В появившемся окне в поле «Текст» пишем текст нашей ссылки – например «О сайте», в поле «Адрес» пишем текстом index1.htm,

    Читайте также  Расходная накладная

    Добавив текст, мы вставляем гиперссылки на старницу сайта

    Для других страниц пишем другие имена страниц — index2.htm, index3.htm, index4.htm или o-saite.htm, moia-musika.htm.

    3. Ниже меню печатаем основной текст.

    5. Сохраняем полученную страницу, нажимаем «Файл» — «Сохранить как», а далее очень важно, выбираем имя файла index, а тип файла htm – НЕ ОДНИМ ФАЙЛОМ.

    Сохраняем полученную страницу сайта

    Теперь точно так же, нужно создать и другие веб страницы на которые мы ссылались иначе если мы откроем сохраненную страничку в браузере и нажмем на ссылку, то ничего не откроется – только будет сообщение о ошибке.

    Обратите внимание, если вы добавляли картинки, то вместе с веб страницей появится еще и папка images – в ней все вставленные вами рисунки.

    Рекомендации

    Вобщем ничего сложного, если не учитывать, что так создавать не правильно.
    Не пытайтесь так делать, изучайте HTML, в крайнем случае воспользуйтесь бесплатным шаблоном и программой FrontPage.
    Веб страница созданная в ворде будет напичкана лишними тегами, вес ее будет больше, а отображение в браузере не всегда такое же, как в документе.

    Спасибо за внимание.
    Автор: Титов Сергей

    Сообщения по теме:

    Комментарии (5)

    1. yorik616 06.12.2009 #

    делаю всё также но почему то все рисунки и фото в итоге не отображаются. виден только фон и гиперссылки

    yorik616: возможно просто не верно указали путь к рисункам…
    например программа ищет рисунок по адресу C:/images/55.jpg
    а рисунка там нет, он может в другом месте…
    но я вообще не советовал бы делать так сайт — пробуйте другие варианты, например почитайте советы по HTML — http://www.lamer-stop.ru/category/delaem-sajt/uroki-html/.

    Если нет фронтпейджа то скачайте HtmlReader по функциям очень похоже и бесплатно.

    Ну, сделал, понятно, напихал страниц — тоже понятно. А как его отправить в сеть, чтобы эта папочка размещалась там и открывалась по определенному адресу, а не с компа создателя?

    Источник:
    http://www.lamer-stop.ru/2009/08/05/kak-sdelat-sajt-v-word.html

    Статьи из блога

    Стандартные средства преобразования документов Word в формат HTML позволяют достаточно легко создавать Web-странички. Однако здесь есть и большой минус: в файл записывается очень много совершенно ненужной информации.

    шзбавиться от этого и получить на выходе более легкий и правильный HTML-файл можно с помощью настроек Word и/или специальных программ.

    С помощью функций редактора Word:

    Зайдите в меню Сервис и выберите команду Параметры. В диалоговом окне перейдите на вкладку Общие.

    Кликните на кнопку Параметры веб-документа. Откроется одноименное диалоговое окно, в котором на вкладке Обозреватели нужно выбрать браузер самой младшей версии, а в окне Параметры снять все галочки. Нажмите ОК и закройте диалоговые окна.

  • При сохранении документа Word выберите команду Сохранить как веб-страницу и в поле Тип файла выберите формат Веб-страница с фильтром (*.htm, *.html).
  • Тем, у кого установлен Word 2000, на сайте Microsoft.com можно скачать HTML-фильтр — инструмент для удаления тегов разметки Office из документов Office 2000, сохраненных в формате HTML.

    Однако, получившийся файл все равно будет еще содержать массу тегов, стилей. Здесь на помощь придут специализированные программы.

    Во-первых, это рекомендованный Microsoft пакет макросов Перестройка 2000/2002. Можно скачать пакет применительно к используемой вами версии редактора Word. В этот пакет макросов входит и конвертор документов Word в HTML. Более подробно об этой программе я ничего сказать не могу, поскольку автор сразу предупреждает о том, что в Word 2003 этот пакет работать не будет. А пробовать и устанавливать весь пакет ради одной единственной функции я не посчитал нужным. Если кто-то тестировал этот пакет макросов, то прошу высказаться в комментариях или в письме.

    Во-вторых, есть интересная утилита — WordCleaner от ирландской компании Zapadoo. С ее помощью можно достаточно быстро преобразовать одиночный документ или целую группу документов Word в HTML-файлы с более-менее чистым кодом.

    Причем, утилита конвертирует в HTML не только «вордовские» *.doc-файлы, но может также преобразовывать rtf-файлы и txt-файлы, а также очищать уже переконвертированные html-файлы.

    Для новичков предусмотрен пошаговый режим конврертирования, так называемый Wizard.

    Утилита встраивается в контекстное меню, вызываемое щелчком по файлу правой кнопкой мыши, а также создает свою панель и помещает ее в Word.

    Я протестировал эту программу на нескольких файлах и могу подтвердить хороший результат ее работы. Правда, мне показалось, что с таблицами она не очень хорошо справляется, а в целом ее можно только порекомендовать тем, кому частенько требуется осуществлять подобные конвертирования.

    Отлично распознала таблицы и очистила файл от тонны мусора из лишних тегов третья программка, которую я хочу порекомендовать — HTML Cleaner.

    Программа написана на языке Java, и исполняемый файл имеет расширение .jar. Для работы программы необходимо, чтобы на компьютере был установлен Java Run-time Environment (Java 2 RTE), версии не меньше 1.4.

    Работает утилитка очень просто: достаточно нажать кнопку Select и выбрать нужный файл (в формате HTM, HTML) для преобразования. То есть, файл уже должен быть ранее преобразован в HTML-формат из Word-a. На выходе получается очень компактный и чистый html-код.

    Если вы знаете какие-нибудь другие полезные утилиты или сервисы конвертирования документов Word в формат HTML, то прошу вас поделиться своими знаниями и впечатлениями.

    Источник:
    http://wordexpert.ru/page/kak-preobrazovat-dokument-word-doc-v-format-html