Экономическая информатика-стр.468

При работе с Интернетом проблема усугубилась тем, что символы кириллицы кодировались третьим способом, с помощью кодовой таблицы KOI8 (или KOI8-R), традиционно используемой в компьютерах, работающих под управлением операционной системы Unix. Поскольку первоначально серверы Интернета строились исключительно на основе Unix, то и русскоязычные тексты кодировались только с помощью KOI8-R. В результате русскоязычный текст в Интернете выглядит сплошной абракадаброй, если воспроизводится в кодировке, отличной от той, в которой он был первоначально создан. И пока, к сожалению, такая ситуация остается широко распространенным явлением при работе со всеми ресурсами Интернета (WWW, E-mail, конференции). При работе в WWW эта проблема решается с помощью размещенных на экране кнопок, позволяющих повторно вывести страницу документа в другой кодировке.

Проблемы с кириллическими текстами остаются и при попытке их сохранения, например, для дальнейшей автономной (вне Интернета) работы с ними. Так, сохранение WWW- страниц возможно двумя способами:

1)    сохранение в том же формате HTML, в каком он существовал в Интернете. В этом случае просматривать и редактировать такой файл можно теми же программными средствами, которые обеспечивали его просмотр при работе непосредственно в Интернете, или другими специальными редакторами, ориентированными на работу с форматом HTML. Правда, начиная с Office 97, работа с такими файлами упрощается, поскольку Word 97 может работать в HTML-формате. При указанном способе сохранения не очень важно, в какой кодировке (866,1251, KOI8-R) готовился документ;

2)    сохранение документа в виде обычного текстового файла. В этом случае сохраняется текстовая информация без каких-либо элементов форматирования. Документ сохраняется в кодах ASCII, если он был создан с помощью кодовых страниц 866 или 1251 (в DOS или Windows). Такой документ может быть прочитан и отредактирован как в DOS, так и в Windows. Однако при его перекодировке в момент загрузки в Word в качестве способа перекодировки следует указывать «Только текст», а не «Текст DOS».