Как исправить отображение кириллицы или кракозябры в windows 10

Изменение кодовых страниц для исправления иероглифов Виндовс 10

Кодовые страницы являются таблицами, в которых определенные символы сопоставляются определенным байтам, а отображение кириллицы в качестве кракозябров в Windows 10 связано с установкой по умолчанию не той кодовой страницы. Это исправляется различными способами, которые будут полезными, когда нужно в параметрах не изменять системный язык.

Редактор реестра

К первому способу относится использование редактора реестра. Это будет наиболее щадящим методом для системы, тем не менее, лучше создать точку восстановления перед началом работы.

  1. Нажимаем клавиши «Win+R», затем следует ввести regedit и подтвердить Enter. Будет открыт реестровый редактор.
  2. Переходим к меню HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\Control\Nls\CodePage, а в правой части нужно пролистать значения до конца данного раздела.

Теперь кликаем дважды по параметру ACP, где устанавливаем значение 1251 (для кириллицы это кодовая страницы), нажимаем «Ок» и закрываем реестровый редактор.

Перезагружаем компьютер (нужна именно перезагрузка, а не простое завершение работы). Для Виндовс 10 это имеет значение.

Зачастую это обеспечивает исправление проблемы с неправильным отображением букв на русском языке. Вариация способа с использованием реестрового редактора (менее предпочтительная) – узнать текущее значение ACP параметра (часто – 1252 для изначально установленной англоязычной системы). Потом в данном разделе нужно отыскать значение параметра 1252 и заменить его с c_1252.nls на такое c_1251.nls.

Изменение на c_1251.nls файла кодовой страницы

Данный способ подойдет для тех пользователей, кто считает вариант с правкой реестра достаточно опасным или сложным. Здесь необходимо осуществить подмену файла кодовой страниц по пути C:\Windows\System32. В данном случае предполагается, что используется кодовая страница западно-европейской версии – 1252. Узнать, какая текущая кодовая страницы, можно с помощью параметра ACP в реестре, аналогично предыдущему способу.

  1. Переходим по пути C:\Windows\System32, где следует найти файл c_1252.NLS. По нему нужно кликнуть правой кнопкой мыши, чтобы выбрать меню «Свойства» и открыть вкладку «Безопасность». Там нужно нажать на «Дополнительно».

В разделе «Владелец» кликаем на «Изменить».

Теперь будет открыт раздел «Безопасность» в меню свойства файла. Кликаем по кнопке «Изменить».
Выбираем раздел «Administrators» (Администраторы) и включаем для них полный доступ. Щелкаем на «Ок» и подтверждаем осуществленные изменения разрешений. Кликаем по «Ок» в свойствах файла.

Теперь задача переименовать файл c_1252.NLS. Изменить расширение можно на .bak, чтобы файл не был потерян.
Путем удержания клавиши Ctrl, нужно перетащить файл c_1251.NLS (для кириллицы кодовая страница) располагающийся в C:\Windows\System32 в иное место данного окна проводника, чтобы была создана копия файла.

Переименовываем сделанную копию c_1251.NLS в новую c_1252.NLS.
Перезагружаем компьютер.

После выполнения перезагрузки компьютера, в Windows 10 кириллица будет отображаться не как кракозяблы, а в виде русских букв.

Исправляем отображение русских букв в Windows 10

Существует два способа решения рассматриваемой проблемы. Связаны они с редактированием настроек системы или определенных файлов. Они отличаются по сложности и эффективности, поэтому мы начнем с легкого. Если первый вариант не принесет никакого результата, переходите ко второму и внимательно следуйте описанным там инструкциям.

Способ 1: Изменение языка системы

В первую очередь хотелось бы отметить такую настройку как «Региональные стандарты». В зависимости от его состояния и производится дальнейшее отображение текста во многих системных и сторонних программах. Редактировать его под русский язык можно следующим образом:

  1. Откройте меню «Пуск» и в строке поиска напечатайте «Панель управления». Кликните на отобразившийся результат, чтобы перейти к этому приложению.

Среди присутствующих элементов отыщите «Региональные стандарты» и нажмите левой кнопкой мыши на этот значок.

Появится новое меню с несколькими вкладками. В данном случае вас интересует «Дополнительно», где нужно кликнуть на кнопку «Изменить язык системы…».

Корректировки вступят в силу только после перезагрузки ПК, о чем вы и будете уведомлены при выходе из меню настроек.

Дождитесь перезапуска компьютера и проверьте, получилось ли исправить проблему с русскими буквами. Если нет, переходите к следующему, более сложному варианту решения этой задачи.

Способ 2: Редактирование кодовой страницы

Кодовые страницы выполняют функцию сопоставления символов с байтами. Существует множество разновидностей таких таблиц, каждая из которых работает с определенным языком. Часто причиной появления кракозябров является именно неправильно выбранная страница. Далее мы расскажем, как править значения в редакторе реестра.

  1. Нажатием на комбинацию клавиш Win + R запустите приложение «Выполнить», в строке напечатайте regedit и кликните на «ОК».
  2. В окне редактирования реестра находится множество директорий и параметров. Все они структурированы, а необходимая вам папка расположена по следующему пути:

Выберите «CodePage» и опуститесь в самый низ, чтобы отыскать там имя «ACP». В столбце «Значение» вы увидите четыре цифры, в случае когда там выставлено не 1251, дважды кликните ЛКМ на строке.

Двойное нажатие левой кнопкой мыши открывает окно изменения строковой настройки, где и требуется выставить значение 1251 .

Если же значение и так уже является 1251, следует провести немного другие действия:

  1. В этой же папке «CodePage» поднимитесь вверх по списку и отыщите строковый параметр с названием «1252» Справа вы увидите, что его значение имеет вид с_1252.nls. Его нужно исправить, поставив вместо последней двойки единицу. Дважды кликните на строке.

Откроется окно редактирования, в котором и выполните требуемую манипуляцию.

После завершения работы с редактором реестра обязательно перезагрузите ПК, чтобы все корректировки вступили в силу.

Подмена кодовой страницы

Некоторые пользователи не хотят править реестр по определенным причинам либо же считают эту задачу слишком сложной. Альтернативным вариантом изменения кодовой страницы является ее ручная подмена. Производится она буквально в несколько действий:

  1. Откройте «Этот компьютер» и перейдите по пути C:WindowsSystem32 , отыщите в папке файл С_1252.NLS, кликните на нем правой кнопкой мыши и выберите «Свойства».

Переместитесь во вкладку «Безопасность» и найдите кнопку «Дополнительно».

Вам нужно установить имя владельца, для этого кликните на соответствующую ссылку вверху.

В пустом поле впишите имя активного пользователя, обладающего правами администратора, после чего нажмите на «ОК».

Вы снова попадете во вкладку «Безопасность», где требуется откорректировать параметры доступа администраторов.

Выделите ЛКМ строку «Администраторы» и предоставьте им полный доступ, установив галочку напротив соответствующего пункта. По завершении не забудьте применить изменения.

Вернитесь в открытую ранее директорию и переименуйте отредактированный файл, поменяв его расширение с NLS, например, на TXT. Далее с зажатым CTRL потяните элемент «C_1251.NLS» вверх для создания его копии.

Нажмите на созданной копии правой кнопкой мыши и переименуйте объект в C_1252.NLS.

Вот таким нехитрым образом происходит подмена кодовых страниц. Осталось только перезапустить ПК и убедиться в том, что метод оказался эффективным.

Как видите, исправлению ошибки с отображением русского текста в операционной системе Windows 10 способствуют два достаточно легких метода. Выше вы были ознакомлены с каждым. Надеемся, предоставленное нами руководство помогло справиться с этой неполадкой.

Как решить проблему

Важно понимать, что как правило проблемы возникают именно с русским языком. Т.е

с английским и другими языками на латинице проблем не возникает. Дело в том, что русский язык – это кириллица. Поэтому решать проблему будем с кириллицей, а не столько с русскими буками. Учтите, что далеко не все утилиты поддерживают этот язык, и дело как раз в кодировке. Однако, если утилита официальная, популярная и современная, то любые трудности с отображением текста – это явная проблема, с которой нужно бороться.

Первым делом нужно проверить настройки компьютера. Для этого зайдите в «Панель управления». Для этого правым кликом мышки на Пуск вызовите диалоговое меню, в котором будет соответствующий пункт.

После этого откроется окно, в котором вам нужно изменить ражим «Просмотр» на «Категория», и дальше выбрать пункт «Часы, язык, регион».

Откроется новое окно, где нужно выбрать «Региональные стандарты».

Не смотрите на то, что здесь настраиваются часы и время, вам нужно перейти в раздел «Дополнительно», где вы сможете найти необходимый пункт про отображение необходимой локали отображения символов в операционной системе. Это именно то, что вам нужно.

В новом окне найдите пункт «Язык программ, не поддерживающих Юникод». На этой странице вам нужно найти пункт «Изменить язык системы».

Кликаем на пункт выше, и в новом окне выбираем вариант «Русский (Россия)».

Не пугайтесь, сразу после выбора или смены вы увидите оповещение о том, что ваш ПК будет перезагружен. Единственное, что вы можете сделать – отменить изменения, вернуться к ним позже или перезагрузить устройство прямо сейчас. Выбирайте опцию, которая более комфортна вам по душе.

После того, как ваш компьютер был перезагружен, попробуйте запустить  тот софт, который ранее выдавал проблему. Скорее всего, ситуация изменится кардинальным образом.  И вы увидите уже русские буквы, на крайний случай английские. Например вот так:

Это самый простой метод, пусть он таковым и не выглядит. Учтите, что система может потребовать от вас внести некоторые изменения в реестр в ручном режиме. Вы можете это сделать даже без специальных знаний в компьютерах. Поэтому попробуйте проделать следующие шаги, описанные ниже.

Откройте любой бесплатный текстовый редактор. Подойдет даже Блокнот, а вот Word – не самый удачный выбор, так как этот редактор зачастую меняет структуру кода, и в результате ниже описанный метод либо вовсе не будет работать, либо сработает но не так.

Далее в текстовом редакторе создайте пустой файл, которому выдадите разрешение .reg. Это разрешение соответствует разрешению реестра Windows 10. Сам файл далее дополним следующей информацией:

Windows Registry Editor Version 5.00

«ARIAL»=dword:00000000

«Arial,0″=»Arial,204»

«Comic Sans MS,0″=»Comic Sans MS,204»

«Courier,0″=»Courier New,204»

«Courier,204″=»Courier New,204»

«MS Sans Serif,0″=»MS Sans Serif,204»

«Tahoma,0″=»Tahoma,204»

«Times New Roman,0″=»Times New Roman,204»

«Verdana,0″=»Verdana,204»

Сохраняемся

У файла может быть любое имя, важно, чтобы у него было указанное выше разрешение. Далее, после того как внутри файла оказалась приведенная выше информация, вам нужно внести изменения в реестр

Для этого используйте простую методику – кликните по файлу таким образом, как будто хотите его открыть. Но не в текстовом редакторе, а именно запустить. Для этого потребуется отменить «Программу по умолчанию» в виде редактора, если вы выбрали редактор.

ОС уточнит у вас, если вы хотите внести изменения в реестр своего компьютера. Соглашайтесь. Конечно, тем, кто переживает больше обычного, можем порекомендовать сделать резервную копию реестра. Для этого опять же не потребуется никаких специальных знаний. Можете использовать CCleaner, чтобы создать копию или резервный файл.

Надеемся, теперь кракозябры и иероглифы на Windows 10 вместо букв если и не перестанут появляться, то вы теперь хотя бы знаете, как с ними бороться. Учтите, что в некоторых случаях виноват все же разработчик утилиты, и даже если вы проделаете все, что описано выше, то все равно не придете к нужному результату. В этом случае, вам лучше скачать другой дистрибутив, возможно не на русском, а на английском. Также можете попробовать запуститься в безопасном режиме, и проверить если там ПО работает как надо. Если да, то тогда у вас есть все шансы исправить ситуацию и в нормальном обычном режиме.

Ошибочное представление данных для Excel отчетов

В некоторых устаревших версиях MS Office, например Excel 2010 версии (любой разрядности) наблюдается ошибочное представление значений даты в ячейках для Excel отчетов (вместо даты отображается 5-значное цифровое значение). Эта ошибка решается в рамках обновлений версии Office 2010 до , например.

Иногда с принтерами случается проблема: появляются иероглифы при печати. Происходит такое с редким пользователем, часто проблема решается сама по себе без каких-либо действий. Причём данные неполадки замечаются чаще на машинах фирмы HP. Если у вас случилась эта беда, то читайте дальше.

Решения, приведённые ниже, просты, поскольку не требуют от пользователя каких-то серьёзных действий. Однако их может быть достаточно для решения проблемы. При этом можно будет обойтись без заморочек.

Это то, что нужно сделать с самого начала, если ваш принтер печатает иероглифы вместо букв. Выключаем компьютер и принтер, а затем включаем их через несколько минут.

Наиболее часто иероглифы вместо текста вылезают при печати через MS Word . Попробуйте распечатать текст при помощи другой программы.

Для этого можно пересохранить файл в формате PDF и открыть при помощи программы Adobe Acrobat Reader или FoxitReader. Распечатать также можно через браузер, например, через Google Chrome или Internet Explorer .

Печать изображения

Попробуйте вместо текста распечатать изображение. Для этого нужно:

  1. Открыть окно в программе, которое используется для отправки файла на печать.
  2. Найти на нём кнопку «Дополнительно» или «Дополнительные настройки», зависит от программы, в которой производится печать.
  3. В открывшемся окне найти параметр «Печать как изображение» или «Растровая печать», поставить напротив него галочку.

Текст машина теперь печатает как изображение. Иероглифы вместо русских букв вы, скорее всего, не увидите.

Шрифты

Проблема может заключаться в шрифтах . Девайс их не читает, а печатает непонятные символы вместо русских букв. Попробуйте просто использовать другие шрифты для текста. Особенно это будет актуально, если вы взяли не классические (Arial, Calibri), а экзотические шрифты.

Также попробуйте следующее: запретите подставлять Courier New. Для этого:

На Панели управления найдите пункт с устройствами.

Решаем проблемы с кодировкой или как убрать кракозябры?

Итак, наша статья была бы неполной, если бы мы не затронули пользовательско-бытовые вопросы. Давайте их и рассмотрим и начнем с того, как (с помощью чего) можно посмотреть кодировку?

В любой операционной системе имеется таблица символов, ее не нужно докачивать, устанавливать – это данность свыше, которая располагается по адресу: “Пуск-программы-стандартные-служебные-таблица символов”. Это таблица векторных форм всех установленных в Вашей операционной системе шрифтов.

Выбрав “дополнительные параметры” (набор Unicode) и соответствующий тип начертания шрифта, Вы увидите полный набор символов, в него входящих. Кликнув по любому символу, Вы увидите его код в формате UTF-16, состоящий из 4-х шестнадцатеричных цифр (см. изображение).

Теперь пара слов о том, как убрать кракозябры. Они могут возникать в двух случаях:

  1. Со стороны пользователя — при чтении информации в интернет (например, при заходе на сайт);
  2. Или, как говорилось чуть выше, со стороны веб-мастера (например, при создании/редактировании текстовых файлов с поддержкой синтаксиса языков программирования в программе Notepad++ или из-за указания неправильной кодировки в коде сайта).

Рассмотрим оба варианта.

№1. Иероглифы со стороны пользователя.Допустим, Вы запустили ОС и в каком-то из приложений у Вас отображаются пресловутые каракули. Чтобы это исправить, идем по адресу: “Пуск — Панель управления — Язык и региональные стандарты — Изменение языка” и выбираем из списка, «Россия».

Также проверьте во всех вкладках, чтобы локализация была “Россия/русский” – это так называемая системная локаль.

Если Вы открыли сайт и вдруг поняли, что почитать информацию Вам не дают иероглифы, тогда стоит поменять кодировку средствами браузера (“Вид — Кодировка”). На какую? Тут все зависит от вида этих кракозябр. Ориентируйтесь на следующую шпаргалку (см. изображение).

№2. Иероглифы со стороны веб-мастера.Очень часто начинающие разработчики сайтов не придают большого значения кодировке создаваемого документа, в результате чего потом и сталкиваются с вышеозначенной проблемой. Вот несколько простых базовых советов для веб-мастеров, чтобы исправить беду.

Чтобы такого не происходило, заходим в редактор Notepad++ и выбираем в меню пункт “Кодировки”. Именно он поможет преобразовать имеющийся документ. Спрашивается, какой? Чаще всего (если сайт на WordPress или Joomla), то “Преобразовать в UTF-8 без BOM” (см. изображение).

Сделав такое преобразование, Вы увидите изменения в строке статуса программы.

Также во избежание кракозябр необходимо принудительно прописать информацию о кодировке в шапке сайта. Тем самым Вы укажите браузеру на то, что сайт стоит считывать именно в прописанной кодировке. Начинающему веб-мастеру необходимо понимать, что чехарда с кодировкой чаще всего возникает из-за несоответствия настроек сервера настройкам сайта, т.е. на сервере в базе данных прописана одна кодировка, а сайт отдает страницы в браузер в совершенной другой.

Для этого необходимо прописать “внаглую” (в шапку сайта, т.е, как частенько, в файл header.php) между тегами <head> </head> следующую строчку:

Прописав такую строчку, Вы заставите браузер правильно интерпретировать кодировку, и иероглифы пропадут.

Также может потребоваться корректировка вывода данных из БД (MySQL). Делается сие так:

Как вариант, можно еще сделать ход конём и прописать в файл .htaccess такие вот строчки:

Все вышеприведенные методы (или некоторые из них), скорее всего, помогут Вам и Вашим будущим посетителям избавиться от ненавистных иероглифов и проблем с кодировкой. К сожалению, более подробно мы здесь инструкцию по веб-мастерским штукам рассматривать не будем, думаю, что они обязательно разберутся в подробностях при желании (как-никак у нас несколько другая тематика сайта).

Ну, вот и практическая часть статьи закончена, осталось подвести небольшие итоги.

Исправляем отображение русских букв в Windows 10

Существует два способа решения рассматриваемой проблемы. Связаны они с редактированием настроек системы или определенных файлов. Они отличаются по сложности и эффективности, поэтому мы начнем с легкого. Если первый вариант не принесет никакого результата, переходите ко второму и внимательно следуйте описанным там инструкциям.

Способ 1: Изменение языка системы

В первую очередь хотелось бы отметить такую настройку как «Региональные стандарты». В зависимости от его состояния и производится дальнейшее отображение текста во многих системных и сторонних программах. Редактировать его под русский язык можно следующим образом:

Дождитесь перезапуска компьютера и проверьте, получилось ли исправить проблему с русскими буквами. Если нет, переходите к следующему, более сложному варианту решения этой задачи.

Способ 2: Редактирование кодовой страницы

Кодовые страницы выполняют функцию сопоставления символов с байтами. Существует множество разновидностей таких таблиц, каждая из которых работает с определенным языком. Часто причиной появления кракозябров является именно неправильно выбранная страница. Далее мы расскажем, как править значения в редакторе реестра.

Если же значение и так уже является 1251, следует провести немного другие действия:

После завершения работы с редактором реестра обязательно перезагрузите ПК, чтобы все корректировки вступили в силу.

Подмена кодовой страницы

Некоторые пользователи не хотят править реестр по определенным причинам либо же считают эту задачу слишком сложной. Альтернативным вариантом изменения кодовой страницы является ее ручная подмена. Производится она буквально в несколько действий:

Вот таким нехитрым образом происходит подмена кодовых страниц. Осталось только перезапустить ПК и убедиться в том, что метод оказался эффективным.

Как видите, исправлению ошибки с отображением русского текста в операционной системе Windows 10 способствуют два достаточно легких метода. Выше вы были ознакомлены с каждым. Надеемся, предоставленное нами руководство помогло справиться с этой неполадкой.

Виды кодировок текста

А их, в общем-то, хватает.

ASCII

Одной из самых “древних” считается американская кодировочная таблица (ASCII, читается как “аски”), принятая национальным институтом стандартов. Для кодировки она использовала 7 битов, в первых 128 значениях размещался английский алфавит (в нижнем и верхнем регистрах), а также знаки, цифры и символы. Она больше подходила для англоязычных пользователей и не была универсальной.

Кириллица

Отечественный вариант кодировки, для которого стали использовать вторую часть кодовой таблицы – символы с 129 по 256. Заточена под русскоязычную аудиторию.

Кодировки семейства MS Windows: Windows 1250-1258.

8-битные кодировки, появились как следствие разработки самой популярной операционной системы, Windows. Номера с 1250 по 1258 указывают на язык, под который они заточены, например, 1250 – для языков центральной Европы; 1251 – кириллический алфавит.

Код обмена информацией 8 бит – КОИ8

KOI8-R, KOI8-U, KOI-7 – стандарт для русской кириллицы в юникс-подобных операционных системах.

Юникод (Unicode)

Универсальный стандарт кодирования символов, позволяющий описать знаки практически всех письменных языков. Обозначение “U+xxxx” (хххх – 16-ричные цифры). Самые распространенные семейства кодировок UTF (Unicode Transformation Format): UTF-8, 16, 32.

В настоящее время, как говорится, “рулит” UTF-8 – именно она обеспечивают наилучшую совместимость со старыми ОС, которые использовали 8-битные символы. В UTF-8 кодировке находятся большинство сайтов в сети Интернет и именно этот стандарт является универсальным (поддержка кириллицы и латиницы).

Разумеется, я привел не все виды кодировок, а только наиболее ходовые. Если же Вы хотите для общего развития знать их все, то полный список можно отыскать в самом браузере. Для этого достаточно пройти в нем на вкладку “Вид-Кодировка-Выбрать список” и ознакомиться со всевозможными их вариантами (см. изображение).

Думаю возник резонный вопрос: “Какого лешего столько кодировок?”. Их изобилие и причины возникновения можно сравнить с таким явлением, как кроссбраузерность/кроссплатформенность. Это когда один и тот же сайт сайт отображается по-разному в различных интернет-обозревателях и на различных гаджет-устройствах. Кстати у сайта «Заметки Сис.Админа» с этим, как Вы заметили всё в порядке :).

Все эти кодировки – рабочие варианты, созданные разработчиками “под себя” и решение своих задач. Когда же их количество перевалило за все разумные пределы, а в поисковиках стали плодиться запросы типа: “Как убрать кракозябры в браузере?” — разработчики стали ломать голову над приведением всей этой каши к единому стандарту, чтобы, так сказать, всем было хорошо. И кодировка Unicode, в общем-то, это “хорошо” и сделала. Теперь если такие проблемы и возникают, то они носят локальный характер, и не знают как их исправить только совсем непросвещенные пользователи (впрочем, часто беда с кодировкой и отображением сайтов появляется из-за того, что веб-мастер указал на стороне сервера некорректный формат, и приходится переключать кодировку в браузере).

Ну вот, собственно, пока вся «базово необходимая» теория, которая позволит Вам “не плавать” в кодировочных вопросах, теперь переходим к практической части статьи.

Что такое кодировка текста и с чем ее едят?

Начать хотелось бы с того, что этой статьи могло бы и не быть, т.к. компьютерно-юзательная жизнь автора этих строк протекала вполне себе спокойно и достойно. Но вот в один прекрасный день, шляясь по просторам сети Интернет не со своего ПК, я столкнулся с непонятными явлениями на некоторых сайтах. Заходя на интернет-ресурсы, я видел не привычный нам русский алфавит и красивый понятный текст, а какую-то ересь в виде непонятной последовательности символов. Выглядела она примерно вот так (см. изображение).

Сначала я подумал, что моя любимая Мозилка (браузер Firefox) перегрелась и ей пора вызывать неотложку, но потом начал понимать, что проблема, скорее всего, на стороне ресурса сети и кроется она в неправильно настроенной кодировке. Это действительно оказалось так, и пошаманив немного с бубном, проблемка была оперативно решена. Результатом же всех моих любовных похождений и стал сегодняшний материал. Собственно, поехали разбираться в деталях.

Всю информацию, представленную в цифровом виде и находящуюся в глобальной паутине, нужно рассматривать с двух сторон: первая — со стороны пользователя (красивый и ухоженный текст на экране монитора) и вторая – со стороны поисковой машины (некий программный код, состоящий из различных тегов/метатегов, таблицы символов и прочее).

Если Вы хоть немного знакомы с языком разметки гипертекста (HTML), то должны быть в курсе, что сайт глазами поисковых машин (Google, Яндекс) видится не как обычный текст, а как структурированный документ, состоящий из последовательностей различного рода тегов. Чтобы было понятней, о чем я говорю, давайте взглянем на всеми нами любимый сайт Заметки Сис.Админа” проекта , но не глазами обычного пользователя, а «глазами» поисковика. Для этого нажимаем сочетание клавиш Сtrl+U (для браузеров Firefox и Chrome) и видим следующую картину (см. изображение):

Перед нами машинный вариант sonikelf.ru, вот в таком вот непрезентабельном виде он подается поисковым системам и именно в таком виде они его и кушают. Если бы мы просто взяли и “засандалили” варианты статей из блокнота или Word обычным текстом, машины бы им не то что подавились, они бы даже и есть его не стали. Итак, перед нами главная страница проекта в HTML-виде

Обратите внимание на строку с надписью UTF-8, это не что иное, как пресловутая кодировка текста страницы, именно она и отвечает за формат вывода информации в презентабельном виде, в результате чего через браузер мы видим нормальный текст

Теперь давайте разберемся, почему же происходит так, что порой на экране монитора мы видим кракозябры. Все очень просто, проблема кроется в открытии файла в неверной кодировке. Если перевести на бытовой язык, то допустим Вас послали в магазин за молоком, а Вы притарабанили хлеб, вроде бы тоже съестное, но совсем другой формат продукта.

Итак, теперь давайте разбираться с теорией и для этого введем некоторые определения.

  1. Кодировка (или “Charset”) – соответствие набора символов набору числовых значений. Нужна для “сливания” информации в интернет, т.е. текстовая информация преобразуется в биты данных;
  2. Кодовая страница (“Codepage”) – 1 байтовая (8 бит) кодировка;
  3. Количество значений, принимаемое 1 байтом – 256 (два в восьмой).

Соответствие “символ-изображение” задается с помощью специальных кодовых таблиц, где каждому символу уже присвоен свой конкретный числовой код. Таких таблиц существует достаточно много, и в разных таблицах один и тот же символ может идентифицироваться по-разному (ему могут соответствовать разные числовые коды).

Все кодировки различаются количеством байт и набором специальных знаков, в которые преобразуется каждый символ исходного текста.

В общем.. С определениями разобрались, а теперь давайте узнаем, какие же (кодировки) бывают.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *

Adblock
detector