Браузер чаще всего сам определяет кодировку страницы html. Но бывают случаи когда это не удаётся. В данном случае мне необходимо было перекодировать всю документацию написанную на html. Перекодировка файлов в Linux делается несколькими способами.
Проблема заключалась в том, что веб-приложение SAMS отрывалось в кодировке utf8, а справка по SAMS была написана в кодировке koi8 и открывалась во фрейме. В результате я видел абру-кадабру, вместо кириллицы.
Сначала я немного помучился, а потом нашёл решение, как перекодировать все файлы html из koi8-r в utf8.
Назовём это пакетная перекодировка файлов в utf 8
Открываю консоль и перехожу в директорию, где находятся наши файлы и пишу вот такую несложную команду
Теперь проблема решена, все мои файлы были перекодированы из koi8-r в utf8 и документация SAMS во фрейме нормально читается.
Если надо перекодировать только один файл, из кодировки cp1251 в utf-8 достаточно написать команду:
Второй вариант, использовать enconv. Можно перекодировать файл, не указывая исходную кодировку. Для этого необходим пакет enca. Установите его.
Теперь что бы перекодировать файл в utf8 выполнить команду
или
Если не указывать в какую кодировку перекодировать, то файл перекодируется в текущую локаль
А что делать, если у вас много файлов в различных кодировках? В этом случае нам пригодится этот пакет. Перекодировка текстовых файлов из текущей директории в кодировку принятой в системе:
В состав пакета входит утилита enca, которая позволяет определить текущую кодировку файла: