Очистка текста от форматирования и лишних невидимых символов

Инструмет поможет очистить текст от форматирования, скрытых символов и «мусора», оставив только читаемое содержимое: буквы, цифры, базовые знаки препинания и пробелы.
Приложение Описание Комментарии Донаты

Другие приложения

Описание приложения «Очистка текста от форматирования и лишних невидимых символов»

Nil
опубликовано 29 октября 2025
обновлено 29 октября 2025
С помощью этого онлайн инструмента можно полностью удалить скрытое форматирование и невидимые символы, которые часто попадают в текст при копировании из браузера, PDF, мессенджеров или офисных документов, и оставить чистый, читаемый текст, пригодный для дальнейшего использования — без «мусора», но с сохранением полезных символов.

При нажатии кнопки «Очистить текст» выполняются следующие шаги:

Удаление HTML/XML-тегов
Полезно при копировании из веб-страниц, Word Online, Notion и т.д.

Удаление всех невидимых и непечатаемых символов, включая:
Zero-width space (U+200B)
Маркеры направления текста (U+200E, U+200F)
Неразрывный пробел (U+00A0)
Мягкий перенос (U+00AD)
BOM (U+FEFF)
Юникодные управляющие символы (U+2028, U+2029, U+2060 и др.)
Различные «необычные» пробелы (U+3000, U+2000–U+200A и т.п.)

Остаются только:
Обычный пробел (U+0020)
Символы перевода строки ( обратный слеш + n — опционально)

Разрешены (остаются) все следующие категории:

Буквы любого языка (кириллица, латиница, китайские иероглифы, арабица и др.) — через Unicode p{L}
Цифры — p{N}
Знаки препинания:
. , ! ? ; : ' " ( ) [ ] { } - – —
Технические и интернет-символы:
@ _ / # $ % & = + * ~ | < > ^

Это позволяет корректно сохранять:
Email-адреса
URL-фрагменты: path/to/file
Хэштеги: #тег
Переменные: my_var_1
Формулы: a + b = 5 * $x
Базовые технические обозначения

Нормализация пробелов и переносов
Табуляция, возврат каретки, вертикальная табуляция → заменяются на пробел
Множественные пробелы → сжимаются в один
Текст обрезается по краям (.trim())

Опциональное удаление переносов строк

По умолчанию включено: все переносы заменяются на пробел → получается одна строка
Можно отключить: переносы сохраняются как нормализованные (обратный слеш + n).

Комментарии