javascript — Какие объекты HTML становятся « забытыми » (и заменены символом UTF8) после помещения их в элемент html?

Какие объекты HTML становятся «забытыми» (и заменены символом UTF8) после помещения их в элемент HTML?

Я работаю в Firefox под Windows 7. Я хочу заменить все «коды» сущностей HTML (например, {amp}amp; copy;) из содержимого поля текстовой формы символами UTF8, которым они соответствуют (соответственно ©), — и работать с текстом без HTML-коды enity, но вместо них есть символы UTF8. Поэтому моя идея заключается в следующем: поместить это содержимое в элемент html (скажем, div) и, наконец, прочитать содержимое этого элемента. Оказывается, что большинство сущностей HTML заменяются символами UTF8, как я хочу, но этого не происходит, например, для: {amp}amp; lt ;, {amp}amp; rt ;, {amp}amp; amp; и {amp}amp; nbsp ;. Чтобы быть более точным, позвольте мне процитировать мой оригинальный сценарий JS и HTML-код:

  {amp}lt;!DOCTYPE html{amp}gt; {amp}lt;html{amp}gt;{amp}lt;head{amp}gt;{amp}lt;meta charset="UTF-8"{amp}gt;{amp}lt;/head{amp}gt;{amp}lt;body{amp}gt; {amp}lt;input type="text" id="user" onchange="convert()"{amp}gt; {amp}lt;input type="text" id="my_test"{amp}gt; {amp}lt;div id="for_tests"{amp}gt;{amp}lt;/div{amp}gt; {amp}lt;script{amp}gt; function convert() { var text = document.getElementById('user').value; document.getElementById('for_tests').innerHTML = text; var conv = document.getElementById('for_tests').innerHTML; document.getElementById('my_test').value = conv; } {amp}lt;/script{amp}gt; {amp}lt;/body{amp}gt;{amp}lt;/html{amp}gt; 

Этот короткий скрипт работает следующим образом: он читает содержимое первого ввода (#user), затем « преобразует » HTML-сущности и отображает результат во втором вводе (#my_test). Удивительно, если, например, содержимое ввода #user:

{amp}amp; Uuml; {amp}amp; Lt; {amp}amp; GT; {amp}amp; Амп; {amp}amp; NBSP; {amp}amp; Копировать; {amp}amp; Ccedil; {amp}amp; # 9917; {amp}lt;{amp}gt; {amp}amp; {amp}amp; # 160;

тогда содержимое ввода #my_test:

ü {amp}amp; lt; {amp}amp; GT; {amp}amp; Амп; {amp}amp; NBSP; © ç ⚽ {amp}amp; lt; {amp}amp; GT; {amp}amp; Амп; {amp}amp; NBSP;

Итак, некоторые сущности HTML преобразуются, а некоторые нет. Может кто-нибудь объяснить, каково правило — то есть, какие HTML-сущности будут преобразованы? Заранее благодарю за любую помощь!

Понравилась статья? Поделиться с друзьями:
JavaScript & TypeScript
Adblock
detector