删除HTML编码字符

本文关键字:编码字符 HTML 删除 | 更新日期: 2023-09-27 17:50:25

我从数据库中得到一些数据,它有HTML编码字符( )。删除这些选项有哪些?

我不希望这些渲染…我想把它们从数据中剥离。

目前我不担心HTML标签…只有编码过的字符。

编辑:如果是相关的,这些字符会导致JSON验证中的一些错误。

删除HTML编码字符

如果你想摆脱它们,获取一个这样的字符列表或一个匹配它们的RegExp(类似&[a-z]+;),然后做一个搜索和替换。

然而,如果你只是想让它们因为JSON验证中的错误而消失,你应该正确地生成/编码你的JSON以避免错误。(然而,我真的不明白他们是如何导致无效的JSON。)

这里不应该使用regexp进行简单的修剪。例如,&nbsp;也可以被编码为&#160;,但&'#[0-9]+;正则表达式会导致数据丢失,因为几乎每个字符都可以在某些时候被编码成这样(例如:<p>&#72;&#69;&#76;&#76;&#79;</p>).