删除HTML编码字符
本文关键字:编码字符 HTML 删除 | 更新日期: 2023-09-27 17:50:25
我从数据库中得到一些数据,它有HTML编码字符(
)。删除这些选项有哪些?
我不希望这些渲染…我想把它们从数据中剥离。
目前我不担心HTML标签…只有编码过的字符。
编辑:如果是相关的,这些字符会导致JSON验证中的一些错误。
如果你想摆脱它们,获取一个这样的字符列表或一个匹配它们的RegExp(类似&[a-z]+;
),然后做一个搜索和替换。
然而,如果你只是想让它们因为JSON验证中的错误而消失,你应该正确地生成/编码你的JSON以避免错误。(然而,我真的不明白他们是如何导致无效的JSON。)
这里不应该使用regexp进行简单的修剪。例如,
也可以被编码为 
,但&'#[0-9]+;
正则表达式会导致数据丢失,因为几乎每个字符都可以在某些时候被编码成这样(例如:<p>HELLO</p>
).