[[IT知识]] WordPress发布文章时自动过滤HTML标签属性的高效方法

[复制链接]
查看: 43|回复: 0
发表于 2025-2-1 09:25:28 | 显示全部楼层 | 阅读模式
易博V9下载

WordPress发布文章时自动过滤HTML标签属性的高效方法

我们在 WordPress 发表文章的时候,有时会遇到一些特殊的需求,比如把文章中的链接变成可点击,或者过滤掉文章内容 HTML 标签中的某种属性等。

我近期的项目中就遇到了后面的这个需求,因为直接粘贴复制网络上的文章,往往会夹带着 HTML 的 class、id 和 style 属性值,这些无用的内容会潜在的影响正文的排版布局和样式,所以要过滤掉。

解决思路

如果想要过滤掉发布文章时,文章内容中 HTML 标签中的 class、id 和 style 等属性,首先需要在摁下“发表”按钮的时候,使用 PHP 正则匹配对要发表的文章内容进行正则匹配处理,替换掉无用的内容,最后继续执行插入数据库的操作。所以这个问题就分成了几个小步骤:

  1. “获取”文章内容,传递给处理函数
  2. 处理函数使用正则匹配对文章内容进行处理
  3. 将处理好的内容返回,让 WordPress 把内容插入数据库

解决方案

面对第一个步骤,WordPress 有一个很强大的“钩子”(hook)开发机制,实现各种功能和开发插件必不可少的功能。简单的说,就是 WordPress 在执行某些关键性的操作时(例如发表文章、发表评论、修改文章、删除文章、新增用户等等),会插入一个“钩子”,这样你就可以在functions.php 中或者插件中,使用 add_action 或者 add_filter 函数挂上这个“钩子”,并增加自定义的函数对数据进行一个动作或者进行过滤。

例如在发表文章的时候,在提交到插入数据库之前,会有一个叫做 wp_insert_post_data “钩子”,如果你想对文章进行过滤处理,你就需要在 functions.php 文件中,新建一个处理函数,然后将对应处理函数绑定到这个钩子上面。

首先,你需要找到你要用的“钩子”,你需要浏览 WordPress 官方的 Filter Reference 和 Action Reference 文档,里面是长长的“钩子”列表,看一下下面的说明,然后找到对应的“钩子”就可以开始使用了。比较常用的“钩子”已经给出官方文档和使用说明了,例如:wp_insert_post_data,不过由于列表太长了,大部分的没有给出很详细的使用说明,就需要你按照经验来使用。

找到需要的“钩子”之后,使用 add_filter 函数(具体用法可以看一下官方文档:add filter)将钩子和处理函数进行挂钩函数用法如下:

  1. add_filter($tag, $function_to_add, $priority = 10, $accepted_args = 1);
复制代码

就本例而言,基本结构如下:

  1. <?php
  2. function wpjam_insert_post_data( $data , $postarr ) {
  3. // 处理函数的逻辑部分和功能代码
  4. return $data;
  5. }
  6. add_filter( 'wp_insert_post_data', 'wpjam_insert_post_data', '99', 2 );
  7. ?>;
复制代码

这样,我们的第一个步骤就完成了。下面来编写函数的处理代码。既然要过滤文章中的具有某些特征的代码,所以需要使用 PHP 的正则匹配替换掉。可以使用如下的 PHP 代码:

  1. $date = preg_replace('/<([a-z]+?)\s+?.*?>;/i', '<$1>;', $date);
复制代码

根据 wp_insert_post_data 文档可以看出,传递进去的 $data 数组里面是文章的相关信息,我们需要处理的是正文内容,所以使用 $date['post_content'] 和$date['post_content_filtered'] 这两个变量,那么就可以写出下面这段代码:

  1. function wpjam_insert_post_data( $data , $postarr ) {
  2. $date['post_content_filtered'] = preg_replace('/<([a-z]+?)\s+?.*?>;/i', '<$1>;', $date['post_content_filtered']);
  3. $date['post_content'] = preg_replace('/<([a-z]+?)\s+?.*?>;/i', '<$1>;', $date['post_content']);
  4. return $data;
  5. }
  6. add_filter( 'wp_insert_post_data', 'wpjam_insert_post_data', '99', 2 );
复制代码

因为函数里面已经将处理后的数据 return 了,这样第二步和第三步就完成了,我们的这个需求也就实现了。

总结

正是因为有了这种开发机制,WordPress 的灵活性和扩展性大大增强。如果你还想对文章进行其他处理(例如文章末尾加版权信息等),都可以继续编写函数,挂钩在对应的钩子即可。

注:原文作者于江水.

易博软件介绍
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

1、请认真发帖,禁止回复纯表情,纯数字等无意义的内容!帖子内容不要太简单!
2、提倡文明上网,净化网络环境!抵制低俗不良违法有害信息。
3、如果你对主帖作者的帖子不屑一顾的话,请勿回帖。谢谢合作!
3、问答求助区发帖求助后,如有其他用户热心帮您解决问题后,请自觉点击设为最佳答案按钮。

 
 
QQ在线客服
QQ技术支持
工作时间:
8:00-18:00
软著登字:
1361266号
官方微信扫一扫
weixin

QQ|小黑屋|Archiver|慈众营销 ( 粤ICP备15049986号 )|网站地图

自动发帖软件 | 自动发帖器 | 营销推广软件 | 网络营销工具 | 网络营销软件 | 网站推广工具 | 网络推广软件 | 网络推广工具 | 网页推广软件 | 信息发布软件 | 网站推广工具 | 网页推广软件

Powered by Discuz! X3.4   © 2012-2020 Comsenz Inc.  慈众科技 - Collect from 深圳吉宝泰佛文化有限公司 公司地址:罗湖区黄贝街道深南东路集浩大厦A1403

返回顶部 返回列表