站点地图(sitemap.xml)的作用,相信站长们都有所了解,我就不多说了。而Wordpress免插件生成sitemap.xml,之前老四也介绍了一种方法
但生成的内容稍有些遗憾,所以在网上又找了一个方法可以生成完整的站点地图,包括文章、分类、页面、标签内容。
方法如下

一、代码

<?php
require ('./wp-blog-header.php');
header("Content-type: text/xml");
header('HTTP/1.1 200 OK');
$posts_to_show = 1000;
echo '<?xml version="1.0" encoding="UTF-8"?>';
echo '<urlset xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://www.sitemaps.org/schemas/sitemap/0.9 http://www.sitemaps.org/schemas/sitemap/0.9/sitemap.xsd" xmlns:mobile="http://www.baidu.com/schemas/sitemap-mobile/1/" xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">'
?>
<!-- Generated on : <?php echo get_lastpostdate('blog'); ?> Edited by Scriptsz.com-->
  <url>
      <loc><?php echo get_home_url(); ?></loc>
      <lastmod><?php $ltime = get_lastpostmodified(GMT);
$ltime = gmdate('Y-m-d', strtotime($ltime));
echo $ltime; ?></lastmod>
      <priority>1.0</priority>
  </url>
<?php
/* 文章页面 */
$myposts = get_posts("numberposts=" . $posts_to_show);
foreach ($myposts as $post) { ?>
  <url>
      <loc><?php the_permalink(); ?></loc>
      <lastmod><?php the_time('Y-m-d') ?></lastmod>
      <priority>0.6</priority>
  </url>
<?php
} /* 文章循环结束 */ ?>  
<?php
/* 单页面 */
$mypages = get_pages();
if (count($mypages) > 0) {
    foreach ($mypages as $page) { ?>
    <url>
      <loc><?php echo get_page_link($page->ID); ?></loc>
      <lastmod><?php echo str_replace(" ", "T", get_page($page->ID)->post_modified); ?>+00:00</lastmod>
      <priority>0.6</priority>
  </url>
<?php
    }
} /* 单页面循环结束 */ ?> 
<?php
/* 博客分类 */
$terms = get_terms('category', 'orderby=name&hide_empty=0');
$count = count($terms);
if ($count > 0) {
    foreach ($terms as $term) { ?>
    <url>
      <loc><?php echo get_term_link($term, $term->slug); ?></loc>
      <priority>0.8</priority>
  </url>
<?php
    }
} /* 分类循环结束 */ ?> 
<?php
/* 标签(可选) */
$tags = get_terms("post_tag");
foreach ($tags as $key => $tag) {
    $link = get_term_link(intval($tag->term_id), "post_tag");
    if (is_wp_error($link)) return false;
    $tags[$key]->link = $link;
?>
 <url>
      <loc><?php echo $link ?></loc>
      <priority>0.4</priority>
  </url>
<?php
} /* 标签循环结束 */ ?> 
</urlset>

将以上代码保存为sitemap.php,传到网站根目录。手动访问查看效果,本站演示: https://www.scriptsz.com/sitemap.php

二、伪静态

Nginx:编辑已存在的Nginx伪静态规则,新增如下规则后(平滑)重启nginx即可:

rewrite ^/sitemap.xml$ /sitemap.php last;

Apache:编辑网站根目录的 .htaccess ,加入如下规则:

RewriteRule ^(sitemap)\.xml$ sitemap.php

三、静态化

看到很多朋友已经在问这个sitemap如何静态化,加快打开速度。毕竟每次重新生成绝对是一个耗能大户,而且还有可能被有心之人拿来作为攻击入口!
实现方法有多种,比如在Nginx的fastcgi缓存中取消xml文件的缓存屏蔽。
在这里,分享一个最简单的实现方法:Linux定时任务+wget定时生成sitemap.xml
具体实现:将sitemap.php放到某个不为人知的目录,然后定时使用wget去请求这个文件,并将数据保存为sitemap.xml存放到网站根目录就可以了!比如:
计划任务命令内容
0 1 * * * wget -O /home/WP博客目录/sitemap.xml https://WP博客网址/sitemap.php  >/dev/null 2>&1

此命令表示每天在网站根目录生成一个sitemap.xml diypath为sitemap.php的实际位置

如果是启用了https的站点,需要加入 –no-check-certificate  的选项,即:

0 1 * * * wget -O /home/WP博客目录/sitemap.xml  --no-check-certificate https://WP博客网址/sitemap.php >/dev/null 2>&1

Ps:使用这个方法,注意sitemap.php里面的 require(‘./wp-blog-header.php’); 要改成 require(‘../wp-blog-header.php’); 也就是注意相对位置!

如果实在搞不清楚什么是相对路径,那么就用简单粗暴的方法:将网站根目录的sitemap.php重命名为一个只有自己知道的php文件,比如xml.php,然后如下添加任务:

0 1 * * * wget -O /home/WP博客目录/sitemap.xml --no-check-certificate https://WP博客网址/xml.php >/dev/null 2>&1

此命令表示每天在网站根目录生成一个sitemap.xml(xml.php为自己重命名的php文件名称)

这样一来,就解决了sitemap.xml是动态数据问题了!

四、sitemap.xml的使用

确认无误之后,已开通sitemap权限的就可以前往百度站长平台、bing平台、yandex以及谷歌站长平台提交了,没开通权限的可以发送申请邮件到百度站长平台管理员邮箱申请,并且将sitemap.xml使用a标签链接在网站底部即可。
代码使用很简单,可以根据需要增减内容,比如觉得标签不应该出现在sitemap里面的,可以将标签部分的php代码删除即可,但一定要注意不要误删除结尾的</urlset>标签。

发表评论

您的电子邮箱地址不会被公开。 必填项已用*标注