首页

知识学堂

SEO 白皮书

站点地图是一种文件,您可在其中提供与您网站中的网页、视频或其他文件有关的信息,也可以说明这些内容之间的关系。它在SEO中具有重要性,主要体现在以下几个方面:

1. 提升索引效率
快速发现页面:站点地图可以帮助搜索引擎迅速发现并抓取网站上的所有重要页面,尤其是那些通过内部链接不易找到的页面。
包括新页面和更新的页面:通过站点地图,搜索引擎可以快速了解新添加的页面和已有页面的更新,确保这些页面及时被抓取和索引。
2. 提供页面的元数据
额外信息:站点地图可以包含每个页面的元数据,如上次更新时间、页面的重要性和更新频率。这些信息可以帮助搜索引擎更好地理解和处理这些页面。
3. 提高抓取优先级
指明重要页面:通过站点地图,可以明确告诉搜索引擎哪些页面是最重要的,应该优先抓取。这有助于确保关键页面的抓取和索引。
4. 改善网站结构
提供网站架构信息:站点地图可以帮助搜索引擎了解网站的整体结构和页面之间的关系,从而更有效地抓取和索引内容。
5. 支持多种内容类型
多媒体内容:站点地图不仅可以包含网页,还可以包含多媒体内容,如图片、视频和新闻等,帮助搜索引擎更全面地索引网站上的所有内容。
6. 增强用户体验
间接提升排名:通过优化站点地图,提高页面的抓取和索引效率,进而提升搜索引擎对网站的整体评价,最终有助于提高网站在搜索结果中的排名和可见性。

如何创建和提交站点地图
生成站点地图:可以使用各种工具和插件(如Google XML Sitemaps, Yoast SEO等)自动生成站点地图。
提交给搜索引擎:创建好站点地图后,可以通过Google Search Console等工具将其提交给搜索引擎,确保搜索引擎能及时获取并使用站点地图的信息。

示例
一个典型的站点地图示例:

 

规范详细解读:

1. 站点地图文件格式

XML格式:站点地图通常使用XML格式,但也可以使用其他格式如TXT、RSS、Atom等。

根元素:XML站点地图文件的根元素为 <urlset>,并且需要指定命名空间。

2. URL条目

每个URL条目使用 <url> 元素,并包含以下子元素:

loc(必需):页面的绝对URL。

lastmod(可选):页面的最后修改时间。

changefreq(可选):页面内容预计的更新频率。值可以是:always, hourly, daily, weekly, monthly, yearly, never。

priority(可选):页面的优先级,范围是0.0到1.0。

3. 文件大小和URL数量限制

文件大小:每个站点地图文件的大小不能超过50MB(未压缩)。

URL数量:每个站点地图文件最多可以包含50,000个URL。

多站点地图:如果需要列出的URL超过了上述限制,可以创建多个站点地图,并使用站点地图索引文件(sitemap index)来列出所有的站点地图。

4. URL编码

编码:站点地图必须使用UTF-8编码。

特殊字符:URL中的特殊字符必须进行适当的转义。例如,空格应表示为 %20。

5. 命名空间

站点地图的根元素应包含命名空间声明。例如,标准站点地图使用以下命名空间:

6. 提供站点地图的位置

robots.txt文件:在robots.txt文件中指定站点地图的位置。

提交到搜索引擎:可以通过搜索引擎的工具(如Google Search Console)提交站点地图。

 

参考网站:

 

谷歌官方说明:

 

站点地图会告诉搜索引擎您认为网站中的哪些网页和文件比较重要,还会提供与这些文件有关的重要信息。例如,网页上次更新的时间和网页是否有任何备用的语言版本。

您可以使用站点地图提供与特定类型的网页内容(包括视频、图片和新闻内容)有关的信息。例如:

站点地图视频条目可以指定视频的时长、评分以及适合哪些年龄段的受众。
站点地图图片条目中可包含网页中所含图片的位置。
站点地图新闻条目中可包含报道标题和发布日期。

 

 

1、需要站点地图吗

       如果您网站上的网页链接得当,那么 Google 通常能够发现其中的大多数网页。 链接得当是指您认为重要的所有网页都可以通过某些形式的导航(例如您网站的菜单,或您放入网页中的链接)抵达。即便如此,站点地图仍有助于我们更加高效地抓取规模更大、更复杂的网站或更特殊的文件。站点地图可帮助搜索引擎发现网站上的网址,但并不保证 Google 能抓取站点地图中的所有内容并将其编入索引。但在大多数情况下,您的网站都会因使用站点地图而受益。

(1)在以下情况下,您可能需要站点地图:

       ①您的网站很大。一般来说,在大型网站上,要确保网站上的每个网页都至少被另外一个网页链接更为困难。因此,Googlebot 更有可能发现不了您的某些新网页。

       ②网站为新网站且指向该网站的外部链接不多。Googlebot 及其他网页抓取工具是通过跟踪网页之间的链接来抓取网页的。因此,如果没有其他网站链接到您的网页,Googlebot 可能发现不了您的网页。

       ③您的网站包含大量富媒体内容(视频、图片)或显示在 Google 新闻中。 Google 可将站点地图中的其他信息纳入搜索范围。

(2)在以下情况下,您可能不需要站点地图:

       ①您的网站规模“较小”。规模较小是指网站上的网页数不超过 500 个。只有您认为需要纳入搜索结果中的网页才会计入此总数。

       ②您的网站已在内部全面建立链接。这意味着,Googlebot 可以沿着首页的链接找到您网站上的所有重要网页。

       ③您想在搜索结果中显示的媒体文件(视频、图片)或新闻网页不多。站点地图可帮助 Google 找到并了解您网站上的视频和图片文件或新闻报道。如果您不希望这些结果显示在 Google 搜索中,则可能不需要站点地图。

 

2、站点地图格式

(1)XML 站点地图

       XML 站点地图是用途最广的受支持站点地图格式。借助 Google 支持的站点地图扩展,您还可以提供有关图片、视频和新闻内容的更多信息以及网页的本地化版本。

       下方是一个非常基本的 XML 站点地图,其中仅包含 1 个网址的位置信息:

       您可以在 sitemaps.org 上找到更复杂的示例和完整文档。

       关于 XML 站点地图的其他说明:

       ①和所有 XML 文件一样,所有标记值都必须实体转义。

       ②Google 会忽略 <priority> 和 <changefreq> 值。

       ③如果 <lastmod> 值始终准确并可验证(例如通过与网页的最后修改日期进行比较),Google 会使用该值。

(2)RSS、mRSS 和 Atom 1.0
       如果您的 CMS 会生成 RSS 或 Atom Feed,您可以将该 Feed 的网址作为站点地图提交。 大多数 CMS 都会为您创建 Feed,但请注意,此类 Feed 仅提供近期网址的相关信息。

       关于 RSS、mRSS 和 Atom 1.0 的其他说明:

       ①Google 支持 RSS 2.0 Feed 和 Atom 1.0 Feed。

       ②您可以使用 mRSS(媒体 RSS)Feed 向 Google 提供有关您网站上视频内容的详情。

       ③和所有 XML 文件一样,所有标记值都必须实体转义。

(3)文本站点地图
       如果您只想提供网页网址,您可以创建一个简单的文本文件(每行包含一个网址),然后将该文件提交给 Google。例如,如果您的网站上有 2 个网页,您可按如下方式将它们添加到站点地图中:

       文本文件站点地图的其他说明:

       ①请勿在站点地图文件中添加除网址以外的任何其他内容。

       ②您可以随意对该文本文件进行命名,但前提是要确保它的扩展名为 .txt(例如,sitemap.txt)。

 

3、站点地图最佳做法
       站点地图最佳做法由站点地图协议定义。最容易被忽略的最佳做法与大小限制、站点地图位置以及站点地图中包含的网址相关。

       站点地图大小限制:无论采用哪种格式,单个站点地图的文件大小一律不得超过 50MB(未压缩),并且其中包含的网址数量不得超过 50,000 个,否则必须将站点地图拆分成多个较小的站点地图。您也可以选择创建站点地图索引文件,然后将这个索引文件提交给 Google。您可以向 Google 提交多个站点地图和站点地图索引文件。如果您想在 Search Console 中跟踪各个站点地图的搜索效果,这么做可能会很有用。

       站点地图文件编码和位置:站点地图文件必须采用 UTF-8 编码。您可以将站点地图托管在网站的任何位置,但除非您通过 Search Console 提交站点地图,否则站点地图只会影响父级目录中的下级目录。因此,如果站点地图发布在网站的根目录下,则可以影响网站上的所有文件,所以我们建议将站点地图发布在此目录下。

       引用网址的属性:请在站点地图中使用完全限定的绝对网址。Google 会尝试抓取您列出的网址。例如,如果网站位于 https://www.example.com/,请不要指定诸如 /mypage.html(相对网址)这样的网址,而是使用完整的绝对网址:https://www.example.com/mypage.html

       在站点地图中添加您希望在 Google 搜索结果中看到的网址。Google 通常会在其搜索结果中显示规范网址,而您可以通过站点地图加以影响。如果您为网页的移动版和桌面版提供了不同的网址,建议在站点地图中仅指向一个版本。但是,如果您认为需要同时指向这两个网址,请为网址添加注解,指明桌面版和移动版分别是哪个。

 

4、将站点地图提交给 Google
       请注意,提交站点地图只是给 Google 一个提示:我们无法保证 Google 一定会下载该站点地图或使用站点地图抓取网站上的网址。您可通过以下几种不同方法将站点地图提交给 Google:

       ①使用站点地图报告在 Search Console 中提交站点地图。 这样,您就可以查看 Googlebot 何时访问了站点地图,以及潜在的处理错误。

       ②使用 Search Console API 程序化地提交站点地图。

       ③将下面这行内容插入到 robots.txt 文件中的任意位置,指定站点地图的路径。我们会在下次抓取 robots.txt 文件时找到该站点地图:

       ④如果您使用 Atom 或 RSS,则可以使用 WebSub 向搜索引擎(包括 Google)广播您的更改。