Google 的抓取过程是根据网页网址的列表进行的,该列表是在之前进行的抓取过程中形成的,且随着网站管理员所提供的 Sitemap 数据不断进行扩充。在 Googlebot 访问每个网站时,它会检测每个网页上的链接,并将这些链接添加到它要抓取的网页列表中。新建立的网站、对现有网站所进行的更改以及无效链接都会被记录下来,并用于更新 Google 索引。
Google 不允许以收取费用的方式来提高网站抓取频率。我们会对搜索业务和以盈利为目的的 AdWords 服务加以区分。
2、编制索引
Googlebot 会处理所抓取的每个网页,以便将其找到的所有字词和这些字词在每个网页上的位置都汇编到包含大量索引的列表中。此外,我们还会处理关键内容标记和属性中的信息,例如 TITLE 标记或 ALT 属性。Googlebot 可处理许多类型的内容,但并非全部类型的内容。例如,我们无法处理某些 Rich Media 文件或动态网页的内容。
要让您的网站在搜索结果页中获得较好的排名,您一定要确保 Google 能够正确地抓取您的网站并将其编入索引。我们的网站管理员指南列出了一些可帮助您避免常见问题并改善网站排名的最佳实践。
Google 的相关搜索、拼写建议和 Google 建议功能旨在通过显示相关字词、常见拼写错误和常见查询来帮助用户节省搜索时间。与我们的 google.com 搜索结果相似,这些功能所使用的关键字会由我们的网络抓取工具和搜索算法自动生成。我们只有在认为这些建议可以节省用户时间时才会显示这些建议。如果某个网站因某一关键字而获得较高的排名,这是因为,我们已通过算法确定了其内容对用户的查询更具相关性。