搜索引擎是一种为问题(搜索查询)提供答案(搜索结果)的工具。例如,当您在 Google 中输入“巧克力曲奇饼干配方”时,它会向您呈现一页备选答案。
在呈现结果之前,搜索引擎需要先创建一个备选答案主列表。这一过程称为“抓取”。
爬网程序(也称为爬虫或机器人)是一种自动化程序,它会访问您的网站页面并执行以下操作:
- 扫描您的所有内容、图片及其他媒体。
- 创建您站点的存储副本(缓存)。
- 以访客视角查看您的站点。
- 通过链接访问您站点上的其他页面,甚至您链接到的其他网站。
注意:搜索引擎通常通过其他站点的链接发现您的网站。
在抓取您的站点后,搜索引擎会将您站点的信息存储在称为索引的专用数据库中。这就像一座庞大的数字图书馆,其中收录了来自数十亿个网站的数据。
根据最新数据,Google 会索引:
- 数以千亿计的网页。
- 超过 1000 亿千兆字节的数据。
- 来自约 130 万亿个已知网站的信息。
当用户进行搜索时,短短几秒内会发生以下几件事:
- 搜索引擎会分析搜索查询(例如“最美味的纯素塔可”)。
- 它会确定搜索背后的可能意图。
- 它会根据超过 200 个因素对其索引中的相关页面进行排名。
- 它会提供搜索引擎结果页面(search engine results page,SERP),呈现最佳匹配项。
在决定呈现哪些页面时,搜索引擎会考虑诸多因素,包括:
- 搜索者所处的位置。
- 其所使用的设备。
- 网站内容的质量与相关性。
- 其他网站对该内容的引用情况。
考虑您在上节课中所选页面或文章的话题。请按照以下步骤操作:
- 使用您认为人们会用来查找与您所讨论话题相关信息的关键词进行搜索。
- 查看搜索结果,它们是否与您的内容相似?
- 如有必要,请尝试使用不同的搜索词,直至找到与您的内容更匹配的结果。
目标:找出会呈现与您内容相似的结果的搜索词。这有助于您了解在自己的内容中使用哪些词汇才能使其在类似搜索中出现。