Google SEO第一步:理解搜索引擎的基本运行原理

外贸网站建设 2021-07-18

Google SEO的定义

说起Google SEO,可能许多做外贸的朋友不是太了解SEO具体是什么,我们这里就来讲一下它的定义。

SEO本身是一个简称,它的全称是Search Engine Optimization,翻译过来就是搜索引擎优化的意思。

所以,我们平时说的Google SEO,就是谷歌搜索引擎优化的意思,也被简称为谷歌优化。

Google SEO的作用

Google搜索引擎相信很多人都使用过,大家可以通过谷歌来搜索自己想要的信息。比如,在Google里搜索“women bags”这个词,谷歌就会反馈给我们相关的搜索结果,搜索结果页面如下图所示:

谷歌搜索结果页面


大家可以看到,图中被框起来的顶部和底部区域,这两处显示的结果是Google的广告推广,也就是原来的Adwords推广,现在已经改名叫做谷歌Ads。谷歌的广告推广,也被称为PPC竞价推广,按照竞价点击付费,用户每点击一次就会从你已经充值的账户中扣除相应的竞价费用。同等情况下,你出的竞价费用越高,你的广告更容易靠前。

接下来,我们看下搜索结果页面的中间区域。这块区域就是自然搜索结果展示的地方。什么是自然搜索结果?不同于谷歌广告需要投钱才能获得展示,自然搜索结果是Google根据自身排名算法展示出的相关网页信息,这些被展示出来的网站无需向谷歌支付任何费用。

对于每个关键词的搜索,自然搜索结果每页总共只有10个位置,能够收获最多流量(可以理解为访问人数)的首页也是如此。谷歌SEO的作用就是发挥在这里,帮助网站尽可能地争取到首页的那10个位置获得更多的流量;流量越多、询盘越多、订单越多。如果你对于谷歌能够带来的流量效果存在怀疑,不妨看下我方已做的优化案例。

综上,Google SEO或者说Google优化的作用就是通过优化网站,让网站在自然搜索结果中获取更好的排名。


谷歌SEO和百度SEO的区别

由于Google已经退出了中国,不方便使用,大家平时最常用的搜索引擎肯定是百度无疑。不少人可能就会产生一种思维定式,认为搜索引擎都是一个样的。而事实上,谷歌和百度大大不同,它们对应的SEO优化方式也就有了差异。我罗列了一下它们之间的主要区别,有如下几个方面:

1. 百度对新站、小网站不大友好,收录很慢;谷歌就相对好很多,虽然现在也不像过去那样对新站进行秒收录,但整体收录速度还是比百度好很多。这里所说的小网站,通常指只有一两百页,甚至几十页的网站,对比内容丰富的大站,基础权重较低,排名上处于劣势。因此,在我方做网站、做优化的客户,我们通常建议他们网站内容能够做地越丰富越好,基础权重越高,SEO越容易出效果。对内容方面的看重是所有搜索引擎的共同点。

2. Google比百度更加的公平。谷歌不会刻意地去干扰排名,而百度却不管这一套。不知道你有没有发现,百度对于自家的产品永远是给高排名的;而曾经有个新闻,说的是谷歌根据规则处罚了自家产品的搜索排名。截然相反的做法,体现出了Google的公平性。而且,现在的百度搜索越来越糟糕,百度已经开始从一个搜索引擎在慢慢往APP方向发展,经常搜索一个结果就让你下载它的APP打开查看,非常影响用户体验。

3. 两者的SEO大环境。百度的技术远远没有到位,利用黑帽漏洞的快速排名层出不穷,无脑刷外链横行,这些作弊套路到谷歌那就行不通了。只有公平的环境,才能让大家把目光放在打造优质网站,而不是浮躁地只想走捷径。在我看来,国内SEO行业目前混乱的局面很大程度上都是因为这个原因。即便Google SEO没有捷径,还是有很多公司换着法子在忽悠新手以及不懂的客户。

按现在的情况来说,Google仍然不忘初心,不断地努力提升用户的搜索体验,不断改进算法,让用户能够找到最符合自身需求的信息。也正是因为这个根本原因,造成了谷歌SEO和百度SEO的做法区别,想要做好Google SEO就忘了作弊的那些路数吧。


Google SEO第一步:理解搜索引擎的基本运行原理

搜索引擎的运行原理也是SEO新手入门需要了解的知识,能够帮助你对搜索引擎这个工具有个整体的认知。对于所有的搜索引擎来说,他们基本的工作流程都是相同的。

  • 首先是抓取,搜索引擎通过蜘蛛(搜索引擎的抓取程序),抓取互联网上的众多网站信息;

  • 然后是收录,搜索引擎会把抓取到的网页信息,收录到自己的数据库中;

  • 最后是排名,搜索引擎根据用户使用的搜索词通过它的特定算法在数据库中找到匹配的相关页面,通过搜索结果的形式展示给用户。

抓取规则(Crawling)

搜索引擎会利用蜘蛛工具抓取互联网上可以抓取到的所有网页信息。可能有人会问蜘蛛工具是什么?互联网上的网站是相互链接的,网站内部的叫做内链,对外的链接叫做外链。这些链接就像一张大网一样,把几乎所有的网站都连接到了一起,从而组合成了整个互联网。

而搜索引擎的抓取工具,就像蜘蛛一样,可以顺着这个网络对网页信息一个个地进行抓取。所以,我们把搜索引擎的抓取工具称之为蜘蛛。谷歌的抓取工具就叫做谷歌蜘蛛,百度的抓取工具就叫做百度蜘蛛,有些人也把蜘蛛叫做机器人,都是同一个意思。

技巧1:检查网站是否可以被抓取

蜘蛛到你的网站上第一步会检测你的网站是否处于可以抓取的状态,因为不是所有的网站都愿意让搜索引擎抓取。

比如,一个网站刚刚搭建,还没有什么实质性的内容,不想立刻对外开放,也不想给搜索引擎留下不好的第一印象,于是可以选择不让蜘蛛抓取。这一步实现起来也很简单,主要是利用网站中的一个叫做robots.txt的协议文件告诉蜘蛛是否可以抓取本网站,甚至进一步规定哪些页面可以抓取,哪些页面不可以抓取。

想要查看一个网站的robots文件也很简单,比如查看云点SEO网的robots文件,可以在浏览器中输入下述地址访问即可:

seo-guide-2.png

通过访问查看到的robots协议主要内容如下:

seo-guide-3.png

其中,User-agent规定对象是哪个搜索引擎的蜘蛛,如果面向所有搜索引擎就使用*这个符号;Disallow代表不允许抓取的内容;Allow代表允许抓取的内容;Sitemap代表网站xml地图所在位置。

以上内容就告诉所有搜索引擎的蜘蛛,/wp-admin/这个目录除了admin-ajax.php可以抓取,其余均不可以抓取。另外,网站其他内容没有做规定,默认均可抓取。所以,如果robots.txt这个文件是空白的,也就默认所有内容均可抓取。


技巧2:抓取的路径(概念)

seo-guide-4.png

在获得网站内容抓取权限后,蜘蛛就会开始自己的抓取工作,搜集网站中各个网页的信息。前面提到过,蜘蛛是顺着链接爬行的,所以你的网站中的各个页面需要有链接联系起来,这样才能方便蜘蛛爬行抓取,这些链接也就是我们说的内链。

内链的一般形式有:各类导航链接、文中链接、图片链接等。如果你的某一个网页,其他页面上均无法跳转到,sitemap站点地图里也没有,外部也没有任何链接指向它,那么这个页面蜘蛛也就无法到达了,除非你单独提交给搜索引擎,但这种页面也就没什么意义了。

另外,蜘蛛的抓取工作不一定都是通过首页开始的,可能蜘蛛是顺着别的网站指向你网站中的某个页面的链接爬进来的,也就是通过外链来到了你的网站。所以,外链也能起到帮助网站被抓取的作用。


技巧3:可以抓取到的内容(概念)

即便robots规则没有阻止抓取,搜索引擎的蜘蛛抓取工具也不是任何内容都可以抓取到的。和我们肉眼查看网站的方式不一样,搜索引擎看的是网站被抓取到的源代码。

比如下面这个页面,我们看到的内容是这个样子:

seo-guide-5.png

而,搜索引擎看的是蜘蛛抓取到的网页代码,不含任何设计样式:

seo-guide-6.png

任何内容都是以代码的方式呈现在搜索引擎眼中:

seo-guide-7-1500x470.png


所以,即便有些内容我们可以观察到,但如果不能很好地显示在代码中,那对于搜索引擎来说就是无法识别的。

在所有的网站编程语言中,Html是搜索引擎最容易识别抓取的代码,这也是为什么做SEO时要求网站必须有静态化的Html代码的原因,动态的代码程序会导致搜索引擎无法识别抓取或者抓取不完全。

我看到过不少外贸网站,首页就是一个动态的Flash动画,视觉效果确实很不错,但对于搜索引擎来说,你的首页基本上就是个空白的页面,因为搜索引擎理解不了你的Flash内容。永远不要把一个Flash动画作为网站首页,这对于SEO非常不利。


技巧4:查看谷歌快照

如果一个页面已经被Google抓取并收录,那么这个页面就会有个谷歌快照。通过输入“cache:网址”的指令,即可查看该网页的谷歌快照,例如:

seo-guide-8.png

该页面的快照(为了方便人们查看,快照不是纯代码形式,也是会应用设计样式的):

seo-guide-9.png

通过对比网页和谷歌快照,你可以查看网页内容被抓取的情况。如果很多内容都无法显示在谷歌快照里,那么就该想办法调整了。如果你想看下网页在Google眼中的内容情况,可以点击上图中的“纯文字版本”,这就是谷歌过滤掉很多代码后查看到的网站内容。


收录规则(Indexing)

搜索引擎在对网站进行抓取后,会判断抓取到的网页是否值得收录到自己的数据库中。要知道,互联网上的网站不计其数,每个网站又有数量不一的网页,这是个非常庞大的数据量,搜索引擎不可能对所有网页都进行无差别收录,即便是Google这样拥有全球最大数据库容量的公司也无法做到。

所以,搜索引擎在收录网页时是会进行挑选的,不是所有网页均有机会被收录。这也是我们给客户做SEO时,一直强调网站内容不要抄袭、网页内容尽量做得丰富的原因。网页拥有高质量的内容,才是保障收录的最好方法。只有被收录了,才有参与到排名的机会。


技巧5:如何快速查看网站的谷歌收录情况

想要确认自己的网站是否已经被谷歌收录其实很简单,只需使用谷歌搜索指令site:即可。比如,我方云点SEO网的谷歌收录情况,在Google搜索中输入:site:box-media.cn,就可以看到如下结果:

image.png

如图所示,一共找到了202条结果,代表着本站共有202个网页被谷歌收录。注意:这个查询数量不可以当做网站的页面数量,因为你的网站页面不一定已被收录。翻到搜索结果最后一页,再次查看一下,你会发现显示的结果数往往会少一些:

image.png

这是因为,开始显示的收录数量是谷歌索引库中已经收录的页面数量,点到最后一页显示的数量是不仅被收录而且会展示出来的页面数量,也叫做有效页面,只有这些页面才有机会参与到排名中。


网页收录有快有慢,一开始没被收录不代表就一定有问题,我遇到过有的客户网站部分页面是在网站上线几个月后才陆续被收录、展示出来。

现在的谷歌收录网站速度比两年前慢了许多,要求也更加的严格。一般情况下,网站如果没有什么问题,它的大部分页面应该能够在1个月的时间内被谷歌逐步收录。如果超过了这个时间,网站一直都还是0收录,或者收录比率很小,你就该找找原因了。

同理,site:指令可以用来查询具体某个页面是否已经被谷歌收录,:号后面接着网页的网址即可(不需要加http形式的开头),以本页面举例:site:box-media.cn/waimaoseo/


排名规则(Ranking)

排名是搜索引擎工作机制的最后一步。当收到用户的查询时,搜索引擎会根据自身复杂的算法来匹配已经收录到数据库中的网页,按照评分排序,决定出这些网页在搜索结果中出现的位置。

所以说,搜索算法是搜索引擎的核心技术。如果谁能够掌握Google的具体算法,那么他就能够操控谷歌排名。显然,这是不可能发生的事情。算法是搜索引擎的核心机密,而且在不断地升级更新中,根本不可能泄露或者被测试出来。

因此,很多拿着“保证排名”做口号的SEO公司都只是在搞噱头套路罢了。

技巧6:谷歌算法与排名因素(概念)

搜索引擎的算法也不是毫无痕迹的。比如,Google就曾多次公布其算法里包含的某个排名因素。国外有些SEO大牛也做过相关总结,整理出了200多个谷歌排名因素,这些排名因素有些被证实过,有些也只是猜测。

事实上,就算知道了确切的排名因素也无法完全操控排名,因为你不清楚这些排名因素在Google算法里的具体比重是多少。只能说,有利于排名的因素尽量都做好,不利于排名的因素尽量都避免。

具体如何做好以及避免,就需要长时间的经验积累了。其中有些排名因素是大家公认比较重要的,比如:

  • 网站内容

  • 网站质量

  • 用户体验

  • 网站速度

  • 等等

Google排名的目的是为用户提供最符合对方需求的信息;所以,谷歌关键词排名不是一个不变的结果,Google总是会把更好的网页排到更高的位置。因此,即便你的网站排入了谷歌首页,那也不是意味着SEO的结束。

后期,你仍然需要保持网站内容的更新,创造出更多有价值的内容出来,对于新产生的大量页面也需要通过合理优化让它们能够为网站提供更多的谷歌权重,以维持排名的稳定,并获得进一步提升的机会。

SEO是一个长期性的工程。即便你的网站排到了Google首页,也不代表就可以放手不管了,想要稳定排名和进一步提高,你就得创造更多有价值的内容,获取更多的谷歌权重,保持网站的竞争力。