书接上回,继续说建站,这次我们主要讲如何让搜索引擎发现我们,也就是收录我们,这里我假设你已经做好了静态站点,不管你使用的什么静态网站生成工具.
这个问题其实都不是问题,如果搜索引擎都不收录我们的网站,试问别人如何得知你有个网站呢?都不知道你的网站了,谈何访问量?因为只有搜索引擎收录了你,用户在搜索相应的关键词的时候,搜索引擎才能把你的网站推荐给对方.
搜索引擎自身有爬虫,收录网站基本就两种方式.
sitemap.xml文件,这里有篇文章介绍了这个文件的格式.你需要自己编写下这个文件,但是现在一般的静态生成器都有对应的sitemap插件,你可以自行搜索下,一般都有的.基本就这 2 种方式了,个人觉得第二种更高效,也更方便,推荐大家都使用第二种方案.
这里有个新的东西出现了,叫做robots.txt,是一个文本文件,一般放在你的静态站点的根目录,格式在这里有说明.
简单来讲它的作用就是告诉搜索引擎,哪些网址可以被收录,哪些不能被收录.有人可能要问了,怎么还有不想被收录的?这里有 Google 能够收录的文件类型,你可以看到它能收录的东西太多了,必定会有一些是你不愿意被爬虫爬到的,这时就需要这个robots.txt派上用场了.这个文件可以利用一些在线的生成工具来生成,不必自己编写,只需要定义好哪些地址是能被索引的,哪些是不能被索引的就可以,比如去这里生成,对了它还可以定义允许哪些搜索引擎的爬虫来爬,比如你很讨厌baidu,可以屏蔽它,前提是对方遵守游戏规则.
到这里,可以考虑上线你的网站了,这里我直接使用了CF的Pages服务,部署的静态站点.大家可以自行选择,比如之前提到的Vercel也是非常不错的,千万不要自己购买vps,搭建nginx之类的,那会很麻烦,还要自己申请免费的ssl证书,管理nginx,投入过大,不划算也没必要.
至于CF上线Pages很简单,大家按照官方文档操作就可以了,还支持绑定自定义域名+免费ssl证书,不香吗?
好了,到了这一步,完事具备,只欠东风了,我们的静态站点已经做好了,各种准备也已经到位了,目前全世界最大的搜索引擎是Google,当然要首先告知Google了.去注册一个GSC(Google Search Console)账号,就是Google站长工具,在这里你可以提交你的sitemap地址或者单个的URL.
下图是我提交的 sitemap,可以看到,这个地址里面包含了 21 个网页.

提交完成后一般需要耐心等待搜索引擎过来爬取你的网站,这个过程每个人不一样,有的 1-2 天就被收录了,有的等了 1-2 周.我这个站基本 2-3 天就有被收录了.
这只是GSC,还有其他的搜索引擎,比如Bing,比如Yandex等,都可以自己去提交sitemap,一般这些站点都需要验证你的网站所有权,基本都是放一个文件到你的静态站点根目录,或者dns TXT记录的方式,大家根据提示自行操作即可.
刚提交完sitemap的时候,我感觉要起飞了,恨不得立刻被收录.实际上这个过程就是等.2-3 天基本Google能收录,其他的不好说,最坑的是Yandex,7 8 天才有收录.查看收录的办法主要有 2 个:
sitemap的地方一般会有显示.如果没被索引,下面也会告诉你原因.
Google的,在 Google 的搜索框里输入site:你的站点地址,比如我的site:jsonconvert.net
这里你可以核对下,你的sitemap文件中的地址和实际Google搜索出来的地址是否一致,如果搜索出来的还要少,你可能需要在GSC上看看原因了,比如上图我有的被Robots.txt屏蔽了,有的返回了 HTTP 状态码301或者302,或者没有带canonical标签,大家根据提示自行修改即可.
我想你大概率会遇到以下一些不收录的情况,我这里列举下我遇到的,以及对应的方案:
canonical标签,比如https://example.com/search?key=haha和https://example.com/search?key=ha所渲染出来的结果是一样的,那么就说这个页面有多个地址,你需要在你的页面里明确的告知搜索引擎,哪个才是主要的地址,希望搜索引擎收录的地址,AHRefs有一篇文章对于这个讲的非常好,推荐大家去看看.200,而是返回了301,302类的跳转,搜索引擎对这个没办法处理,有一种情况是你的站点是全站https,所以http访问会自动跳转到https,这种没办法,我没找到好的办法.CF在这里有个天坑,访问你的静态页面,比如html后缀的,它会把.html去掉,换成/访问,比如https://jsonconvert.net/json-to-xml/index.html,它会自己返回308跳转到https://jsonconvert.net/json-to-xml/,我最后没找到什么好的解决办法,索性 URL 就按照CF的来,在最后加一个/,原因就是在于json-to-xml是一个文件夹,里面有个index.html,但是这个是Hexo生成的,我也没研究如何更改它,所以按照CF来,这个地址还更短,更好看.URL不对,改对了就行.网站上线了之后需要干什么?当然是检测又没人访问你的站点了.这个后续有人看的话,我会继续写一些我实践过的文章.目前最重要的是找一些免费的SEO检测工具,对我们的网站来个体检,看看有没有需要优化和整改的地方.这里我推荐几个,都是我使用过的.
以下是使用 seoptimer 对 jsonconvert.net 的 SEO 检测结果

可以看到得分是B-,说明还有待提高,最好是能到A+,我看了下主要问题是出在了网页的meta tag的title和description上,字数超长了,接下来我会改掉,争取到A+
它还可以显示在搜索引擎的 SERP 结果预览.大家可以根据页面上的提示,自我修复下,尽量保持A+得分.

SEO能看出效果的,最短也要 3-6 个月,保持耐心,每天上Google用site指令看看收录情况,根据GSC里的数据看看哪些关键词经常被搜索,但是缺没有点击,找找原因,分析下,优化了试试.就是如此.
这篇文章到这里就结束了,本文主要针对的是Google搜索引擎,建议建站使用英文,因为国内的CPC很低,不是很推荐大家做中文站点.最后,这次说是失败了,其实也学到了不少的东西,后面我又建了个Online Timer的站点,这是后话了,建第二个站明显就比第一个要快,知道哪些坑应该避过去,但是又进入了新的坑,后续我还会继续分享,感兴趣的朋友们可以收藏下,也欢迎转发,保留出处即可.
希望这篇文章能帮屏幕前的你!
猜你想看
大纲
分类
相关的文章
友情链接