书接上回,继续说建站,这次我们主要讲如何让搜索引擎发现我们,也就是收录我们,这里我假设你已经做好了静态站点,不管你使用的什么静态网站生成工具.
这个问题其实都不是问题,如果搜索引擎都不收录我们的网站,试问别人如何得知你有个网站呢?都不知道你的网站了,谈何访问量?因为只有搜索引擎收录了你,用户在搜索相应的关键词的时候,搜索引擎才能把你的网站推荐给对方.
搜索引擎自身有爬虫,收录网站基本就两种方式.
sitemap.xml
文件,这里有篇文章介绍了这个文件的格式.你需要自己编写下这个文件,但是现在一般的静态生成器都有对应的sitemap
插件,你可以自行搜索下,一般都有的.基本就这 2 种方式了,个人觉得第二种更高效,也更方便,推荐大家都使用第二种方案.
这里有个新的东西出现了,叫做robots.txt
,是一个文本文件,一般放在你的静态站点的根目录,格式在这里有说明.
简单来讲它的作用就是告诉搜索引擎,哪些网址可以被收录,哪些不能被收录.有人可能要问了,怎么还有不想被收录的?这里有 Google 能够收录的文件类型,你可以看到它能收录的东西太多了,必定会有一些是你不愿意被爬虫爬到的,这时就需要这个robots.txt
派上用场了.这个文件可以利用一些在线的生成工具来生成,不必自己编写,只需要定义好哪些地址是能被索引的,哪些是不能被索引的就可以,比如去这里生成,对了它还可以定义允许哪些搜索引擎的爬虫来爬,比如你很讨厌baidu
,可以屏蔽它,前提是对方遵守游戏规则.
到这里,可以考虑上线你的网站了,这里我直接使用了CF
的Pages
服务,部署的静态站点.大家可以自行选择,比如之前提到的Vercel
也是非常不错的,千万不要自己购买vps
,搭建nginx
之类的,那会很麻烦,还要自己申请免费的ssl
证书,管理nginx
,投入过大,不划算也没必要.
至于CF
上线Pages
很简单,大家按照官方文档操作就可以了,还支持绑定自定义域名+免费ssl
证书,不香吗?
好了,到了这一步,完事具备,只欠东风了,我们的静态站点已经做好了,各种准备也已经到位了,目前全世界最大的搜索引擎是Google
,当然要首先告知Google
了.去注册一个GSC(Google Search Console)
账号,就是Google站长工具
,在这里你可以提交你的sitemap地址
或者单个的URL
.
下图是我提交的 sitemap,可以看到,这个地址里面包含了 21 个网页.
提交完成后一般需要耐心等待搜索引擎过来爬取你的网站,这个过程每个人不一样,有的 1-2 天就被收录了,有的等了 1-2 周.我这个站基本 2-3 天就有被收录了.
这只是GSC
,还有其他的搜索引擎,比如Bing
,比如Yandex
等,都可以自己去提交sitemap
,一般这些站点都需要验证你的网站所有权,基本都是放一个文件到你的静态站点根目录,或者dns TXT
记录的方式,大家根据提示自行操作即可.
刚提交完sitemap
的时候,我感觉要起飞了,恨不得立刻被收录.实际上这个过程就是等.2-3 天基本Google
能收录,其他的不好说,最坑的是Yandex
,7 8 天才有收录.查看收录的办法主要有 2 个:
sitemap
的地方一般会有显示.如果没被索引,下面也会告诉你原因.Google
的,在 Google 的搜索框里输入site:你的站点地址
,比如我的site:jsonconvert.net
这里你可以核对下,你的sitemap
文件中的地址和实际Google
搜索出来的地址是否一致,如果搜索出来的还要少,你可能需要在GSC
上看看原因了,比如上图我有的被Robots.txt
屏蔽了,有的返回了 HTTP 状态码301
或者302
,或者没有带canonical
标签,大家根据提示自行修改即可.
我想你大概率会遇到以下一些不收录的情况,我这里列举下我遇到的,以及对应的方案:
canonical
标签,比如https://example.com/search?key=haha
和https://example.com/search?key=ha
所渲染出来的结果是一样的,那么就说这个页面有多个地址,你需要在你的页面里明确的告知搜索引擎,哪个才是主要的地址,希望搜索引擎收录的地址,AHRefs
有一篇文章对于这个讲的非常好,推荐大家去看看.200
,而是返回了301
,302
类的跳转,搜索引擎对这个没办法处理,有一种情况是你的站点是全站https
,所以http
访问会自动跳转到https
,这种没办法,我没找到好的办法.CF
在这里有个天坑,访问你的静态页面,比如html
后缀的,它会把.html
去掉,换成/
访问,比如https://jsonconvert.net/json-to-xml/index.html
,它会自己返回308
跳转到https://jsonconvert.net/json-to-xml/
,我最后没找到什么好的解决办法,索性 URL 就按照CF
的来,在最后加一个/
,原因就是在于json-to-xml
是一个文件夹,里面有个index.html
,但是这个是Hexo
生成的,我也没研究如何更改它,所以按照CF
来,这个地址还更短,更好看.URL
不对,改对了就行.网站上线了之后需要干什么?当然是检测又没人访问你的站点了.这个后续有人看的话,我会继续写一些我实践过的文章.目前最重要的是找一些免费的SEO
检测工具,对我们的网站来个体检,看看有没有需要优化和整改的地方.这里我推荐几个,都是我使用过的.
以下是使用 seoptimer 对 jsonconvert.net 的 SEO 检测结果
可以看到得分是B-
,说明还有待提高,最好是能到A+
,我看了下主要问题是出在了网页的meta tag
的title
和description
上,字数超长了,接下来我会改掉,争取到A+
它还可以显示在搜索引擎的 SERP 结果预览.大家可以根据页面上的提示,自我修复下,尽量保持A+
得分.
SEO
能看出效果的,最短也要 3-6 个月,保持耐心,每天上Google
用site
指令看看收录情况,根据GSC
里的数据看看哪些关键词经常被搜索,但是缺没有点击,找找原因,分析下,优化了试试.就是如此.
这篇文章到这里就结束了,本文主要针对的是Google
搜索引擎,建议建站使用英文,因为国内的CPC
很低,不是很推荐大家做中文站点.最后,这次说是失败了,其实也学到了不少的东西,后面我又建了个Online Timer的站点,这是后话了,建第二个站明显就比第一个要快,知道哪些坑应该避过去,但是又进入了新的坑,后续我还会继续分享,感兴趣的朋友们可以收藏下,也欢迎转发,保留出处即可.
希望这篇文章能帮屏幕前的你!
猜你想看
大纲
分类
相关的文章
友情链接