robots.txt文件时seo优化中非常重要的一个文件,也是(shì)我们seo培训的重点之一。槼(guī)范合适的抒写robots.txt文件,可以(yǐ)有效的提升蜘蛛(zhū)抓取(qǔ)的效率,避免造成(chéng)搜索引(yǐn)擎蜘蛛(zhū)封禁(jìn)的情况。下(xià)面郑州seo杨超就来解释一下(xià)robots协议怎么写。
什么是(shì)robots.txtRobots协议:網(wǎng)站(zhàn)通过Robots协议告诉搜索引(yǐn)擎哪些页面可以(yǐ)抓取(qǔ),哪些页面不(bù)能抓取(qǔ)。 协议写在robots.txt文件里面。
要不(bù)要使用robots.txt1、如果你的網(wǎng)站(zhàn)有部(bù)分内容不(bù)希望搜索引(yǐn)擎抓取(qǔ),那么请设置robots.txt
2、如果你的網(wǎng)站(zhàn)全部(bù)内容都需要被搜索引(yǐn)擎抓取(qǔ),可以(yǐ)不(bù)设置。
3、一般来说,一些后台文件(如css、js)、用户隱(yǐn)私(sī)的文件不(bù)用被搜索引(yǐn)擎抓取(qǔ)。
4、如果有些文件频繁被蜘蛛(zhū)抓取(qǔ),但是(shì)这些文件又是(shì)不(bù)重要的,那么可以(yǐ)用robots.txt进行屏蔽。
robots.txt的用法User-agent: * 这里的*代表的所有的搜索引(yǐn)擎種(zhǒng)类,*是(shì)一个通配符
Disallow: /文件夹名称/ 这里定義(yì)是(shì)禁(jìn)止爬取(qǔ)这个文件夹下(xià)面的目錄(lù)
Disallow: /cgi-bin/*.htm 禁(jìn)止访問(wèn)/cgi-bin/目錄(lù)下(xià)的所有以(yǐ)”.htm”为后缀的URL(包含(hán)子目錄(lù))。
Disallow: /*?* 禁(jìn)止访問(wèn)網(wǎng)站(zhàn)中所有包含(hán)問(wèn)號(hào) (?) 的網(wǎng)址
Disallow: /.jpg$ 禁(jìn)止抓取(qǔ)網(wǎng)页所有的.jpg格式(shì)的图片
Disallow:/ab/adc.html 禁(jìn)止爬取(qǔ)ab文件夹下(xià)面的adc.html文件。
Allow: /cgi-bin/ 这里定義(yì)是(shì)允(yǔn)许爬寻cgi-bin目錄(lù)下(xià)面的目錄(lù)
Allow: /tmp 这里定義(yì)是(shì)允(yǔn)许爬寻tmp的整个目錄(lù)
Allow: .htm$ 僅(jǐn)允(yǔn)许访問(wèn)以(yǐ)”.htm”为后缀的URL。
Allow: .gif$ 允(yǔn)许抓取(qǔ)網(wǎng)页和gif格式(shì)图片
Sitemap: 網(wǎng)站(zhàn)地(dì)图的URL 告诉爬虫这个页面是(shì)網(wǎng)站(zhàn)地(dì)图
robots.txt示例# robots.txt for 阅读青春readu.net
User-agent: *
Allow: /
Disallow: /wp-admin/
Disallow: /wp-includes/
Disallow: /wp-content/plugins/
Disallow: /?r=*
robots标签的用法(mate标签是(shì)写在網(wǎng)页head里面的代码)<meta name=”robots” content=”nofollow”> 所有搜索引(yǐn)擎都不(bù)允(yǔn)许爬行
<meta name=”baiduspider” content=”nofollow”> 百度搜索引(yǐn)擎不(bù)允(yǔn)许爬行
<meta name=”robots” content=”noarchive”> 所有搜索引(yǐn)擎都不(bù)允(yǔn)许收錄(lù)
<meta name=”baiduspider” content=”noarchive”> 百度搜索引(yǐn)擎都不(bù)允(yǔn)许收錄(lù)
robots.txt具体用途1、一个页面对应多个URL时,应屏蔽多余的URL。
2、如果網(wǎng)站(zhàn)有页面是(shì)没有实质性内容的,应该屏蔽掉。
3、如果網(wǎng)站(zhàn)改版删除了大量(liàng)的页面(404),应该屏蔽掉。
4、如果是(shì)UGC網(wǎng)站(zhàn),用户产生了大量(liàng)的不(bù)良(liáng)内容,应该屏蔽掉。
5、不(bù)希望被搜索引(yǐn)擎索引(yǐn)的内容(后台界面、用户隱(yǐn)私(sī)),应该屏蔽掉。
要想知道网页打不开的原因,我们需要从网页是怎么打开的原理讲起,相信这样更有助于帮助你理解。考虑到部分内容需要一定专业度的问题,讲的时候我会省略掉一些细节。 网页打开过程 我们把网页打开的过程假设成我要...
创办商业网站需要的资金少,但一样非常辛苦的,一般来说步骤如下: 第一步,购买一个域名。域名的价格大约是每年几十元,关于域名申请的一些注意事项,请参考我的其他文章。 第二步,购买网站空间。每年的费用从几...
网上申请的域名不是动态的 你家里的IP才是动态的 如果把动态的地址绑定静态的域名需要花生壳软件 FTP需要Serv-U软件 Serv-U 是一种被广泛运用的FTP服务器端软件,支持 9x/ME/NT/...
一般来说,通过一些域名服务商(提供域名注册,转入以及转出等服务的供应商),都可以查询到域名的状态信息,比如你可以试一下 cndns.cn ,在首页输入你要查询的域名就可以了,下面演示一下查询新浪域名(...
域名过户是指修改域名所有人。CN域名过户需要提供: 1、买卖双方的营业执照副本(有年审记录)复印件;复件上要加盖公章。 2、买卖双方的注册人身份证复印件; 3、下载域名过户申请表格:填写上面的信息...
电信宽带拥有公网IP,如果要在任何地方,访问家里的网络设备,比如家庭监控、NAS等,那么还需要以下两步才行: 端口映射 DDNS动态域名绑定  ...
织梦CMS收费意味着什么? 作为一款使用率非常高的免费开源内容管理系统,织梦CMS一直以来都是不少站长、企业搭建网站时的首选,据官方资料,目前有超过35万个网站在使用织梦的产品,这次收费通知一出来,想...
就是“网站排名提升”和“销售量提升”。 需要注意的问题: 1、网站定位; 2、网站内容; 3、网站内部结构; 4、网站外部的布局; 4、企业的产品优势; 5、企业的服务优势等。 企业网站做seo的优势...