当前位置:首页 > 建站优化 > 正文内容

roobts.txt该怎么写?

zhuangbi888.com2021-05-07 04:30建站优化279

robots.txt文件时seo优化中非常重要的一个文件,也是(shì)我们seo培训的重点之一。槼(guī)范合适的抒写robots.txt文件,可以(yǐ)有效的提升蜘蛛(zhū)抓取(qǔ)的效率,避免造成(chéng)搜索引(yǐn)擎蜘蛛(zhū)封禁(jìn)的情况。下(xià)面郑州seo杨超就来解释一下(xià)robots协议怎么写。

什么是(shì)robots.txtRobots协议:網(wǎng)站(zhàn)通过Robots协议告诉搜索引(yǐn)擎哪些页面可以(yǐ)抓取(qǔ),哪些页面不(bù)能抓取(qǔ)。 协议写在robots.txt文件里面。

要不(bù)要使用robots.txt1、如果你的網(wǎng)站(zhàn)有部(bù)分内容不(bù)希望搜索引(yǐn)擎抓取(qǔ),那么请设置robots.txt

2、如果你的網(wǎng)站(zhàn)全部(bù)内容都需要被搜索引(yǐn)擎抓取(qǔ),可以(yǐ)不(bù)设置。

3、一般来说,一些后台文件(如css、js)、用户隱(yǐn)私(sī)的文件不(bù)用被搜索引(yǐn)擎抓取(qǔ)。

4、如果有些文件频繁被蜘蛛(zhū)抓取(qǔ),但是(shì)这些文件又是(shì)不(bù)重要的,那么可以(yǐ)用robots.txt进行屏蔽。

robots.txt的用法User-agent: * 这里的*代表的所有的搜索引(yǐn)擎種(zhǒng)类,*是(shì)一个通配符

Disallow: /文件夹名称/ 这里定義(yì)是(shì)禁(jìn)止爬取(qǔ)这个文件夹下(xià)面的目錄(lù)

Disallow: /cgi-bin/*.htm 禁(jìn)止访問(wèn)/cgi-bin/目錄(lù)下(xià)的所有以(yǐ)”.htm”为后缀的URL(包含(hán)子目錄(lù))。

Disallow: /*?* 禁(jìn)止访問(wèn)網(wǎng)站(zhàn)中所有包含(hán)問(wèn)號(hào) (?) 的網(wǎng)址

Disallow: /.jpg$ 禁(jìn)止抓取(qǔ)網(wǎng)页所有的.jpg格式(shì)的图片

Disallow:/ab/adc.html 禁(jìn)止爬取(qǔ)ab文件夹下(xià)面的adc.html文件。

Allow: /cgi-bin/  这里定義(yì)是(shì)允(yǔn)许爬寻cgi-bin目錄(lù)下(xià)面的目錄(lù)

Allow: /tmp 这里定義(yì)是(shì)允(yǔn)许爬寻tmp的整个目錄(lù)

Allow: .htm$ 僅(jǐn)允(yǔn)许访問(wèn)以(yǐ)”.htm”为后缀的URL。

Allow: .gif$ 允(yǔn)许抓取(qǔ)網(wǎng)页和gif格式(shì)图片

Sitemap: 網(wǎng)站(zhàn)地(dì)图的URL 告诉爬虫这个页面是(shì)網(wǎng)站(zhàn)地(dì)图

robots.txt示例# robots.txt for 阅读青春readu.net

User-agent: *

Allow: /

Disallow: /wp-admin/

Disallow: /wp-includes/

Disallow: /wp-content/plugins/

Disallow: /?r=*

roobts.txt该怎么写?

robots标签的用法(mate标签是(shì)写在網(wǎng)页head里面的代码)<meta name=”robots” content=”nofollow”> 所有搜索引(yǐn)擎都不(bù)允(yǔn)许爬行

<meta name=”baiduspider” content=”nofollow”> 百度搜索引(yǐn)擎不(bù)允(yǔn)许爬行

roobts.txt该怎么写?

<meta name=”robots” content=”noarchive”> 所有搜索引(yǐn)擎都不(bù)允(yǔn)许收錄(lù)

<meta name=”baiduspider” content=”noarchive”> 百度搜索引(yǐn)擎都不(bù)允(yǔn)许收錄(lù)

robots.txt具体用途1、一个页面对应多个URL时,应屏蔽多余的URL。

2、如果網(wǎng)站(zhàn)有页面是(shì)没有实质性内容的,应该屏蔽掉。

3、如果網(wǎng)站(zhàn)改版删除了大量(liàng)的页面(404),应该屏蔽掉。

4、如果是(shì)UGC網(wǎng)站(zhàn),用户产生了大量(liàng)的不(bù)良(liáng)内容,应该屏蔽掉。

5、不(bù)希望被搜索引(yǐn)擎索引(yǐn)的内容(后台界面、用户隱(yǐn)私(sī)),应该屏蔽掉。

相关文章

有网络网站打不开(有网但浏览器用不了)

有网络网站打不开(有网但浏览器用不了)

要想知道网页打不开的原因,我们需要从网页是怎么打开的原理讲起,相信这样更有助于帮助你理解。考虑到部分内容需要一定专业度的问题,讲的时候我会省略掉一些细节。 网页打开过程 我们把网页打开的过程假设成我要...

商业网站设计(中国商业网站有哪些)

商业网站设计(中国商业网站有哪些)

创办商业网站需要的资金少,但一样非常辛苦的,一般来说步骤如下: 第一步,购买一个域名。域名的价格大约是每年几十元,关于域名申请的一些注意事项,请参考我的其他文章。 第二步,购买网站空间。每年的费用从几...

目前最大的软件(可以下载所有软件的网站)

目前最大的软件(可以下载所有软件的网站)

网上申请的域名不是动态的 你家里的IP才是动态的 如果把动态的地址绑定静态的域名需要花生壳软件 FTP需要Serv-U软件 Serv-U 是一种被广泛运用的FTP服务器端软件,支持 9x/ME/NT/...

怎么查询域名状态信息?

怎么查询域名状态信息?

一般来说,通过一些域名服务商(提供域名注册,转入以及转出等服务的供应商),都可以查询到域名的状态信息,比如你可以试一下 cndns.cn ,在首页输入你要查询的域名就可以了,下面演示一下查询新浪域名(...

域名转出和域名过户需提供什么资料?

域名转出和域名过户需提供什么资料?

域名过户是指修改域名所有人。CN域名过户需要提供: 1、买卖双方的营业执照副本(有年审记录)复印件;复件上要加盖公章。 2、买卖双方的注册人身份证复印件; 3、下载域名过户申请表格:填写上面的信息...

域名解析多个电信ip(批量ip反查域名在线工具)

域名解析多个电信ip(批量ip反查域名在线工具)

    电信宽带拥有公网IP,如果要在任何地方,访问家里的网络设备,比如家庭监控、NAS等,那么还需要以下两步才行: 端口映射 DDNS动态域名绑定  ...

织梦调用网站类型(织梦插件小千个人网)

织梦CMS收费意味着什么? 作为一款使用率非常高的免费开源内容管理系统,织梦CMS一直以来都是不少站长、企业搭建网站时的首选,据官方资料,目前有超过35万个网站在使用织梦的产品,这次收费通知一出来,想...

企业网站SEO优化应该注意哪些?怎么做?

企业网站SEO优化应该注意哪些?怎么做?

就是“网站排名提升”和“销售量提升”。 需要注意的问题: 1、网站定位; 2、网站内容; 3、网站内部结构; 4、网站外部的布局; 4、企业的产品优势; 5、企业的服务优势等。 企业网站做seo的优势...

发表评论

访客

看不清,换一张

◎欢迎参与讨论,请在这里发表您的看法和观点。