当前位置:首页 > 建站优化 > 正文内容

制作网站的可视化软件(做数据可视化的网站)

zhuangbi888.com2021-03-07 21:31建站优化803

网站日志该分析哪些数据呢?从基础信息、目录抓取、时间段抓取、IP抓取、状态码这几点来分析:

  第一、基础信息

  下载一个网站日志文件工具获取基础信息:总抓取量、停留时间(h)及访问次数;通过这三个基础信息可以算出:平均每次抓取页数、单页抓取停留时间,然后再用MSSQL提取蜘蛛唯一抓取量,根据以上的数据算出爬虫重复抓取率:

制作网站的可视化软件(做数据可视化的网站)

  平均每次抓取页数=总抓取量/访问次数

  单页抓取停留时间=停留时间*3600/总抓取量

  爬虫重复抓取率=100%—唯一抓取量/总抓取量

  统计出一段时间的数据,可以看出整体趋势是什么样的,这样就可以发现问题,才能够调整网站的整体策略。下面用一个站长的日志基础信息为例:

日志基础信息

  从日志的基本信息,我们需要看它的整体趋势来调整,哪些地方需要加强。

网站日志文件该分析哪些数据

总抓取量

  从这个整体走势来看出,爬虫的抓取总量整体是在下降的,这个就需要我们进行一些相应的调整。

网站日志文件该分析哪些数据

蜘蛛重复抓取率

  整体来看,网站重复抓取率是有点上升的,这个就需要一些细节,多一些为抓取的入口和使用一些robots及nofollow技巧。

制作网站的可视化软件(做数据可视化的网站)

单面停留时间

  爬虫单面的停留时间,曾经有看到过一篇软文,网页加载速度是如何影响SEO流量的;提高网页加载速度,减少爬虫单面停留时间,可以为爬虫的总抓取做出贡献,进而增加网站收录,从而提高网站整体流量。在16号至20号左右服务器出现一些问题,之后进行调整后,速度明显变快,单页停留时间也相应的下来了。

  而对此进行相应调整如下:

  从本月整理来看,爬虫的抓取量是下降的,重复抓取率是上升的。综合分析,需要从站内链接和站外的链接进行调整。站内的链接尽量的带锚文本,如果不能带的话,可以推荐其他页面的超链接,让蜘蛛尽可能的深层次的抓取。站外链接的话,需要多方面的发布。目前平台太少了,如果深圳新闻网、商国互联等站点出现一丝差错的话,我们站点将受到严重影响。站外平台要广,发布的链接要多样话,不能直发首页的,栏目及文章页面需要加大力度。目前,来讲站外平台太少,将近10w的外部链接,集中在几个平台上。

  第二、目录抓取

  用MSSQL提取出爬虫抓取的目录,分析每日目录抓取量。可以很清晰的看到每个目录的抓取情况,另外可以对比之前的优化策略,优化是否合理,重点的栏目优化是不是预期的效果。

爬虫抓取的目录

  绿色:主做栏目 黄色:抓取较差 粉色:抓取很差 深蓝色:需要禁止栏目

网站日志文件该分析哪些数据

目录整体趋势

  可以看到整体的趋势并没有太大变化,只有两个栏目的抓取是有较大变动的。

  整体抓取较少。主做栏目中,抓取较少的为:xxx、xxx、xxx。对于总体来说,需要加大整个网站的导入口,需要外链配合,站内需要加强内部链接的构建。对于,爬取较弱栏目进行加强处理。同时,深蓝色的栏目写入robots中,将其屏蔽,并将网站中导入到这些栏目是URL进行nofollow避免权重只进不出。

  第三、时间段抓取

  通过excel中的数组函数,提取每日的时间段的爬虫抓取量,重在分析每日的抓取情况,找到相应的抓取量较为密集的时间段,可以针对性的进行更新内容。同时,还可以看出,抓取不正常情况。

网站日志文件该分析哪些数据

时间段抓取

  某日哪个时间点出问题了,而且同样是总抓取是下降的趋势。

网站日志文件该分析哪些数据

时间段趋势

  通过时间段抓取,我们进行相应的调整:

  通过图中的表色,可以看出服务器并不是特别的稳定,我们需要加强服务器的稳定性。另外,17、18、19三天,连续被人攻击、挂链等,但是爬虫抓取正常,这说明这些对网站已经造成了一定影响!

  第四,IP段的抓取

  通过MSSQL提取日志中的爬虫的IP,通过excel进行统计,每日每个IP的抓取量,同样我们需要看整体,如果IP段没有明显的变化的话,网站升降权是没有多大问题的。因为在网站升权或者降权的时候,爬虫的IP段会更换的。

网站日志文件该分析哪些数据

IP段抓取

  第五,状态码的统计

  在这个之前你需要了解下,HTTP状态码返回值代表是什么。

状态码统计

  如果一个网站被搜索引擎抓取的次数以及频率越多那么他是越有利于排名的,但是如果你的网站出现太多的304,那么一定会降低搜索引擎的抓取频率以及次数,从而让自己的网站排名比别人落一步。调整:服务器可以清除下缓存。

状态码统计

  百度爬虫的数据图,密密麻麻的数据,以上所有的数据都是从这里调用出来的

相关文章

中小型企业应该如何做好网络品牌推广?

中小型企业应该如何做好网络品牌推广?

对于中小企业来说,预算有限,不可能像大企业烧钱推广,那如何进行有限网络推广,个人认为有以下几点。 一、同行查看分析 既然做网络推广,就要知己知彼,查看整理分析竞争对手的推广渠道和预估费用。 目前网...

如何获取网页的地址(如何获取网页视频源地址)

如何获取网页的地址(如何获取网页视频源地址)

点击收藏夹中的链接等待网页加载完成按快捷键Ctrl+S保存即可搜狗浏览器由搜狗公司开发,基于谷歌chromium内核,力求为用户提供跨终端无缝的使用体验,让上网更简单、网页阅读更流畅,首创“网页关注”...

想在网上学习电工,有什么资源大家推荐一下?

想在网上学习电工,有什么资源大家推荐一下?

有(yǒu)高壓(yā)電(diàn)工(gōng),强電(diàn)電(diàn)工(gōng),弱電(diàn)電(diàn)工(gōng),灯泡電(diàn)工(gōng),不知你要學(xué)...

南通互联网公司(南通网站制作公司公司)

南通互联网公司(南通网站制作公司公司)

你好,康哥来回答下此问题。 一、1999年的11家互联网公司有哪些?1999年的互联网公司有,阿里巴巴、中华网、当当、携程、盛大、易趣、天涯社区、ChinaRen、8848、红袖添香、亿唐网。 二、1...

建立网站费用表(创建网站需要多少资金)

很多单位在制作网站前都会考虑这个问题,很多第一次做网站的单位和很多网络公司接触时候会发现收费项目繁多,网站制作费用主要包括以下4方面的明细:1、域名2、空间(虚拟主机)3、网站制作费用4、网站维护费用...

如何建立企业网站?如何建立企业网站更适合城市区域化?电子商务行业如何建立企业网站?

如何建立企业网站?如何建立企业网站更适合城市区域化?电子商务行业如何建立企业网站?

我概括起来说以下两点: 1、 最好不要独立建站;借力大型平台建站,有利节约成本,招揽客户,功能强大,简单维护; 2、 选择有针对性的平台;如果是从事全国性推广的企业,选择阿里、慧聪等;而从事本地生...

有什么好的手机移动办公软件可以推荐?

有什么好的手机移动办公软件可以推荐?

这些App肯定就能够帮助你完成很多的工作,轻松简单就能够帮助你完成你想要的功能的哦,操作简单轻松就能够帮助你了。 万彩办公大师 一款体积小巧功能强大的工具,聚合各种实用的办公小工具,包括PDF、格式转...

注册域名需要哪些手续(注册域名需要什么)

注册域名需要哪些手续(注册域名需要什么)

1、首先定位好,要注册什么样的域名,在国内来说最好的域名是拼音域名,双拼不多了,三拼四拼很多了,注意多列几个,以备选择。 2、在注册前可以进行查询,查看下你所在的域名有没有注册,大部分好记的域名都让别...

评论列表

摄影做网站
摄影做网站
2021-03-07 21:47

网站日志该分析哪些数据呢?从基础信息、目录抓取、时间段抓取、IP抓取、状态码这几点来分析:  第一、基础信息  下载一个网站日志文件工具获取基础信息:总抓取量、停留时间(h)及访问次数;通过这三个基础信息可以算出:平均每次抓取页数、单页

虚拟邮局域名
虚拟邮局域名
2021-03-07 21:47

权重只进不出。  第三、时间段抓取  通过excel中的数组函数,提取每日的时间段的爬虫抓取量,重在分析每日的抓取情况,找到相应的抓取量较为密集的时间段,可以针对性的进行更新内容。同时,还可以看出,抓取不正常情况。网站日志文件该分析哪些数据时间段抓取  某日哪个时间点出

.tr域名
.tr域名
2021-03-07 21:47

行相应的调整:  通过图中的表色,可以看出服务器并不是特别的稳定,我们需要加强服务器的稳定性。另外,17、18、19三天,连续被人攻击、挂链等,但是爬虫抓取正常,这说明这些对网站已经造成了一定影响! 

发表评论

访客

看不清,换一张

◎欢迎参与讨论,请在这里发表您的看法和观点。