什么是robots.txt文件?
搜索引擎通过一种程序robot(又称spider),自动访问互联网上的网页并获取网页信息。
您可以在您的网站中创建一个纯文本文件robots.txt,在这个文件中声明该网站中不想被robot访问的部分,这样,该网站的部分或全部内容就可以不被搜索引擎收录了,或者指定搜索引擎只收录指定的内容。
robots.txt文件放在哪里?
robots.txt文件应该放在网站根目录下。举例来说,当robots访问一个网站(比如 http://www.abc.com/ )时,首先会检查该网站中是否存在 http://www.abc.com/robots.txt 这个文件,如果机器人找到这个文件,它就会根据这个文件的内容,来确定它访问权限的范围。
网站 URL 相应的 robots.txt的 URL
http://www.w3.org/
http://www.w3.org/robots.txt
http://www.w3.org:80/
http://www.w3.org:80/robots.txt
http://www.w3.org:1234/
http://www.w3.org:1234/robots.txt
http://w3.org/
http://w3.org/robots.txt
robots.txt文件的格式
"robots.txt"文件包含一条或更多的记录,这些记录通过空行分开(以CR,CR/NL, or NL作为结束符),每一条记录的格式如下所示:
"<field>:<optionalspace><value><optionalspace>"。
在该文件中可以使用#进行注解,具体使用方法和UNIX中的惯例一样。该文件中的记录通常以一行或多行User-agent开始,后面加上若干Disallow行,详细情况如下:
User-agent:
该项的值用于描述搜索引擎robot的名字,在"robots.txt"文件中,如果有多条User-agent记录说明有多个robot会受到该协议的限制,对该文件来说,至少要有一条User-agent记录。如果该项的值设为*,则该协议对任何机器人均有效,在"robots.txt"文件中,"User-agent:*"这样的记录只能有一条。
Disallow:
该项的值用于描述不希望被访问到的一个URL,这个URL可以是一条完整的路径,也可以是部分的,任何以Disallow开头的URL均不会被robot访问到。例如"Disallow:/help"对/help.html 和/help/index.html都不允许搜索引擎访问,而"Disallow:/help/"则允许robot访问/help.html,而不能访问/help/index.html。任何一条Disallow记录为空,说明该网站的所有部分都允许被访问,在"/robots.txt"文件中,至少要有一条Disallow记录。如果"/robots.txt"是一个空文件,则对于所有的搜索引擎robot,该网站都是开放的。
robots.txt文件用法举例 例1. 禁止所有搜索引擎访问网站的任何部分
下载该robots.txt文件 User-agent: *
Disallow: /
例2. 允许所有的robot访问 (或者也可以建一个空文件 "/robots.txt" file) User-agent: *
Disallow:
例3. 禁止某个搜索引擎的访问 User-agent: BadBot
Disallow: /
例4. 允许某个搜索引擎的访问 User-agent: baiduspider
Disallow:
User-agent: *
Disallow: /
例5.一个简单例子
在这个例子中,该网站有三个目录对搜索引擎的访问做了限制,即搜索引擎不会访问这三个目录。
需要注意的是对每一个目录必须分开声明,而不要写成 "Disallow: /cgi-bin/ /tmp/"。
User-agent:后的*具有特殊的含义,代表"any robot",所以在该文件中不能有"Disallow: /tmp/*" or "Disallow:*.gif"这样的记录出现. User-agent: *
Disallow: /cgi-bin/
Disallow: /tmp/
Disallow: /~joe/
robots.txt文件参考资料
robots.txt文件的更具体设置,请参看以下链接:
· Web Server Administrator's Guide to the Robots Exclusion Protocol
· HTML Author's Guide to the Robots Exclusion Protocol
· The original 1994 protocol description, as currently deployed
· The revised Internet-Draft specification, which is not yet completed or implemented
所谓“4M太太”,就是这样的太太:
1、收缩:专注于一个尽可能小的可能存在的难题,而你又能够解决这个难题。不要想着什么都做,贪多嚼不烂,搞不好就成了模仿者。小可以变大,船小好调头,小可以带给你很多优势,缝隙市场可以变成一个大市场。不要试图把1亿上网用户都当成你的用户,没用,能真正解决一部分用户的一部分需求,就足够你玩儿的。
2、差异:要记住很多人都在做着跟你一样的事情,而其中一个是Google。在这个市场上,专才比通才有用。不一定要做多么领先的事情,寻常的事情你同样可以做得跟别人不一样,比如Google。起名字也不要用那些通用词汇,比如像博客网、中国博客网、亚洲博客网、世界博客网之类的,太多了没人分得清谁是谁。
3、随意:随意的网络要大于刻意的网络,因为人们还要生活。创建一种服务让它适应并对人们每天的生活有所助益,而不要要求太多的承诺或改变他们的身份。放轻松,很多时候,偶然的需要让你的服务更有价值,就像Skype上偶然发生的对话。既然生活本身就是随意的、偶然的,不要总是试图限制用户。
4、挑剔:这一点适用于很多方面:服务的特性、员工、投资者、合作伙伴、记者采访等等。如果感觉某样东西不太对劲,就放一放。Google最强大的力量之一,就是他们乐于对机会、快钱、可能的雇员以及交易说不。但很多人太心切,太怕错过这村没这店,所以往往来者不拒,最终将会后悔。
5、以用户为中心:用户体验就是一切。你的整个公司都必须建立在这上面,如果你不懂什么叫以用户为中心的设计,赶快学,雇用懂的人。把对的特性做对,远超过添加一百个特性。Ajax是为了让网站更互动,而不是因为它很性感。API是为了让开发者更容易为用户增加价值,而不是为了去取悦geek们。
6、自我本位:伟大的产品从来都是来自一个人自身的渴求。创造你自己需要的产品,成为你自己产品的用户,雇用你的产品的用户,按你自己的愿望改善它。另一方面,避免在费用、用户、或者有可能妨碍你改善产品等方面,跟大公司做交易。因为你小他们大,你很难说不。
7、饥渴:有选择永远好过没选择,最好的办法就是有收入。要为你的产品设计出收费模式并在6个月内开始有进项,这样你才会有市场费用。而且,有收入也会让你在融资或收购谈判中,处于更有利的位置。不过在中国可能没这么简单,为了赚钱而让服务变形的事总是在发生着。
8、苗条:保持低成本是一种Web创业智慧。能使用互联网上现有的服务,就不要花钱买。如果你希望被大公司收购,就更不能让自己显得很庞杂,小公司更容易被收购。Tim O'Reilly说过,如果你看到一家公司在市场活动上花很多钱,你可以肯定地知道,这不是一家Web 2.0公司。充分利用互联网现成的资源,也是一种能力。
9、灵活:要学会改变计划。Pyra最初要做的是一个项目管理程序,而不是Blogger。Flickr最初要做的是游戏。Ebay最初也只是想销售拍卖软件。最初的设想几乎永远都是错的。一开始就认定自己是对的,很可能撞上南墙。要把创业过程,变成一个BETA过程,不断debug,不断调整,不断改进。
10、平衡:初创公司是什么样?目光迷离、睡眠不足、垃圾食品充饥、咖啡提神……还有呢?要知道,自然要求健康的平衡,当平衡成为你的公司的一部分,你就拥有了一样秘密武器。需要玩儿命,也需要玩儿。一个充满活力的平衡的团队,也会给人更多的信任和期待。
谨慎(这个是额外的奖励):不要拿上面的戒律当成金科玉律,凡事总有例外。
据一项新的研究显示,浏览互联网的用户通常会在极短的时间内判断一个网站的质量。
加拿大渥太华卡尔顿大学的研究人员发现,人的大脑将在首次看到一个网页后的二十分之一秒的时间内判断其质量。这一发现出乎研究人员的意料之外,他们原来一直以为用户判断一个网页的质量需要的时间要比这长10倍以上。
这一研究报告刊登在学术期刊《行为和信息技术》上。卡尔顿大学的研究人员表示,视频吸引力可以在50毫秒的时间里得到判断,这意味着网页设计人员只需50毫秒的时间就能够获得良好的第一印象。
吉蒂和她在卡尔顿大学的研究小组每个网页50秒钟的速度显示网页,要求参与调查的人员根据美学感觉为网页打分。然后,参与者被要求仔细观察网页,并重新打分。研究人员发现,这二次的打分非常一致。
吉蒂在这份报告中表示,她们的发现对于商业性网站非常有启迪意义。她在报告中说,除非给用户留下美好的第一印象,否则即使内容好于竞争对手,用户也会放弃你的网站。
吉蒂还表示,用户的第一印象会持续很长时间。报告认为,迅速形成的第一印象能够长期产生作用的原因是心理学家称之为“光圈效应”的因素━━对事物的最初看法会影响以后的判断。换句话说,如果用户欣赏一个网站的外观,这会影响到他们对网站其它部分━━例如内容的判断。
据吉蒂称,由于人们都希望自己是正确的,他们会继续访问给自己留下第一印象的网站,因为这样会进一步证明他最初的判断是正确的。
双机互连的网线的制作方法
1 白桔
2 桔
3 白绿
4 兰
5 白兰
6 绿
7 白棕
8 棕
上面是标准的线序(eia/tia568b)
如果是交叉线(用于双机互连,或级联)
另一头的线序如下
1 白绿
2 绿
3 白桔
4 兰
5 白兰
6 桔
7 白棕
8 棕
如果你得线不是标准线序,至少要保证12,36是一对线
交叉线是1-3,2-6对调。
This page contains an archive of all entries posted to a one and a two in the 它它它它 category. They are listed from oldest to newest.
学习学习 is the previous category.
幸福生活 is the next category.
Many more can be found on the main index page or by looking through the archives.