Hacker News …什么?…封掉所有搜索引擎

首先,Hacker News 与蓝翔技校或任何中文言称之“黑客”网站无任何关联。Y Combinator 为精力充沛的小伙子们准备的社区 Hacker News 今天明确宣称:我们不需要,不喜欢搜索引擎。

twitter 账户说(注意,是“某”):

其实,HackerNews 才是 HN 的官方账号,newsyccombinator 是个 bot,创建者是伦敦的 riklomas。所以,这个嘛,还算不上官方发布。

不过看了下 robots.txt:

User-Agent: *
Disallow: /x?
Disallow: /vote?
Disallow: /reply?
Disallow: /submitted?
Disallow: /threads?

弄得还挺全乎。

当然,你可以说 robots.txt 就像…就像咱们两会的提案,也就是一“提”而已,spider 等程序想索引自然还是可以的,不过,从 Hacker News 来说这是个态度问题,对 Google 等从业者来说则是专业操守问题。我们想知道问什么,以及有什么好方法替代 Google 来搜索 HN 上的东西。

UPDATED:关于为什么,有说喜欢维持 HN 紧密氛围的;有说反正 HN 不需要流量,又有固定且特色的用户群的;还有说是因为 Arc server 的一个问题容易造成 spider 连续重复访问的–>对此托词我们显然要严词言辞批判,如人跟帖所说,为了减轻压力屏蔽掉几个 crawlers 好比砍掉几条腿也算减了肥。更受不了的是,一哥们 8 小时前出来发帖报告:那个 robots.txt 的 MIME 是 text/html,不是 text/plain,HN 会弄下这等大 bug?!我受不了了。