百度发展史,百度发展历程
搜索引擎发展史1990年以前,没有任何人能搜索互联网。
所有搜索引擎的祖先,是1990年由Montreal的McGill University学生Alan Emtage、Peter Deutsch、Bill Wheelan发明的Archie(Archie FAQ)。虽然当时World Wide Web还未出现,但网络中文件传输还是相当频繁的,由于大量的文件散布在各个分散的FTP主机中,查询起来非常不便,因此Alan Emtage等想到了开发一个可以用文件名查找文件的系统,于是便有了Archie。Archie是第一个自动索引互联网上匿名FTP网站文件的程序,但它还不是真正的搜索引擎。Archie是一个可搜索的FTP文件名列表,用户必须输入精确的文件名搜索,然后Archie会告诉用户哪一个FTP地址可以该文件。
由于Archie深受欢迎,受其启发,Nevada System Computing Services大学于1993年开发了一个Gopher(Gopher FAQ)搜索工具Veronica(Veronica FAQ)。Jughead是后来另一个Gopher搜索工具。
Robot(机器人)一词对编程者有特殊的意义。Computer Robot是指某个能以人类无法达到的速度不断重复执行某项任务的自动程序。由于专门用于检索信息的Robot程序象蜘蛛(spider)一样在网络间爬来爬去,因此,搜索引擎的Robot程序被称为spider(Spider FAQ)程序。世界上第一个Spider程序,是MIT Matthew Gray的World wide Web Wanderer,用于追踪互联网发展规模。刚开始它只用来统计互联网上的服务器数量,后来则发展为也能够捕获网址(URL)。
与Wanderer相对应,1993年10月Martijn Koster创建了ALIWEB(Martijn Koster Annouces the Availability of Aliweb),它相当于Archie的HTTP版本。ALIWEB不使用网络搜寻Robot,如果网站主管们希望自己的网页被ALIWEB收录,需要自己提交每一个网页的简介索引信息,类似于后来大家熟知的Yahoo。
随着互联网的迅速发展,使得检索所有新出现的网页变得越来越困难,因此,在Wanderer基础上,一些编程者将传统的Spider程序工作原理作了些改进。其设想是,既然所有网页都可能有连向其他网站的链接,那么从一个网站开始,跟踪所有网页上的所有链接,就有可能检索整个互联网。到1993年底,一些基于此原理的搜索引擎开始纷纷涌现,其中最负盛名的三个是:Scotland的JumpStation、Colorado 大学Oliver McBryan的The World Wide Web Worm(First Mention of McBryan's World Wide Web Worm)、NASA的Repository-Based Software Engineering (RBSE) spider。JumpStation和WWW Worm只是以搜索工具在数据库中找到匹配信息的先后次序排列搜索结果,因此毫无信息关联度可言。而RBSE是第一个索引Html文件正文的搜索引擎,也是第一个在搜索结果排列中引入关键字串匹配程度概念的引擎。
Excite 的历史可以上溯到1993年2月,6个Stanford(斯坦福)大学生的想法是分析字词关系,以对互联网上的大量信息作更有效的检索。到1993年中,这已是一个完全投资项目Architext,他们还发布了一个供webmasters在自己网站上使用的搜索软件版本,后来被叫做Excite for Web Servers。(注:Excite后来曾以概念搜索闻名,2002年5月,被Infospace收购的Excite停止自己的搜索引擎,改用元搜索引擎Dogpile)
1994年1月,第一个既可搜索又可浏览的分类目录EINet Galaxy(Tradewave Galaxy)上线。除了网站搜索,它还支持Gopher和Telnet搜索。
1994年4月,Stanford University的两名博士生,美籍华人Jerry Yang(杨致远)和David Filo共同创办了Yahoo(Jerry Yang Alerts a Usenet group to the Yahoo Database ,1996年的Yahoo)。随着访问量和收录链接数的增长,Yahoo目录开始支持简单的数据库搜索。因为Yahoo!的数据是手工输入的,所以不能真正被归为搜索引擎,事实上只是一个可搜索的目录。Wanderer只抓取URL,但URL信息含量太小,很多信息难以单靠URL说清楚,搜索效率很低。Yahoo!中收录的网站,因为都附有简介信息,所以搜索效率明显提高。(注:Yahoo以后陆续使用Altavista、Inktomi、Google提供搜索引擎服务)
1994年初,Washington大学CS学生Brian Pinkerton开始了他的小项目WebCrawler(Brian Pinkerton Announces the Availability of Webcrawler)。1994年4月20日,WebCrawler正式亮相时仅包含来自6000个服务器的内容。WebCrawler是互联网上第一个支持搜索文件全部文字的全文搜索引擎,在它之前,用户只能通过URL和摘要搜索,摘要一般来自人工评论或程序自动取正文的前100个字。(后来webcrawler陆续被AOL和Excite收购,现在和excite一样改用元搜索引擎Dogpile)
Lycos(Carnegie Mellon University Center for Machine Translation Announces Lycos )是搜索引擎史上又一个重要的进步。Carnegie Mellon University的Michael Mauldin将John Leavitt的spider程序接入到其索引程序中,创建了Lycos。1994年7月20日,数据量为54,000的Lycos正式发布。除了相关性排序外,Lycos还提供了前缀匹配和字符相近限制,Lycos第一个在搜索结果中使用了网页自动摘要,而最大的优势还是它远胜过其它搜索引擎的数据量:1994年8月--394,000 documents;1995年1月--15 million documents;1996年11月--over 60 million documents。(注:1999年4月,Lycos停止自己的Spider,改由Fast提供搜索引擎服务)
Infoseek(Steve Kirsch Announces Free Demos Of the Infoseek Search Engine)是另一个重要的搜索引擎,虽然公司声称1994年1月已创立,但直到年底它的搜索引擎才与公众见面。起初,Infoseek只是一个不起眼的搜索引擎,它沿袭Yahoo!和Lycos的概念,并没有什么独特的革新。但是它的发展史和后来受到的众口称赞证明,起初第一个登台并不总是很重要。Infoseek友善的用户界面、大量附加服务(such as UPS tracking, News, a directory, and the like) 使它声望日隆。而1995年12月与Netscape的战略性协议,使它成为一个强势搜索引擎:当用户点击Netscape浏览器上的搜索按钮时,弹出Infoseek的搜索服务,而此前由Yahoo!提供该服务。(注:Infoseek后来曾以相关性闻名,2001年2月,Infoseek停止了自己的搜索引擎,开始改用Overture的搜索结果)
1995年,一种新的搜索引擎形式出现了元搜索引擎(A Meta Search Engine Roundup)。用户只需提交一次搜索请求,由元搜索引擎负责转换处理后提交给多个预先选定的独立搜索引擎,并将从各独立搜索引擎返回的所有查询结果,集中起来处理后再返回给用户。第一个元搜索引擎,是Washington大学硕士生 Eric Selberg 和 Oren Etzioni 的 Metacrawler。元搜索引擎概念上好听,但搜索效果始终不理想,所以没有哪个元搜索引擎有过强势地位。
DEC的AltaVista(2001年夏季起部分网友需通过p-roxy访问,无p-roxy可用qbseach单选altavista搜索,只能显示第一页搜索结果)是一个迟到者,1995年12月才登场亮相(AltaVista Public Beta Press Release )。但是,大量的创新功能使它迅速到达当时搜索引擎的顶峰。Altavista最突出的优势是它的速度(搜索引擎9238:比较搞笑,设计altavista的目的,据说只是为了展示DEC Alpha芯片的强大运算能力)。
而Altavista的另一些新功能,则永远改变了搜索引擎的定义。
AltaVista是第一个支持自然语言搜索的搜索引擎,AltaVista是第一个实现高级搜索语法的搜索引擎(如AND, OR, NOT等)。用户可以用AltaVista搜索Newsgroups(新闻组)的内容并从互联网上获得文章,还可以搜索名称中的文字、搜索Titles、搜索Java applets、搜索ActiveX objects。AltaVista也声称是第一个支持用户自己向网页索引库提交或删除URL的搜索引擎,并能在24小时内上线。AltaVista最有趣的新功能之一,是搜索有链接指向某个URL的所有网站。在面向用户的界面上,AltaVista也作了大量革新。它在搜索框区域下放了“tips”以帮助用户更好的表达搜索式,这些小tip经常更新,这样,在搜索过几次以后,用户会看到很多他们可能从来不知道的的有趣功能。这系列功能,逐渐被其它搜索引擎广泛采用。1997年,AltaVista发布了一个图形演示系统LiveTopics,帮助用户从成千上万的搜索结果中找到想要的。
然后到来的是HotBot。1995年9月26日,加州伯克利分校CS助教Eric Brewer、博士生Paul Gauthier创立了Inktomi(UC Berkeley Announces Inktomi),1996年5月20日,Inktomi公司成立,强大的HotBot出现在世人面前。声称每天能抓取索引1千万页以上,所以有远超过其它搜索引擎的新内容。HotBot也大量运用cookie储存用户的个人搜索喜好设置。(Hotbot曾是随后几年最受欢迎的搜索引擎之一,后被Lycos收购)
Northernlight 公司于1995年9月成立于马萨诸塞州剑桥,1997年8月,Northernlight搜索引擎正式现身。它曾是拥有最大数据库的搜索引擎之一,它没有Stop Words,它有出色的Current News、7,100多出版物组成的Special Collection、良好的高级搜索语法,第一个支持对搜索结果进行简单的自动分类。(2002年1月16日,Northernlight公共搜索引擎关闭,随后被divine收购,但在Nlresearch,选中"World Wide Web only",仍可使用Northernlight搜索引擎)
1998年10月之前,Google只是Stanford大学的一个小项目BackRub。1995年博士生Larry Page开始学习搜索引擎设计,于1997年9月15日注册了googlecom的域名,1997年底,在Sergey Brin和Scott Hassan、Alan Steremberg的共同参与下,BachRub开始提供Demo。1999年2月,Google完成了从Alpha版到Beta版的蜕变。Google公司则把1998年9月27日认作自己的生日。
Google在Pagerank、动态摘要、网页快照、DailyRefresh、多文档格式支持、地图股票词典寻人等集成搜索、多语言支持、用户界面等功能上的革新,象Altavista一样,再一次永远改变了搜索引擎的定义。
在2000年中以前,Google虽然以搜索准确性备受赞誉,但因为数据库不如其它搜索引擎大,缺乏高级搜索语法,所以使用价值不是很高,推广并不快。直到2000年中数据库升级后,又借被Yahoo选作搜索引擎的东风,才一飞冲天。
Fast(Alltheweb)公司创立于1997年,是挪威科技大学(NTNU)学术研究的副产品。1999年5月,发布了自己的搜索引擎AllTheWeb。Fast创立的目标是做世界上最大和最快的搜索引擎,几年来庶几近之。Fast(Alltheweb)的网页搜索可利用ODP自动分类,支持Flash和pdf搜索,支持多语言搜索,还提供新闻搜索、图像搜索、视频、MP3、和FTP搜索,拥有极其强大的高级搜索功能。
Teoma 起源于1998年Rutgers大学的一个项目。Apostolos Gerasoulis教授带领华裔Tao Yang教授等人创立Teoma于新泽西Piscataway,2001年春初次登场,2001年9月被提问式搜索引擎Ask Jeeves收购,2002年4月再次发布。Teoma的数据库目前仍偏小,但有两个出彩的功能:支持类似自动分类的Refine;同时提供专业链接目录的Resources。
Wisenut 由韩裔Yeogirl Yun创立。2001年春季发布Beta版,2001年9月5日发布正式版,2002年4月被分类目录提供商looksmart收购。wisenut也有两个出彩的功能:包含类似自动分类和相关检索词的WiseGuide;预览搜索结果的Sneak-a-Peek。
Gigablast 由前Infoseek工程师Matt Wells创立,2002年3月展示pre-beta版,2002年7月21日发布Beta版。Gigablast的数据库目前仍偏小,但也提供网页快照,一个特色功能是即时索引网页,你的网页刚提交它就能搜索(注:这个spammers的肉包子功能暂已关闭)。
Openfind 创立于1998年1月,其技术源自台湾中正大学吴升教授所领导的GAIS实验室。Openfind起先只做中文搜索引擎,曾经是最好的中文搜索引擎,鼎盛时期同时为三大著名门户新浪、奇摩、雅虎提供中文搜索引擎,但2000年后市场逐渐被Baidu和Google瓜分。2002年6月,Openfind重新发布基于GAIS30 Project的Openfind搜索引擎Beta版,推出多元排序(PolyRankTM),宣布累计抓取网页35亿,开始进入英文搜索领域,此后技术升级明显加快。
北大天网 是国家"九五"重点科技攻关项目"中文编码和分布式中英文信息发现"的研究成果,由北大计算机系网络与分布式系统研究室开发,于1997年10月29日正式在CERNET上提供服务。2000年初成立天网搜索引擎新课题组,由国家973重点基础研究发展规划项目基金资助开发,收录网页约6000万,利用教育网优势,有强大的ftp搜索功能。
Baidu 2000年1月,超链分析专利发明人、前Infoseek资深工程师李彦宏与好友徐勇(加州伯克利分校博士)在北京中关村创立了百度(Baidu)公司。2001年8月发布Baiducom搜索引擎Beta版(此前Baidu只为其它门户网站搜狐新浪Tom等提供搜索引擎),2001年10月22日正式发布Baidu搜索引擎。Baidu虽然只提供中文搜索,但目前收录中文网页超过9000万,可能是最大的的中文数据库。Baidu搜索引擎的其它特色包括:网页快照、网页预览/预览全部网页、相关搜索词、错别字纠正提示、新闻搜索、Flash搜索、信息快递搜索。2002年3月闪电计划(Blitzen Project)开始后,技术升级明显加快。
百度:中国版Google 神话能走多远
中国搜索引擎公司百度8月5日在美国纳斯达克上市,发行价为27美元。当日盘中一度突破150美元,最后以12254美元收盘,涨幅高达35385%。百度的出色表现使之成为在美国上市的外国公司中,上市首日表现最好的一只股票。
多种利好助涨股价百度上市首日如此强劲的表现,主要有两方面的原因:
首先,是google 的示范效应。投资者经常将百度和Google 相提并论,认为该公司是中国版的Google 。有分析师认为,百度之所以受到如此追捧,是因为它结合了“中国”和“搜索”这两大热点。
全球最大的搜索服务提供商Google 上市发行价也不足一百美元,但上市一年以来股价已经超过三百美元,显示搜索市场有巨大潜力。而中国互联网的迅速普及,网民数量急剧膨胀,中国市场的广阔性已被国外投资者普遍看好。
其次,中国概念股的魅力。中国已经是世界上最大的电脑市场并拥有世界上第二大的上网人数,中国网民数已经突破1亿。百度在这一市场占有很大的份额。加上人民币升值,国外投资者普遍看好中国,看好搜索市场,因此百度才会受到了投资者的偏爱。
创业之路回顾百度的发展史,公司和盛大类似,也是把握了互联网产业快速发展的时机,并找到了适合自身的快速发展途径。
百度于1999年底成立于美国硅谷,它的创始人,百度公司总裁李彦宏是资深信息检索技术专家、超链分析专利的唯一持有人。
百度创立初,公司选择了与其他专业搜索引擎略有区别的商业模式:即和门户网站合作,百度按照搜索访问量分成,这种付费模式在当时颇受门户网站的欢迎,包括新浪、网易在内的各大门户网站都采用了百度提供的服务。
但这种模式很快显示了局限性。门户网站数量的有限性决定了其需求的有限性。2001年初,李彦宏借用了Overtu r e 的“付费排名”搜索引擎商业模式,客户通过购买关键字并进行竞价,决定其在搜索结果中排名的先后,并通过上下文内容分析技术,将广告同时投放于其他顶尖级搜索引擎,与这些合作伙伴共同分享利益。2002至2003年,竞价排名迅速成为百度主要收入来源,2004年百度80%收入来自竞价排名。
目前百度是浏览量中国第二、世界第六的网站。数据显示,中国网络用户有48%的搜索请求是通过百度完成的,因此百度有全球最大中文搜索引擎之称。艾瑞咨询数据显示:2004年中国搜索引擎行业市场规模为125亿元,其中搜索引擎运营商收入规模为635亿,渠道代理商收入为62亿元,而百度占据了中国搜索引擎运营商收入市场份额的28%。独特的商业模式的成功,使百度迅速成为中文搜索引擎的老大。
由于中文的复杂性,百度的搜索技术非常复杂,公司开发了特殊的语言处理技术来处理相似搜索结果。截至到目前,百度已经链接了69亿页网页,8000万张以及1000万个媒体文件。它还包括新闻、贴吧和其他内容。
市盈率之忧对百度来说,首日上市的优异表现是良好的开端。但“良好的开端是成功的一半”,海外资本市场并非坦途。从新浪、网易等先行者身上可以发现,其股价表现并不乏大起大落之先例,以网易为例,2001年一度到达051美元最低价。资本的残酷逐利性决定了一家企业一旦未能达到华尔街的预期,股价出现暴跌极为正常。
百度上市首日的优异表现,股价的迅速拔高,已经迅速使市盈率水平脱离了市场平均水平。这成为今后股价表现之隐忧,一旦公司成长性跟不上市场预期,即有可能导致股价水平的迅速回落。
百度2004年的利润为1200万元,收入为111亿元,2003年则亏损890万元。05年第一季度的盈利猛增了140%,达到250万元。根据百度在招股说明书中公布的财务数据,百度股票发行价的市盈率达到540倍,周五收盘价的市盈率达到24508倍,颇为惊人。作为对比数据,Google 市盈率8月6日为8566倍。在纳斯达克上市的其他兄弟网络概念股的市盈率也基本在30-50倍之间。即使百度仍然保持原200%以上的业绩增幅,其目前股价仍然有高估之嫌。
此外,百度在搜索领域并非无敌手,Google 对中国市场窥视已久,对百度的虎视眈眈也是路人皆知,Google 目前持有百度26%的股份,其进入中国市场选择并购还是单独发展,后续事态发展将影响到百度的市场表现。虽然中文搜索的复杂性以及本土文化的适应性,使国外资本想占领中国市场并非易事,但其资本实力雄厚,加上品牌优势,仍不可小视。
而对于百度的重要利润来源“竞价排名”也已经有质疑之声出现,这种以出价高低决定搜索排名的商业模式有损于搜索引擎保持公正客观。信息干扰的出现,将使网民对搜索的依赖程度降低。而百度目前的MP3、、搜索等服务也面临版权的法律纠纷,虽然不足以影响百度大局,但对于百度其他商业模式的推广仍然带来一定障碍。
十大新媒体平台有今日头条、微信公众号、百度百家号、搜狐自媒体、新浪博客、简书、大鱼号、一点资讯、企鹅号、网易新闻自媒体等等。
1、今日头条
今日头条活跃用户多,流量巨大,一篇质量较好的文章,阅读量随便几十万。对于新手和需要迅速引流吸粉的自媒体人而言,今日头条几乎是必备的自媒体平台之一。
2、微信公众号
微信公众平台也是必备的自媒体平台。做的好的公众号都可以融资几百上千万。对于个人自媒体人来说,微信公众号营销效果好,垂直性和私密性较强,能一对一互动可以说是培养粉丝最好的平台之一了。
3、百度百家号
百家号起步虽然有点晚,但毕竟背靠最大的中文搜索引擎,权重很高,文章能快速被百度搜录。所以号称品牌背书神器,seo优化神器,排名效果没话说。而且百家号也给开通了阅读广告变现。
4、搜狐自媒体
搜狐公众平台权重高,排名好,容易搜录,特别适合做公司品牌宣传或个人品牌宣传,对于自媒体新手建立新的网络背书和宣传,搜狐自媒体也是必备的自媒体平台之一。搜狐自媒体是百度的新闻源,只要选对关键词,流量非常大,是做霸屏和排名的神器。
5、新浪博客
作为老牌的博客平台,新浪博客权重很高,很容易被百度收录,没有每天发布的数量限制。缺点是流量较为分散,关注集中度不高。但是在做个人品牌的过程中,用新浪博客做排名还是挺不错的。建议开通。
6、简书
简书被认为最好用的写字空间。可以开设自己的专栏,也有打赏功能,用户群以90后年轻群体为主,门槛低,适合写作的新手。简书是书写、编辑、发布功能于一体的在线写作编辑工具,风格清新,设计简洁。但变现较慢,需要耐心维护,广告控制严格。
7、大鱼号
大鱼号的前身是UC自媒体号,后来改名大鱼号。UC云观和新浪看点相似,都是针对移动端的流量,流量很不错,但是这些流量很难引到自己的鱼塘,大多数操作UC订阅号的人都是靠UC订阅号自身的广告赚钱,跟今日头条的头条广告和企鹅媒体的流量主同个类型。
8、一点资讯
一点资讯类似今日头条,整体流量比头条小,适合偏情感类的自媒体入驻,会有不错的流量。发布文章和审核时间较慢,有推荐,权重比较高。发布的文章也容易被搜录,功能和搜狐公众号相似,适合做品牌和个人宣传。
9、企鹅号
企鹅号的定位和其他自媒体平台有点不一样,发布的文章在天天快报、腾讯新闻客户端、微信新闻插件、手机QQ新闻插件、QQ公众号、手机腾讯网等渠道平台一键分发,原创好文章,曝光很高,是优质内容创业者的曝光神器。
10、网易新闻自媒体
网易自媒体流量不大,和企鹅号差不多,比较适合做娱乐性的内容,专业性的不太适合入驻。发布的文章会泛起在网易新闻手机客户端中。
腾讯新闻—指尖上的世界
一度被指责抄袭网易的腾讯新闻客户端,华丽的标语“指尖上的世界”里面是规整的大分类:新闻、订阅、、视频。新闻的内容定制以主题和地理位置为对象,订阅的对象是各类媒体,由于腾讯新闻客户端与微信、腾讯网互通互联,媒体在一处发布,可多平台同步更新。另外,有别于其他新闻客户端,腾讯新闻客户端的离线下载是很畅快的,用户只需要30秒就可以下载1000条新闻,非常适合地铁族和户外族。
网易新闻—有态度的新闻门户
作为市场份额第二的网易,不得不说它将用户体验做到极限,界面设计也是其他对手模仿的对象。网易非常注重自己的原创报道和互动,“有态度”的新闻赢得了用户的推荐,互动不仅体现在话题和投票栏目,网友犀利的跟帖和评论更是中国互联网一绝。网易也有订阅,但是对象以主题为主,媒体较少。它是屌丝和愤青比例最高的新闻阅读器。7月1日上线的积分商城提升了用户活跃度,O2O模式将助力流量变现。
搜狐新闻—先知道
2013年4月,搜狐新闻客户端成为国内首个用户数过亿的新闻客户端。庞大的用户数量反映张朝阳背后的努力。除了优秀的界面设计,为了方便用户“订阅”,搜狐引入各方媒体共建“全媒体平台”,包括平面、网络、电视、意见领袖(自媒体)等媒体形式,近期热门的《中国好声音》也被另设为菜单“好声音”,欢乐网事、情感夜话等入驻媒体订阅量达千万级。平台级的搜狐新闻客户端成为媒体的内容渠道,这也是它爆红的原因之一。
欢迎分享,转载请注明来源:浪漫分享网
评论列表(0条)