Categories
中文

异类们的时代

 

前两天读了《异类》这部久负盛名的畅销书。书中讲述了一个简单但是长期被人忽略的事实,一个人的成功不仅仅取决于个人的努力,还和家庭背景、时代背景有着密不可分的关系。成功的人一定是非常努力的,但是努力的人却不一定成功,只有那些付出超乎常人的努力(在一个领域超过10000小时)又极度幸运能得到机会女神眷顾的人才能够成功。

毫无疑问,异类对成功背后的规律进行了精辟的总结,知道这些规律,对于每一个希望做一番事业的年轻人都是不无裨益的。但是我要讨论的是《异类》所催生的宿命论和时代论所带来负面影响。

书中提到一个例子。硅谷高管的出生日期都在1955年左右,因为这一时期出生的人在大学刚毕业之后,正好赶上了个人电脑时代来临的大好机遇。确实这种现象绝不是个例。如果你去查阅中国互联网领军人物的出生日期,你会发现他们也大致都在1969年到1973年之间。不独IT行业,改革开放之后陆续出现了几拨致富的浪潮,如果你去统计一下各个行业的商业领袖,大致也都能够符合得上。

异类由此成为轰动,被许多“有志青年”视为珍宝,王兴当属其中的代表人物。中国互联网毫无疑问就是验证《异类》的最佳场所,有句话说“美国的今天就是中国的明天”,许多人会根据美国的市场发展推断中国的发展,然后准时回国踩点,抓住机遇。王兴模式指的是利用中国和美国的时间差,将美国出现的新技术Copy 2 China获的成功的模式。中国互联上所有知名的企业基本上走的都是这个模式。被冠以王兴模式的原因是他点比较背。

王兴01年从清华电子系毕业去美国特拉华大学留学。其时美国互联网SNS浪潮出现端倪,做为《异类》拥笃的他觉得时不我待,于是辍学归国创业,先后创办“中国的facebook”校内网被卖,“中国的Twitter”饭否被封,“中国的Goupon”美团目前命运未知。可谓屡战屡败,但他毫不气馁,只要美国有了什么模式,王兴都能以最短的时间推出CopyCat。王兴模式由此得名。

王兴的点背在于,等他回国的时候中国互联网已经热了一段时间了,不像张朝阳回来的时候还是一片处女地,美国互联网带来的机遇让无数人嗅到了财富的味道,资本裹挟着互联网淘金大军滚滚而来,而王兴回国的时候一无钱,二无人,三没经验,只有一个所谓的“机遇”。但王兴看到的机遇陈一舟也看到了,SNS美国已经大热,做COPYCAT回报高风险低,稳赚不赔的生意。比抢钱还是要论资排辈,王兴于是被挤走了,当然陈一舟后來也遭受了同样的待遇,所谓螳螂捕蝉,黄雀在后。陈一舟埋怨“互联网大佬”太贪心的时候应该先检讨一下自己。

王兴只是当时留学归国潮的一个典型。时间就是金钱,因为时间带来了机遇。快速成长的中国市场和相对落后的状态让无数人嗅到了机遇的状态,大家都相信,自己就是那个“异类”,回国就可以刚好踩在机遇上面,坐等成功。

错了!所谓天机不可泄露,《异类》所讲述的动人故事,只发生在人们还没有意识到的那个时代。当大家都可以看到这个机遇的时候,你就不再是异类。

经常听说周围的同学回国创业了,创业的内容都是做网站,SNS, 本地化电子商务,社交问答,各种稀奇术语都有。这些都是美国比较火的事物。但他们多半没有充足的准备,只有一个想法,还有“机遇时不我待”的幻觉。创业在他们的印象里面,就是扎克伯格那样在宿舍里面敲敲代码就有数百亿进帐。对于他们能否如愿,我表示很大怀疑。

年轻人,尤其是优秀的年轻人的主要毛病就是觉得自己比别人有远见(包括我自己也有这点),觉得自己看到了机遇但是别人没有看到。成功就像买彩票,撞到大运就成了。媒体对于“Twitter”,“Facebook”,“Groupon”创业的一些扯淡的描述加深了这个印象。

《异类》所描述的是一个机遇相对匮乏时代的故事。大量的人达到了10000小时的努力界限,但是少量的人才能获得机遇。在信息时代之前,技术浪潮之间的时间间隔大多几十到上百年,也就是说,你错过这个机遇就不会再有下一个。在这样的情况下机遇是尤为重要的,那是属于异类们的黄金时代。

随着社会会发展不断加速,不到十年就有会一个科技浪潮,而且技术革新越来越平滑和连续的出现,不再有那么明显的时间间隔。互联网填平了信息沟壑,机遇被更加广泛的传播,而不是掌握在少数拥有内幕消息的人手中。

可以说,现在的人在一年里面碰到的机遇比一百年前的人一辈子碰到得都多。但是机遇增多的副作用是人们的选择也越来越多,更多的人纠结与如何选择,而更少的人能够专注于自身的提高。达到10000小时付出的人越来越少。

这不是一个机遇驱动成功的时代,这是一个专注驱动成功的时代。不要有轻易觉得“机不可失,失不再来”,在这个时代失不再来的机遇已经凤毛麟角了,更多的是看你又没有足够的积累出抓住机遇。不然就会“起了大早,赶了晚集”。

各位“异类”们,你付出了10000小时了吗?

Categories
English

Sentences From Outlier: The story of success

Everthing we have learned in outliers says that success follows a predictable course. It is not brightest who succeed. Nor is the success simply the sum of the decisions and efforts we make on our own half. It is rather, a gift. outlier are those who have been given opportunities and who have had the strength and presence of mind to seize them.

 

 

Categories
中文

python字典和列表

今天在测试python代码的时候发现一个问题。当嵌套使用列表和字典都时候。我本意是不断的append新的字典到原来的列表中。但是运行结果是list前面元素中的值也被更新呢,最后整个list上面的值是一样。在网上Google了一下,找到了问题所在,原来这是python初学者常碰到的问题。

http://bbs.chinaunix.net/viewthread.php?tid=1787290

这应该是一个可变类型的引用问题。字典和列表都是可变类型,一般不要以列表或字典作为列表的元素。

>>> result=[]         #建立一个指向空列表实例的列表

>>> hi_baby={‘a’: ”} #建立一个字典引用,此时此字典对象含有一个关键字a

>>> hi_baby[‘a’]=’f1′   #修改此实例字典的a关键字的值

>>> result.append(hi_baby)  #把指向此字典对象的引用添加为result的元素

>>> result

[{‘a’: ‘f1’}]

>>>

>>> hi_baby[‘b’]=’f2′           #对该字典对象增加一个值对

>>> result.append(hi_baby)  #把此字典对象的引用添加为result的新元素

>>>

>>> result                        #此时result有两个元素,都是指向hi_baby字典对象的引用

[{‘a’: ‘f1’, ‘b’: ‘f2’}, {‘a’: ‘f1’, ‘b’: ‘f2’}]   #故结果就是两个重复的hi_baby字典的值对

———-

hi_baby其实是运行环境中的一个字典对象的引用, hi_baby={‘a’: ”},这个式子中左值只是表示它是右值的引用,右值才真正的创建一个字典对象。

如果后面 hi_baby[‘b’]=’f2′ 改成hi_baby={‘a’:hi_baby[‘a’],’b’:’f2′},这样这里的hi_baby指向了新建立的字典对象,最后的result的前后两个元素就不一样了。

Categories
中文

独立之人格,自由之精神

 

我曾经觉得只有科学技术才是社会发展的原动力,文学,哲学,艺术有什么用,不过是有钱有闲人的玩意罢了,但是当我在工程的道路上面走得越远,我越是发觉科技不是主宰世界的全部力量。他们的发展给予了我们强大的力量,部分的突破了时间和空间的限制。但是他们却没有教给我们如何使用这种力量。

网络时代的我们,是不是有这样的感觉。大量的时间被浪费在网络上,明知不对却无法克制。我们不再能够静下心来品味一本好书,一段佳文,而是醉心与网络上肤浅无聊的段子。我们低头玩弄手机,却不在真实世界与人互动。没有了可以与之秉烛夜谈的挚友,却多了许多不太相熟的人脉。
网络攫取这我们有限的时间和注意力来完成它自身爆炸式的增长。是我们在使用网络,还是网络在使用我们? 它就像传说中狐妖一样,让她的猎物获得满足的同时吸取着他们的阳气。
不独网络产业,其它的工业产品莫不如此。起初它们是工具,给我们带来便利。但是经常我们也会变成工具,用以满足他们自身的增长。广而言之,资本也是人类社会的产品。起初资本用于调整社会财富分配,促进生产,提高人类的福祉。但是又有多少人沦为了资本贪婪的奴隶?制度同样是人类社会的产品。制度被设计用来为人服务,但是又有多少人变为了强大制度维持自身稳定的牺牲品?
问题出在哪里?其实我们也是一种产品,人类社会最大的产品就是人本身。只有追求“存留”的产品才会最终的存留下来,所以我们才看到产业要发展,资本要增值,制度要维稳,人类要繁衍。但是人所以异与其他所有的产品,就在于我们拥有独立之人格,自由之精神。丧失了这些,我们便于工具无异,就会变成机器的奴隶,资本的傀儡,制度的附庸。没有真正的文学、哲学、艺术的教育,独立人格和自由精神不过是一种侈谈。

Categories
English

A Simple Spider for Researcher Ranking Project

A important issue in ranking researchers is to construct the citation network between researchers.  To achieve it, I need crawl the database of cictation data from HistCite Website, whose URL is http://www.garfield.library.upenn.edu/histcomp/index.html

 

I downloaded a python spider from web and revised it to make it useable. It is not perfect but enough for this project. It is really cool to watch command windows scrolling down and downloading thousands of papes. Wow, is it so called geek behaviour? 

 

Source Code

The original version comes from this website http://xlvector.net/blog/?p=18

Categories
English

Draft of my Report about ReRank Project.

link

This is the draft of my report about ReRank Project. It is sketchy but includes most points.

My basic idea is to transfer ranking problem into a network optimization problem.  Other guys have proposed an entropy maximization scheme to rank web pages in WWW, which is more fair then PageRank that Google uses. I borrowed this framework and analyzed the citation network formed by papers. Then I modeled the relation between researchers and papers with Bipartite Graph. By maximizing entropy again, I got the most general indicators of researchers’ popularity and influence.
The attachment is a brief summary of my idea.It’s highly appreciated if you can view it briefly before the discussion.
This is only basic idea of theoretical framework, there is long way to for before getting any meaningful result.
I will update it if I revise it later.
Categories
English

ReRank Algorithm Progress Mar 17

  Do you remember the idea of  Ranking Researchers? I spent the whole spring break to explore that idea.
       I read some articles about H-index, which is a research ability indicator used by Science and Nature. H-index can be summarized as: “the h-index of a researcher is h if he has exactly h papers whose citations are above h. “. Actually it only makes use of very limited information. Although the ignorance of large information make it robust and invulnerable for manipulation in some senses, it is disputable because the information filter is ugly defined by humans. In fact, we can define many h-index like indicators with different rank orders. It is impossible to justify which is the most fair one.
       Another method to rank researchers is to use citation analysis. Similar methods have been widely used in ranking webpages—probably the most famous one is the “PageRank” algorithm that powers Google. The essence idea of PageRank Algorithm is to calculate stationary probability distribution of random walk with surfer follows each out-link with equal probability.
PageRank works very well in ranking webpages. Yet it also relies on an assumption:”The surfer follows each out-link with equal probability”. The most fair ranking system should based on facts only and not rely on any human-defined assumption.
After removing this assumption from PageRank algorith, we get TrafficRank Algorithm.
The key ideas of TrafficRank Algorithm is to derive the most general(uncertain) conclusion of ranking order based on the existing information. Because the uncertainty of a system is characterized by entropy, it is actually an optimization problem to maximize the entropy. You can refer paper “A New Paradigm for Ranking Pages on the World Wide Web” by John A. Tomlin or the report I will post later for detail.
Both PageRank and TrafficRank target on webpages. Ranking researchers and ranking webpages share some characteristics, but they are different.
Webpages are connected only by link, while the relationship between researchers are much more complicated. My goal in the following days will be characterizing the relation between researchers with the suitable network model.

 

Categories
中文

决心改掉的毛病

当年微软收购雅虎,杨致远的摇摆不定导致雅虎错失良机。虽然杨致远碰到了互联网时代这么好的机遇,但是优柔寡断的性格让他在15年后吃到了苦头。反之,乔布斯,史玉柱在受到了那么大的挫折的情况下还能东山再起,靠得就是刚毅的性格。

现在越来越意识到自己身上存在的一些毛病。

1. 做事优柔寡断。因为我什么事情都要把得失算得很清楚再做,但是许多时候这个是根本就算不出来的,导致我摇摆不定,有是后迟迟做不了决定。

2. 没有恒心。虽然我在宏观目标上可以做到一如既往,但是具体到事情上我很少有主动坚持很长时间的。许多时候碰到困难就退缩了。

3. 与人合作能力差,我总是喜欢个人英雄主义,有的时候会感觉周围的人很菜,不适合团队工作。

4. 容易受外界影响。周围人很努力的时候我可以干得很好,但是周围人都去玩的时候我就会有所懈怠。

2011年里面一定要改掉这个毛病,立此为证!!

Categories
中文

挺准的性格测试

刚刚做了一个性格测试,感觉还是挺准的。大家有兴趣可以去试试
http://www.apesk.com/
您的数据: 您的类型是INTJ 您的(INTJ)总得分为: 342+( I84 N95 T84 J79 ) 总
体倾向程度:中度倾向
你的分值及解释:(得分结构为a + b; a代表总体倾向得分,b包含的四组数分
别代表不同维度(顺序:EI SN FT JP)的倾向程度)
总体倾向程度判断标准:
某类型整体倾向分(a)最低分为200,最高分为400.分四个程度:200-300分之
间为轻度倾向;300-350之间为中度倾向;350-400之间为强烈倾向。
“b”四组数的含义:分别代表您在EI,SN,FT,FP四个维度的倾向程度。倾向程度
最高为100,最低为50。若您的某维度得分为80-100;则此维度倾向非常明显
(即您类型显示字母所代表的倾向-请参阅上面的维度解释);若您在某维度得
分为60-80则表明此维度您有中度倾向;若得分为50-60则表明您在此维度倾向不
明显
下面是对您的基本描述:
考虑问题理智、清晰、简洁,不受他人影响,客观的批判一切,运用高度
理性的思维做出判断,不以情感为依据。用批判的眼光审视一切,如果形
势需要,会非常坚强和果断。
你不屈从于权威,并且很聪明,有判断力,对自己要求严格,近乎完美,
甚至也这样去要求别人,尤其讨厌那些不知所措、混乱和低效率的人。你
有很强的自制力,以自己的方式做事,不会被别人的冷遇和批评干扰,是
所有性格中最独立的。
你是优秀的策略家和富有远见的规划者,高度重视知识,能够很快将获取
的信息进行系统整合,把情况的有利与不利方面看的很清楚。具有独特
的、创造性的观点,喜欢来自多方面的挑战。在你感兴趣的领域里,会投
入令人难以置信的精力、专心和动力。
可能的盲点:
你只注重自己,很少去理解他人,自以为是,对他人没有耐心,总是想当
然的把自己的观点强加给别人,制定不切实际的高标准。你需要学会去了
解别人的感受和想法,以避免你冒犯他人。
你过于注重远见卓识,很容易忽略和错过与自己理论模式不符的细节和现
象;爱玩弄智力游戏,说些对他人没有意义、似是而非的话语。你需要简
化你既理论又复杂的想法,更好的与别人交流。
你过分独立的个性和工作习惯,使得你总是“拒绝”别人的参与和帮助,难
以发现自己计划中的缺陷。建议你保持耐心,多向他人请教,这样可以帮
助你提早了解一些不合实际的想法,或者在大量投入之前做出必要的修正
和改进。
你有时会过于固执和死板,沉迷于一些出色的但不重要的想法中,并且事
事要求完美;如果你想成功,你需要判断事情的重要性,学习接受生活并
与他相处,学会放弃。更多了解〉〉
Categories
中文

沃森只是一个开始

沃森只是一个开始

继16年前深蓝的对决之后,IBM推出了watson电脑参加美国版的幸运52。从真正意义上只能做计算机的计算机,到能够解决复杂博弈的深蓝,再到能够初步理解人类语言并搜寻答案的沃森。计算机的演变不禁令人感慨万千。不论沃森输赢与否,它都注定像深蓝一样见证一个时代。但是毫无疑问,沃森仅仅只是一个开始。

如今电脑作为一种最常用的信息终端,已经进入了千家万户,但是it was not invented to be like that。传输信息只是后来发现的副业,没想到如今成为了主业。在世界上第一台电脑被发明的时候,它仅仅使用来做数值运算的,这从它的全称也可以看出,数字式积分机。从这个意义上面来说,它和传统的算盘没有任何本质的区别,只是速度提升了成千上万倍。

电子计算机的问世像打开了一个潘多拉的魔盒,给了科学家们前所未有的处理复杂问题的能力。在此之前,所有的问题都必须求取解析式的方式进行分析,但是事实上能够解析的表示的问题的数量是非常的少的。人类用了两千年才得到五次以下方程的解析式,又折腾了几百年才发现五次以上的高次方程是无解析解的。如果一个问题次数超过五次,在没有计算机的情况下基本上无法完成分析了。

但是电子计算机拥有的每秒成千上万次的计算能力彻底改变了这一情况。从此科学家不再仅仅通过解析分析解决问题,还能够将许多的复杂问题分解为可计算问题,再交由计算机进行处理。不论我们平时上网还是watson在解智力问题,计算机其实都只是在解决四则运算。听起来有些不可思议,but everthing is computation.

六十年代大量科学家投身于人工智能的研究。但是尽管科学家们孜孜不倦的研究了数十年,人工智能领域的研究仍然差强人意。毕竟这个问题实在是太难了,在人类对自己大脑的工作原理没有足够的了解之前,做出和人类一样的机器是几乎不可能的。有一段时间关于人工智能到底能否实现的争论非常的激烈。其实这个没有争论的意义,就像两个世纪前人们辩论到底会不会有比空气重的飞行器一样。只要有需求,人们总有一天会克服存在的问题。

但是科学家们不能将一生都用来等待,不久之后电子计算机所衍生的另一个技术开始迅猛的发展。早期计算机的计算结果是打印出来的,这种信息存储和处理的方式无疑是原始和低效的。渐渐的,各种软件被开发出来用于信息的处理和存储。随着计算机数量的增多,联网成为迫切需要,互联网应运而生,互联网之上的万维网催生了一个个商业神话,令每一个都对计算科学的力量啧啧称奇,那是后话。大量的研究人员转而去研究信息相关的更加实际的问题,人工智能领域渐渐冷淡了下来。

可是这终究是绕不过去的坎。在一个新东西刚诞生的时候,有得用就不错了,使用者不会挑剔,但是等到发展到一定的阶段的时候,用户的友好性成为越来越重要的问题。没有智能的机器给人的感觉终究是冷冰冰的,人只有在和人沟通的时候才会感到最舒适。机器的“人“化是迟早的事情。

沃森的意义就在于像公众展示了这个领域的魅力,激发公众对于这一领域的兴趣。很可能未来这个领域的救世主就是来自与现在在看Jeopardy的小孩子们中。科学不应当是实验室中的怪叔叔捣鼓的玩意,而应当是生动有趣的,这样才能形成良性循环,健康的发展。不仅是IBM,应当有更多的研究机构向公众展示他们更酷的一面。毕竟很难相信一个从小泡在《雷阵雨》或名人八卦里面的小孩子会对科学产生什么兴趣,而不论是我们的老媒体还是新媒体,似乎都只有这些。