2012年6月24日星期日

码工找工经验1-转行篇-当断则断(转寄)

发信人: ShowMeRMB (ShowMeRMB), 信区: JobHunting
标 题: 码工找工经验1-转行篇-当断则断
发信站: BBS 未名空间站 (Sun Jun 24 00:51:52 2012, 美东)

刚拿到一份心仪已久的工作, 这次找工算告一段落。以往每次找工作,都从版上获得
了很多宝贵的信息,但是过去一直很懒,主要潜水,这次正好利用空闲时间,把自己的
几次找工的经历加以整理总结,算是回馈一下版面,也希望对版上诸位朋友有所帮助。

在这系列文章里,我尽量不谈具体公司的面试题,一个原因是签了协议, 另一个原因
是已有的资料已经很全面。 career cup, leetcode, glassdoor, 和本版题目包罗了
市面上绝大部分技术类题目。本来我想做一个总结面试题的网站,后来发现leetcode
已经在那儿了,而且比我想做的还要好,遂作罢。我会把我的一点的练习编程和准备技
术面试的要点整理以后换一种方式来给大家分享。

用马甲发贴是想主id以后还可以去各版随心所欲胡喷,也希望生活中认识的朋友不要点
破。

我会尽量比较客观的描述,因为对大多数人来说,找工作就如小马过河,老牛们自不用
发愁,想去哪里去哪里,反过来,能一路G,T,出国的网友们,就算不是人中龙凤,也
绝对不是小松鼠。 所以作为一个摸着石头过了几次河的小马,提供一些客观参数和装
备供大家参考。我会说的尽量详细一些,请大家不要嫌我罗嗦。

这篇主要写一下非CS转行的一点体会。

背景,国内top 10本硕, 专业为21世纪(末)最有前途的学科,生物。高考时我更想报
计算机或者电子,但两个专业加起来在我省只招四个人,我的分数没有这四大天王高,
那就搞生物吧,好像出国还容易些,虽然当时的我并不知道出国到底意味着什么。入学
后我发现不是谁都适合搞生物研究的,真是男怕入错行! 人生啊,不小心走错一步瞬
间就从分子变成分母。当然就专业本身来说,认识的同窗校友科研做的好的,发表自然
科学细胞的不在少数,几十年后如果他们中有人拿到诺奖,我一点都不会感到惊讶。
和这些生物学中的高帅富来比,我算是很苦逼的吊丝。回想一下不堪的往事,当年大约
做过200次western, 养过细胞,杀过老鼠,抽过质粒,提过蛋白, 长过肿瘤,筛过单
抗 (消耗掉老板无数经费,内疚中)。每天在甲醇乙酸的芬芳中吃盒饭,时常周末凌
晨加班赶10个96孔板,看显微镜看到头晕眼花,配显影液配到恶心想吐,困得边过柱子
边打盹,累得躺到床上睡不着。和身体的劳累相比,心里的苦闷 更加难熬, 实验不顺
利,没有结果,没有文章,一事无成,十分打击自信心, 挫败感非常强,几乎每天都
愁眉苦脸。 总的来说,那些年的心里格调就是郁闷,焦虑,迷茫,没有头绪,不知道
属于自己的未来在什么地方,也没有人能够指引一下方向。 本应好好的大学生涯,就
如蹲监狱一般,似乎连蹲监狱还不如,因为你不知道什么时候可以毕业,或者更害怕毕
业,因为不知道毕业以后能干些什么,能不能养活自己,找到工作,娶到老婆。 本科
毕业时想过考别的专业的研究生,最终因为没有魄力,还是懦弱的选择了读研,继续一
条路往黑里走。(如果能穿越回去给那时的自己指导的话,我有三条建议,1:)让家里
借钱买房子 2:)再借钱多买一套 3:)马上退学,买个垫子每天去百度,腾讯,阿里
门口跪求免费打工机会。)

吐了这么多槽,是劝有过类似体验的学子当断则断,如果你并不合适做这个行业,或者
真心不喜欢 ,继续耗在那里就是慢性自杀。现在机会很多,退一步海阔天空,蹉跎下
去路越来越窄,有些东西该舍就舍,没舍怎有得, "No Risk, No Return."。本科毕
业之前,大家的路和成绩基本上是家庭环境决定的。之后,基本上就是自己选择了,要
对自己负责。我曾与一些生物转行的朋友交流过,他们几乎都有类似的经历和感触。普
遍感觉, 转行前,天是灰色的,下决心转以后,天是蓝色的。可能同样会很辛苦,内
心的感受却截然相反。 借用一位大牛的原话,"I was happier than ever after
the decision"。 人生既短暂又漫长,郁闷烦躁,临渊羡鱼是一辈子,开开心心,风风
火火也是一辈子,早点找到自己喜欢或者擅长的方向,每天的生活才能有精,气,神。

继续前面的讲,读研实在郁闷的不行了,就拿硕士申请出国了。 基于对自己做实验能
力和运气的深刻而清醒的认识(认识到自己长处可以让你成功,认识到自己短处可以避
免悲剧,拿自己的短处硬比人家的长处就如吊丝逆袭高帅富,你有可能成功,不过有这
种运气,去买彩票往往是更稳妥的选择), 我决定尽量申一些偏计算和理论的方向,
因为我的数理基础还可以,本科上编程课的时候,感觉挺喜欢的,成绩也不错。 后来
也非常幸运的申请到一个偏计算和生物信息的专业。出国前,我特地从国内买了两本书
,影印版的CLRS(Introduction to algorithm)和国内版的MBOC(Molecular Biology of
the Cell),虽然很重,但是国内的价格要便宜得多。 迄今为止,这两本书仍是我看
的最多的,最有感情的两本书(很有意思,一本讲硅该如何运行,一本讲碳是怎样工作
,宇宙中最复杂的奥秘都在其中)。

作为生物背景的, 深感到需要狠狠强化一下计算和理论的知识, 所以除了一些系里要
求的生物计算和生物信息类的课, 我额外选修了四门课,两门计算机,两门统计,只
修四门是因为修外系的课手续实在麻烦(这一点十分羡慕CS专业的同学),这些课都需
要一定的编程,因为比较基础,各个学校都应该有相同或类似的 课程,如果想转行的
同学可以去听听,感觉一下。对我来说,机会来之不易,我是勤勤恳恳修的,最后也是
全A( 话说研究生院的课大部分都给A). 当时修这些课的最直接动机,是为了自己研究
做的更好一点,成为既懂生物又懂计算的复合型博士生,效果是立杆见影的。修计算机
的课使我写的程序更规范,效率更高,举个具体的例子,我做课题写程序的时候有一步
需要从10万个计算结果中选出最好的20个,这一步要重复很多很多次,如果是原来的话
,我肯定直接全部排序, 取前20个,但修过算法课后,自然而然想到的要用Heap来解决
这个问题,我当时还特地花一晚上的时间实现Heap的C++类,采用了模板,而且还专门
写了单元测试,调好后加到我的库里面,后来用的就很得心应手,速度还很不错(无聊
的时候做过benchmark和profiling)。 后来,在几次真实的面试中,真有人问怎样从
一堆数里找出最大/小的几个,我挺不好意思,直接给人家说这个我熟,咱别浪费宝贵
的面试时间了,能不能换一问题 。关于Heap,我会在后面讲技术练习和面试的时候继
续深入的分析一下。修了统计课以后,也让我的数据分析的能力上了一个台阶, 信心大
增。如果有类似背景的网友想做生物信息或者数据分析的,而且因为自己基础不好而苦
恼的,强烈建议选修这些课。这些知识太基本太实用了,无论在找工作的过程和以后的
日常工作中,都会经常用到。往大里说,它们开阔了视野,改变了想问题的角度,一生
受益。

下面我来详细讲一下这四门课,包括用的书,课的形式和收获。
第一门 : 算法和数据结构 (面向计算机系研究生或高年纪本科生)
Introduction to Algorithms
http://www.amazon.com/goodluck/dp/0262033844/
如果你想要靠写程序来谋生,但这 本书却不在你书架上,我会觉得是一件不可思议的
事情。(直接看TAOP的朋友,请您不要继续看本文了,浪费您时间看到这里,在下实在
是很抱歉,谢谢。我也买了整套的TAOP, 主要用来治疗失眠的)。废话不再说,大家
可以去亚麻阅读评论。

算法和数据结构的知识,可以说是找一份理想码工工作的必要条件,如果足够牛,也是
充分条件。它既是CS理论核心中的核心,也是码工面试主要考察的,算是基本功吧。
对于大多数非CS的来说,算法和数据结构听起来很陌生高深的样子,有些人会很敬畏,
想法设法去逃避。消除这种距离,只需要一个学期,好好修一下这个课,足够了。没有
计算机背景的同学,如果数理基础,逻辑思维不错,写过两行程序,直接去选,也应该
能够跟的上。不过最好找个伴,一块讨论,互相督促,效果更好。书的前4部分(
Advanced Datastructure 之前)要看懂看熟,尽量做做课后题。 上课的过程基本上是
建立CS思维方式的一个过程,明白CS解决的是什么问题,用什么常见的方法。要多做课
后题,多思考,养成遇到一个问题就去想要用什么算法和数据结构的思维习惯。 值得
一提的是,我们当时还有一个小组项目,比较几个数据结构的不同操作的效率, 例如
简单BST, Avl Tree, Splay tree, Red black tree, BTree, Skip List, 我们当时照
着书本和网上实现了这些数据结构,还对于不同的数据流和操作做了详细的比较,虽然
很傻但是很有意思。 另一方面,认真一行一行写过AVL Tree, Splay Tree, RB Tree,
Skip List的人,即使CS背景的也会太多,只要你花了功夫,在这个特定问题上,你就
能算比其他人牛,经验多. 这也是我喜欢计算机的一大方面,一份付出,总有一份收
获。如果你的程序今天是对的,明天还是。如果你的结果不对,百分之百是程序有问题
,一定能找出原因。不像生物,付出很多,结果却是随机的,一样的条件,今天得A,
明天得B,文章是C, 你只重复出D, 还没有人知道为什么。

第二门:面向对象程序设计(面向计算机系低年纪本科生课)
Head First Design Patterns
http://www.amazon.com/goodluck/dp/0596007124/
这本书很好,设计模式,用java讲,例子很多,浅显易懂,生动有趣,值得拥有。
还有一本 Gang of Four (GOF), 写的比较学术,不是必要的(据说是作者博士论文的
一部分)
Design Patterns: Elements of Reusable Object-Oriented Software
http://www.amazon.com/goodluck/dp/0201633612/

这是一门类似软件工程的课,本科生的核心课之一,我和很多大二的小孩一起上的,是
所有课中最累的一门。 写java, 画UML, 做GUI, 要码很多很多程序。当时另外一位生
物背景的老兄和我一块修的,俩人写作业做项目,常常熬到一两点,把我们老骨头都给
折腾散了。 这门课还有三次考试,都是当场白纸写程序,画设计模式,类图(好像是
专门培训白版面试的)。这种高强度的训练对人提高很大,也让程序写更加结构化,易
读,规范,好维护。我感觉这帮小孩顺利修完这门课,如果好年景,找到个十万收入的
工作没有任何问题。这里我继续吐槽一下, 国内的本科教育真是不给力啊,生物的专
业课,你都不知道是什么人翻译/编的教材,读起来真是折磨,读读MBOC之类,才恍然
大悟,原来他们想表达这个意思啊。不知道现在高考是否还有科技文阅读,有的话赶紧
去掉,或干脆加到英语考试里,与其让一千万人学习怎么理解拗口蹩脚的翻译,还不如
像日本一样,培养一些专业的翻译人才。 计算机专业,听国内科班出身的同事说,学
校里教的和实际用的脱节严重,所以编程水平和这里(还有老毛子)学校的牛小孩不能
比。就拿javascript,html5 来说,很明显这是大势所趋,做企业做产品很缺这方面的
人才,但是学校就是不教。所以转行码工的同学不要太介意,你们和科班出身(牛人除
外)的差距往往比想像的要小,因为他们也不是始终走直线,也在折腾。


第三门:线性回归分析 (面向统计系研究生或高年纪本科生)
Applied Linear Regression Models- 4th Edition with Student CD (McGraw Hill/
Irwin Series: Operations and Decision Sciences)
http://www.amazon.com/Applied-Regression-Models--Edition-Student/dp/0073014664
这书很好,真好,虽然很厚,但是易读,透彻,好懂。 这不是入门课, 当时我相信绝
大多数国内过来的学生,如果愿意投入足够时间的话, 都应该能听懂跟上。 通过这个
课的学习,让我真正开始了解统计是多么有趣而严谨的一门学科。接着说题外话,我很
赞同对非数理经济和几个核心工科之外的专业,应该在大学中深入学习统计概率而不是
微积分。对于大部分人来说,日常生活中统计概率知识比微积分用得更广泛,或者说统
计更贴近现实,更能帮助人去认识和分析现实的问题。(http://www.ted.com/talks/lang/en/arthur_benjamin_s_formula_for_changing_math_education.html

课上会有理论证明,课堂和带回家考试都有理论题证明和推导题,作业都是用R来分析
不同的实际数据,需要写程序,检验假设,分析结果,做图,写报告。对于需要做数据
分析的同学来说,特别实用。


第四门: 统计机器学习 (面向统计或计算机系研究生或高年纪本科生)
The Elements of Statistical Learning: Data Mining, Inference, and Prediction
, Second Edition (Springer Series in Statistics)
http://www.amazon.com/goodluck/dp/0387848576/
这本书大牛所写,内容很全,评价很高,但也是我读过最晦涩的英文教材之一,没有看
其他国外教材行云流水般的感觉, 反而很象国内的教材,可能是因为我底子薄的原因
吧。不过有的地方读懂了还是感觉蛮爽的。 如果不是专门做机器学习和数据挖掘研究
的话,这本书可能有点过了。话说这个领域老中大牛太多了,我就不多废话了,怕被板
砖拍扁。 无论如何,这门课让我了解到一些表面的知识和名词,能和人吹吹牛皮,也
敢厚颜无耻的把机器学习和数据挖掘当作关键字放到简历里去。

此外,我还旁听过半个学期的并行计算和三分之一学期的操作系统课,没正式修是因为
实在没有时间写作业,做项目,即使这样,收获还是很多的。

除了上课,我还阅读了一些其他计算机类的书,就当课外书看,如果你有兴趣,读读会
有帮助 。
Intro to Computing Systems (对转行的人来说很好)
http://www.amazon.com/goodluck/dp/0262640686/
Modern Operating System
http://www.amazon.com/goodluck/dp/0136006639
Computer Network
http://www.amazon.com/goodluck/dp/0136079679
Database, SQL (买了几本,但感觉一般,就不推荐了, 可以去amazon搜SQL or
Database)
Code complete 2(经典)
http://www.amazon.com/goodluck/dp/0735619670/
Programming Pearls (必看)
http://www.amazon.com/goodluck/dp/0201657880/


我也强化了一门语言,也就是c++的了解和熟练程度, 除了自己多多练习外,主要靠看
书和看源代码。选择C++是因为原来学过一点C。我的经验来说,这是一个不错的决定。
因为C++会让你对数据结构和算法,内存管理,面向对象等了解的更加深刻,学了它再
上手别的语言也很容易,而且就普通码工面试来说,如果你用C++来写题目,基本上没
有人会有意见。 C++上手稍微慢一点,还是那句话,只要你有热情,肯付出,一定会有
回报。
C++ primer
http://www.amazon.com/goodluck/0321714113
Thinking in C++, Volume 1&2
http://www.amazon.com/goodluck/dp/0139798099
http://www.amazon.com/goodluck/dp/0130353132
Effective C++ & More Effective C++
http://www.amazon.com/goodluck/dp/0321334876/
http://www.amazon.com/goodluck/dp/020163371X
STL
http://www.amazon.com/goodluck/dp/0321623215
STL source code
http://www.sgi.com/tech/stl/download.html

再后来非常幸运的加入了一个做计算的实验室。实验室里都是非常聪明优秀的人,气氛
也很好。在这段时间里,我学到了很多东西,既有基本的linux, vim, bash, perl (
之前我在windows下用notepad写程序),也有思路上方法上的,比如 MC, 神经网络,
遗传算法等等。我做的小课题是自己设计开发一些比较新的计算方法,希望比已有的方
法好。 日常工作就是读文献,想点子,然后写程序实现,调试参数,分析结果,反复
优化(这个流程已经非常接近工业界,甚至比有些CS专门搞理论研究的Phd还接近,所
以我觉得后来找码工不能算作转行,只是从解决学术问题到解决实际问题,从小作坊式
的小打小闹到流水线大生产)。 对于运算量大,且性能要求高的,我会用C++来写,其
他处理数据,比较结果的,主要用bash和perl来实现,这段时间我写了几万行perl, 上
万行C++。 虽然写程序的方式还是相对野路子,但是得到了锻炼和积累了经验, 熟能
生巧吗,就如婴儿,走多了自然会跑。

总结这个部分,并给想要做玛工的非科班的同学一点建议,因为每个人背景,基础,兴
趣爱好都不一样,请大家仅作参考。
0)如果一点计算背景都没有, 有条件尽量读一个CS Master吧,可以申请自费读名校
的,也可以边读Phd边读一个Master。 不要担心自己跟不上,多花些时间,多和同学讨
论,遇到不懂的去问老师同学。当然这可能需要一笔钱,不是每个人都拿的出来的。

1) 如果研究偏计算,以前写过或者现在要写很多程序,修一个CS学位并不是必须的。
但是最好还是修几门课,提高自己理论水平,起码以后可以和面试官或者科班的同事能
比较好的交流。搞熟一门语言,努力把自己的东西做到极致。

2) 如果既没有条件修学位,又不是偏计算的研究,可以从多看书,写一些简单的程序
开始。网上也可以搜到很多在线的课程视频和代码范例,只要肯下功夫,也一定有效果
。但总体来说,比前两种难,最好还是要找到人指导指导,一个人在黑暗中摸索会走很
多弯路,需要坚韧的意志和强大的毅力。(想想没有新东方,红宝书,暴力考G,而且
最后你要和读过新东方或者地道的美国人竞争)

3) 另外,自己多动手写程序吧,既可以写自己研究想关的,或者手机程序,或者自己
建个小网站 ,甚至是给乐高玩具写一段,这都是相通的。培养自己写程序的兴趣和信
心,毕竟要靠这个来吃饭,如果不喜欢对自己也是一种折磨,如果喜欢写程序,恭喜你
,码工可能是世界上最好的工作之一了。

以上是针对传统万金油码工的一些想法,属于招人最多的岗位,和计算机相关的还有很
多,比如界面设计,网页设计,数据库管理,数据分析,看个人的兴趣和长处了,我没
有相关的经验,就不误导了。


--

※ 修改:・ShowMeRMB 於 Jun 24 01:02:04 2012 修改本文・[FROM: 71.202.]
※ 来源:・WWW 未名空间站 海外: mitbbs.com 中国: mitbbs.cn・[FROM: 71.202.]

没有评论: