生了个娃

各位亲友,我妻子也就是@youngeun 同学于今天凌晨1点20英勇地生下一个七斤一两的男娃,母子平安,谢谢大家的关心。

换房报告

卖朝阳东三环潘家园建业苑,108平南向,2001年商品房,7/17,净得380W。
买东城龙体片区东四块玉南街(非4号院),没小区就一栋楼,157平东南向,98年钢混,2/6,全下来738W。

卖房(朝阳,链家):
20151227    挂牌出售
20160112    版上发帖出售
20160114    签11天速销,收速销款2000
20160118    原价成交,签合同约定75天过户(买家换房,离婚买卖也是很拼。我们买房已定,不想再等),定金60W,当场收10W
20160124    买家将50W打入理房通
20160301    办10%赠予,换新房本
20160307    办夫妻更名,再换房本(为买房那边留后路,准备试图以“可以离婚然后一方卖一方去买”尝试拖住说服卖家不违约,之后证明然并卵)
20160309    买家通过资质审核,网签
20160310    调档遇到建委系统崩溃(买家本来找了黄牛等着当天缴税);形势所迫不得不编造税票号自己抢得4月1日过户号(合同约定的最后一天。注:此做法有风险,不建议模仿!)
20160311    取回调档材料;买家决定省下找黄牛缴税的钱,约到24日缴税
20160315    中介总部银行面签,民生
20160318    民生批贷,83折
20160324    缴税
20160401    过户
20160415    买家房本递进建委(我老婆各种夺命连环call中介和专员,神奇地提速成功)
20160422    建委出他项
20160425    民生放款
20160430    交房

买房(东城,我爱我家):
20160111    签合同(卖家非常淡定,拿了包瓜子就来了),价格一分没砍,约定140天过户,半年迁户口,定金50W,当场付10W
20160118    再付定金40W
20160308    提交购房资格审核(按二套)
20160318    卖家心里不平衡,显露出违约倾向(多方渠道验证确定真实,做好认怂准备)
20160321    购房资格审核通过
20160326    确定备胎房源
20160328    咨询律师,确定合同无瑕疵
20160330    卖家拒绝评估公司上门,明确要求加价,否则认赔违约
20160406    死活放心不下,跑去建委核实卖家房本地址楼层信息(建委的锅),不料中介同时提交了网签(这寸劲儿没谁了),卖家下午拿房本在建委找最初经办人改地址信息,约定次日协商加价
20160407    中介撤网签;晚上谈定加价,签补充协议,再次追加定金
20160411    中介发现建委经办人修正错误后没给归档(估计是出错要扣奖金心里不爽),专员现场闹,下午归档;
20160412    再次网签
20160415    中介总部面签,农行
20160420    评估报告交到农行
20160425    农行出批贷函,83折
20160428    缴税(不料当天得知卖家谜之操作,在面签后把婚离了……当时心如死灰……卖家先去改了户口本婚姻状态,然后地税表示卖方婚姻状态改变了必须全部推倒重来,央求了半天,工作人员查了几遍,确认卖家在已婚状态时名下也确实只有此唯一房产,最后按已婚状态审的,下午五点缴税成功);做资金存管(中信)
20160503    过户;付加价部分

至此换房终于告一段落,心力交瘁,感谢老婆,是你的努力才让这次换房得以完成。
从今开始努力搬砖还房贷,也祝大家都找到合适的房子。

20160211青岛看房小记

自从要在北京这边换房,我完全陷入了一种狂热的状态。有事没事刷中介网站和客户端,跟中介旁交侧击。年前买和卖两边的合同都签了,虽然离办手续过户还差得远,但好歹是放松了些。大年初四在青岛没什么事,瘾又上来了,索性跑去看了几个小区,市南市北崂山都有(鲁信长春、四季景园、湖光/阳光山色、海信璞园/金色慧谷等等),纯粹是了解性质。

走马观花一圈下来,以上提到的这几个,气质上湖光山色要差一档。整体粗略感受是青岛房子不便宜,买来自住还行,投资就算了。租售比不佳,同时出手相当难,这些小区动不动就4%~5%的在售比例,自家阳台挂横幅出售的、挂了一两年的比比皆是。链家上(还不知道青岛二手房市场份额最大的中介是哪家),光是鲁信长春就200多套房源。价钱跟12~13年基本持平(单价1万5到2万)。最近一年崂山在涨,但市南市北似乎还跌了。

话说还路过了高端的海信天玺,单价4万,在售比例20%,想想也知道多少炒房的。隔一条马路就是别墅,远远地望着赞叹不已,甚至没敢走近看楼盘名字。

怎样快糙猛的开始搞Kaggle比赛(ZT)

转自微博@phunter_lau前辈的http://phunters.lofter.com/post/86d56_66dd375

本文写给想开始搞Kaggle比赛又害怕无从下手的小朋友们。

最近比较多人问我怎么快速成为数据科学家可以挣钱多干活少整天猎头追跳槽涨一倍。我一般的答案是,没有这好事,但是搞搞Kaggle的比赛有助于快速成为数据科学家,之后挣钱多少看个人。关于Kaggle比赛是什么,限于篇幅关系,请自行谷歌。

我不是专业机器学习的人,但是我见的太多了。对于有一定数理基础的人来说,快速起步搞起来个Kaggle比赛并且获得不错的名次,难度并非难于成为王思聪的官方老婆。这里有三个部分的知识需要强化:

1. 数理基础。基本上高考数学不错的理工科学生,学过了大一大二的数学基础课程(包括微积分、数理统计、数理方程、集合论等),不存在任何问题。如果想测试一下自己,那就看看这个题目:

如果一个妹子喜欢我可能因为我帅或者我有钱,因为我既帅又有钱的概率是0.1,只是因为我有钱的概率是0.5,问,如果妹子喜欢我只是因为我就是帅的概率是多少?

如果能不费力气(心算更好)的解答这个问题,基本上这部分知识是足够了。

2. 机器学习。Kaggle比赛多依靠机器来自动处理,机器学习几乎是必须要的技能。开始搞Kaggle需要的机器学习技能并不深入,只是需要对于机器学习的常见几个方法有基本了解即可,比如说对于一个问题,你可以认识到它是个classification的问题啊还是regression的问题啊,为什么机器可以根据你输入的一个矩阵来算出来分类结果啊。推荐Coursera上Andrew Ng的机器学习课程 https://www.coursera.org/course/ml 一个捷径就是,如果你时间紧的话,只要知道什么叫做Supervised learning并且会自己实现一个Logistic Regression,差不多就够了。

3. Coding。限于篇幅只介绍Python。我可没有说什么钦定Python,你问我支持不支持,我用python我当然支持。基本的python编程得熟练,如果不熟练可以先学习 Learn Python the Hard Way。会了python之后,把scikit-learn的基本教程的classification的部分练练,你会发现在Andrew Ng课上学的知识,在python里面实际跑跑简单数据,能对课上的知识深刻的理解。同时,如果有富余时间的话,可以顺道看看numpy和pandas的一些基础操作,这些是用来数据处理好工具。

上面三点对一个数理基础不错的人来说,差不多几周的空余时间就可以了,如果是在校学生可能更快。

开始搞Kaggle的时候,建议选个入门容易的比赛。如何选择,简单来说就选个参赛人多的就好了,基本上认真搞搞结果还不会差呢。如果一个比赛还有自带Tutorial 就更好了。比如我们可以选泰坦尼克号的比赛,根据乘客的信息来判断他是不是可能在沉船中遇难。地址是 https://www.kaggle.com/c/titanic-gettingStarted

这个比赛有个很好的tutorial,第一次参加比赛的,可以在比赛过程里遇到但是不限于如下的问题:

  1. 数据怎么读取
  2. 有missing value怎么办
  3. 一等舱二等舱之类的feature为什么得当作categorial feature
  4. 。。。。

等等等等之类的问题。这些问题都是在数据科学领域的实际工作每天都能遇到的。最好的学习方法就是针对这个问题,你看Discuss Forum和Tutorial里面教你怎么解决,自己google一下看别人写好的代码怎么解决这些问题。这阶段我建议靠自己的力量搜索答案而不是去论坛上问一些伸手党类的SB问题,即使问了也没关系有人会替你解答的但是这不是慢嘛。

然后你会开始训练你的模型,又会遇到但是不限于以下的问题

  1. 啥叫random forest,咋用,为什么我调了这几个参数不灵呢
  2. 怎么我本地结果很好,但是提交名次掉成狗
  3. 原来我要Cross Validation啊(Andrew Ng的课里说到的那些看起来很无聊的曲线现在知道是为什么了吧)
  4. 。。。。。。

等等之类的。这些问题也是实际工作每天都能遇到的。你就看人家怎么调你就跟着模仿,然后体会思考一下不同调法对结果有什么区别。这比在@七月问答 上面问“如果某某情况我的随机森林的参数该怎么调才能避免这个情况”之类,对问题领悟的更深刻。折磨过几波模型调参,你就差不多知道这些模型的套路是什么了。

然后你开始刷名次,又会遇到但是不限于以下的问题:

  1. 怎么CV的结果挺好但是上去还是比不过呢
  2. 那谁说用Vowel Wabbit对每个分类做优化怎么搞啊
  3. 组合模型这概念我知道,但是实际怎么组合呢
  4. 。。。。。。

经过这些,你差不多就知道解决一个实际的机器学习问题需要做什么事情了。对的,这就是数据科学家几乎每天的工作,各部分比重不一样,但是理解问题、数据清理、模型调参、评估结果这些循环反复的动作,基本上就是数据科学家需要做的。

在这个摸索挨打的过程中,你可以快速学会数据科学的常用工具(numpy scipy pandas scikit等等),也会在别人的带动下发现新工具(比如@陈天奇怪 的xgboost,vowel wabbit之类的),也会学会新技能(比如深度学习以及如何用深度学习去解决实际的问题)。这个学习速度远超过于看书看blog,在挨打的过程里,回想一下从可可老师那里看到的每天十条数据科学经验,会不会觉得理解的更深入了呢?

在有实际工业界工作经验之前,搞搞Kaggle比赛几乎是最有效的跨过”数据科学家“门槛的方法。有了实际工作经验,搞搞Kaggle比赛也能扩大视野,也能把前沿研究的第一手结果用到实际问题里。大家加油,跳槽就翻倍的高薪工作指日可待(我没有保证能高薪啊,不要到时候把我拉出来批判一番)

最后插入广告,欢迎组队 https://www.kaggle.com/users/110702/phunter 你看我搞的很凑合但是排名还行啊对吧。

»阅读全部

不再孤独

结婚了。

领证那天上午,我俩坐在民政局的走廊里,平静如斯。然后背着包进屋坐下,点头道谢,拿证起身出门。心里没感到什么狂喜幸福,反倒有点空落落的,默默拉着手走了很久。午饭都没吃什么,两个菜剩了一半。

昨天,陪她去芍药居拿最后的一点东西,她锁门之后用手摸了一下铁门,说了声“再见~”。其实还好,但我倒差点哭了,也依样伸手摸了摸铁门,然后揽着她亲了额头。

一瞬间突然反应过来,之前那种空落落的感觉就是:这爱情一定会有张证书,证明从此不孤独。

现在她躺在沙发上迷迷糊糊地睡觉,我带着耳机听着豆瓣FM上网。我爱这个世界。

IMG_7784

芒格主义

转自微博The_Mechanic前辈的日志(http://blog.sina.com.cn/s/blog_687297e90101nwk4.html

1,大部分人都太浮躁、担心得太多。成功需要非常平静耐心,但是机会来临的时候也要足够进取

2,根据股票的波动性来判断风险是很傻的。我们认为只有两种风险:一,血本无归;二,回报不足。有些很好的生意也是波动性很大的,比如See’s糖果通常一年有两个季度都是亏钱的。反倒是有些烂透了的公司生意业绩很稳定。

3,所谓的“息税折摊前利润”就是狗屎。

4,巴菲特有时会提到“折现现金流”,但是我从来没见过他算这个。(巴菲特答曰“没错,如果还要算才能得出的价值那就太不足恃了”)

5,如果你买了一个价值低估的股票,你就要等到价格达到你算出来的内在价值时卖掉,这是很难算的。但是如果你买了一个伟大的公司,你就坐那儿待着就行了。

6,我们买过一个纺织厂(伯克希尔哈撒韦)和一个加州的存贷行(Wesco),这俩后来都带来了灾难。但是我们买的时候,价格都比清算价值打折还低。

7,互联网对于社会是极为美好的,但是对于资本家来说纯属祸害。互联网能提高效率,但是有很多东西都是提高效率却降低利润的。互联网会让美国的企业少赚钱而不是多赚钱

8,市面上对每个投资专家的评价都是高于平均的,不管有多少证据证明其实根本不是那回事儿。

9,同第5条。如果你买了一个伟大的公司,你就坐那儿待着就行了。

10,巴菲特每个礼拜有70个小时花在思考投资上。

11,人们算得太多、想得太少。

12,无论何时,如果你觉得有东西在摧毁你的生活,那个东西就是你自己。老觉得自己是受害者的想法是最削弱自己的利器。

13,税法决定了,还是买个伟大公司傻等它飞起来最划算。

14,如果你买的股票每年复利回报15%,持续30年,而你最后一次性卖掉的时候交35%的税,那你的年回报还有13.3%。反之,对于同一支股票,如果你每年都卖一次交一次税,那你的年回报就只有9.75%。这个3.5%的差距放大到30年是让人大开眼界的(小编注:30年后前者回报42.35倍,后者只有16.3倍,相差26.05倍)

15,最重要的,是要把股票看作对于企业的一小片所有权,以企业的竞争优势来判断内在的价值。要寻找未来折现的现金利润比你支付的股价高的机会。这是很基础的,你得明白概率,只有当你赢的概率更大的时候才去下赌注。 »阅读全部

前辈abord的回帖

如果谁觉得我说的片面,或者感觉不舒服,请见谅,我写几句的目的完全是为了把我知道的一些皮毛跟大家分享一下,谁能觉得受益了,那我也没白花这个时间。

先说说我个人,2001年的时候拉着箱子跑到美国,打算重新做人。因为本科学的机械相关,实在不够努力,完全因为实在对自己的专业没兴趣。毕业后中科院混了一年,坚决决定转行计算机,还好英语不错,最后混了美国大学全奖,在美国很痛苦的读完了IE的Master,中途幸福的转到CE读PhD。转眼到了2005,也生了娃儿,缺钱啊,找工作吧。那个时候其实还是很迷惘的,拼命学了两年编程,觉得只有去了Google才能体现自己的价值,也拿到了Google的面试,而且成功混到最后一轮面试,所以免费的去了纽约一趟,还住了纽约很贵的酒店,免费,农村人进城就是高兴啊,还免费,那个高兴。

我幸运的是,在真的有了想法要找工作的时候,有高人指点,可以去华尔街做Quant。可是当我看了那些面试题,我崩溃了,都不会阿。还好那个时候实验室没事,文章也攒的差不多毕业,就每天10个小时图书馆准备面试,就这样拼命准备了6个月的华尔街面试。 简历改了一遍又一遍,忐忑的发给了猎头。咱那个时候土阿,很多猎头打电话阿,高兴的要命,后来发现,猎头那就是例行公事,真的面试有没有,是另外一回事了。我现在还记得,一共有6个面试机会,有JP Morgan,有IB,还有RT,另外几个是啥忘了,就记得6个。JP第一轮被问了几个Conditional P的问题,我就晕了,RT是几个编程的问题,我完全不知道答案,开始信心崩溃,这些电话面试都没过就被砍了。 后来IB给了On site,信心回来了,其间一个小的hedge fund给了我on site,需要自费去面试,当时穷啊,还是咬牙买了机票去面试,结果在那里呆了7个小时,出来的时候脚都发飘。 就这么折腾了三个月,结果一个offer都没。当我快绝望的时候,那个小的hedge fund跟我说,要我了,当时我还记得,这不是做梦吧。

后来我在那个小的hedge fund干了4年,那个fund在08年成了整个华尔街当年最成功的CTA fund之一。后来09年想换个地方了,就换到了一个大的fund(算是当今最好的hedge fund之一吧)当PM,我清楚地记得,整个面试和谈判一共花了6个月,这样一干就是三年多。

我当年2005-2006年找工作的时候,那个时候没有特别多的MFE的那些program,现在大家去瞧瞧,美国哪个学校没有MFE啊,而且现在越来越多中国年轻人为了短平快的找工作,都自费去读那些专业。其实我们行内的都了解,读那些的基础不是特别好,开始可能就业比较容易,因为工作职位多阿,竞争也少,可是这些年积累下来,再加上那么多的MFE毕业生,街上的工作形势又那么差,所以很多MFE找不到好工作也是正常。不过比较Solid的PhD还是很容易在街上找到工作的。

大家没发现今年开始,很多量化的职位在中国?说明这个行业就要开始火了,不过能持续多久,俺可是不知道。

下面我就谈一些我对这个buy side quant招聘的了解,还有一些对想从事这个行业的同学的建议,不管对不对,轻拍吧。我这些年,一直在buy side,对sell side稍微有些了解,但是不敢瞎说,以免误人子弟。我还是说说buy side。

街上的buy side quant分类很多,这跟每个所在的team特点有关系。但是我觉得,只要你对quant trading有很强烈的兴趣,愿意把这个当作将来的职业,那么谁都有机会,尤其现在整个市场呈现朝阳产业的形势的时候。我共事过的的同事,有的是哥大本科学德国文学,有的是MIT物理,有的是三流大学学什么哲学的,照样这样干的都挺欢的,别气乃,只要热爱,就有机会。 不过实事求是,我面试了国内很多顶尖大学的学生,其中也不少奥赛金牌,别的不说,很多人的那个简历让我看得生气,最少你把简历搞得像样吧,随便扔一简历过来,我看都不看直接删,不是别的,这是态度问题。还有就是太多学生不注意细节,我打开信箱一看,有什么“风中之神”,“杀手本色”发给我的求职简历,你说我上来怎么想?

我跟大家说说我们作为招聘者,都关心啥

1)态度,要能咬牙坚持,虚心的拿出几年的时间来学习。有的高校的优秀学生,说话那态度觉得自己是什么baidu, google随便挑的。我想说的是,你申请工作,就要虚心,就冲那种目光无人的态度,你再强都没用。

2)数学基础很重要,但不是说你啥都会。比如我到现在不知道Black S怎么算,也不碍事。可是你得有一项专长吧,要末统计,要末工程数学,要末machine learning啥的,咋也得有一强项。

3)我是编程控,面试的时候,如果觉得你编程太差,直接砍,但是我个人认为编程是个最好提高的能力,只要你肯每天编几个小时,不出1年,就算水平很好。至于用什么语言,你得最少有一项非常强吧。

讣告

我的母亲张新芝因肺部感染,于今晨2时20分在北京306医院仙逝,享年60岁。

走时我在身边,母亲平静安稳。

母亲于2012年11月11日病重入院,翌日被确诊为多发性骨髓瘤,两个月来肺部深度感染始终未能完全消退,同时伴随病理性骨折与肾功能损伤,高烧不退。

母亲是个善良、坚强、优秀的人,1952年9月24日出生于黑龙江哈尔滨市,青少年时期经历上山下乡,在北大荒红星农场工作数年。1975年被保送入北京大学中文系学习,79年毕业后即进入中国作家协会诗刊社工作,2012年9月退休。

在此对所有支持和帮助过母亲的人致谢,同时还要感谢306医院医生、护士和朋友们的帮助。谢谢。

亲爱的老妈,一路走好,儿子所幸,得以在生命中长久地拥有过您。与您度过的每一天,儿子都会永远铭记于心。

前辈afuafu的回帖

本人是统计物理出身的,所以可能立足点跟大伙不太一样,我觉得程序化交易本质上就是研究金融时间序列,然后编程实现。对于金融时间序列,我觉得有几点必须要说的:

一,首先肯定不是布朗运动过程(数学上的维纳过程),所以那些什么马尔可夫的方法用来交易会害死人的。当然有个好的地方,鞅过程的假设也不成立,所以会存在套利空间。

二,在高频的情况下,时间序列是长关联的,所以近独立关联的方法,或者说概率论那套思想基本上也不好用。

三,在此基础上中心极限是不适用的,所以什么大数定理啊,正态分布等等假设如果要用来交易肯定是错的,小概率事件远比中心极限里面的概率大,现在常常有所谓的肥尾分布提法。

四,平均值和方差是波动的,所以这个时间序列不是平稳的。虽然GARCH可以描述非平稳情况,但是并不是从动力学出发,过于维像,当然结果也不是那么可靠。特别是无法解释后面要提到的这两点。

五,金融时间序列的统计性质在不同尺度上有一定的相似性,但是并不一致,最明显的就是价格波动分布在不同时间间隔下都不一致。所以分析的时候一定要注意,原则上不同时间尺度的规律是不一样的。

补充非常重要的第六点、如果把价格当作位置(经常还取对数),那么价格的变化率就是速度。我们很容易看到,实际上时间尺度越小,速度越大,但是价格变化幅度是变小的。简单来讲,金融时间序列的速度是处处发散的,但又是处处可积的。由于这个性质存在,所以试图用拟合(经济上称为回归)的思想来作预测实际上是行不通的。例如:采用傅里叶展开的方法,有限元分析,多重神经网络等等。

经常看到研究金融时间序列的同行们存在以上的误区,把一些假设当成自然而然的定律。当然现在我所知道的过程方法都没法模拟出完全满足上面提到的统计性质的时间序列。我也是刚入行不久,懂得也不多,希望大家多加探讨。

程序方面,我认为最终是要完全程序化交易的,所以平台非常重要。外汇方面,mt4做得很好。国内的期货方面有几个平台,如开拓者,文华,但是感觉很不完善。国内股票没看过公开的平台,当然t+1单向也不太适合程序化交易。

前辈xinzaitiao的回帖

芒格说过:“我不会为了省5美分,就去买我不熟悉的口香糖,毕竟嘴巴是个私密性很高的地方”,所以他投资了绿箭。同样的道理发生在宝洁等个消品。

投资是种理念也是种经验,市场整体估值下降,牛股还在不断创历史新高,a股尤为明显。说实话,真正基本面好转的股票都没怎么跌,你看看今年的电力板块,充分收益于煤价下跌。去年几只进入电力的基金,今年这块50%收益不止。同样的事情在很多板块发生的,我看的歌尔声学,08年到现在何止10倍涨幅啊,还在不断创新高,这个行业真是产业链条上最受益智能手机大发展的细分行业,熊市一把啥都检验出来了。

你看看阳光私募今年还有+15%收益的品种。

还是芒格说的,你的性格如果把“把学习当成娱乐而不是工作,这会为你带来优势”。如果你的特质和他不一样,就必须找到适合你自己的思维方式。他86岁还会去研究比亚迪的新能源电池,向王传福讨教好的中国公司的模式。

你把学习投资思维当做乐趣而不是工作,把研究公司当做自己知识面的扩张而不是赚钱的压力,其实无论多低迷的市场,金融研究都是份不错的工作。

这也是我周五通宵,周六一天兴致勃勃研究以前完全没有涉及的,声电领域“主要技术指标含义和产品设计难点”的原因,我希望通过研究完这个公司,我能至少成为这个领域能跟技术专家对得上话的人,而不仅仅是几个金融模型和宏观趋势去DCF一下未来这个公司的估值。

Pages: 1 2 Next