« 类别 拿什么混饭吃 下的文章

怎样快糙猛的开始搞Kaggle比赛(ZT)

转自微博@phunter_lau前辈的http://phunters.lofter.com/post/86d56_66dd375

本文写给想开始搞Kaggle比赛又害怕无从下手的小朋友们。

最近比较多人问我怎么快速成为数据科学家可以挣钱多干活少整天猎头追跳槽涨一倍。我一般的答案是,没有这好事,但是搞搞Kaggle的比赛有助于快速成为数据科学家,之后挣钱多少看个人。关于Kaggle比赛是什么,限于篇幅关系,请自行谷歌。

我不是专业机器学习的人,但是我见的太多了。对于有一定数理基础的人来说,快速起步搞起来个Kaggle比赛并且获得不错的名次,难度并非难于成为王思聪的官方老婆。这里有三个部分的知识需要强化:

1. 数理基础。基本上高考数学不错的理工科学生,学过了大一大二的数学基础课程(包括微积分、数理统计、数理方程、集合论等),不存在任何问题。如果想测试一下自己,那就看看这个题目:

如果一个妹子喜欢我可能因为我帅或者我有钱,因为我既帅又有钱的概率是0.1,只是因为我有钱的概率是0.5,问,如果妹子喜欢我只是因为我就是帅的概率是多少?

如果能不费力气(心算更好)的解答这个问题,基本上这部分知识是足够了。

2. 机器学习。Kaggle比赛多依靠机器来自动处理,机器学习几乎是必须要的技能。开始搞Kaggle需要的机器学习技能并不深入,只是需要对于机器学习的常见几个方法有基本了解即可,比如说对于一个问题,你可以认识到它是个classification的问题啊还是regression的问题啊,为什么机器可以根据你输入的一个矩阵来算出来分类结果啊。推荐Coursera上Andrew Ng的机器学习课程 https://www.coursera.org/course/ml 一个捷径就是,如果你时间紧的话,只要知道什么叫做Supervised learning并且会自己实现一个Logistic Regression,差不多就够了。

3. Coding。限于篇幅只介绍Python。我可没有说什么钦定Python,你问我支持不支持,我用python我当然支持。基本的python编程得熟练,如果不熟练可以先学习 Learn Python the Hard Way。会了python之后,把scikit-learn的基本教程的classification的部分练练,你会发现在Andrew Ng课上学的知识,在python里面实际跑跑简单数据,能对课上的知识深刻的理解。同时,如果有富余时间的话,可以顺道看看numpy和pandas的一些基础操作,这些是用来数据处理好工具。

上面三点对一个数理基础不错的人来说,差不多几周的空余时间就可以了,如果是在校学生可能更快。

开始搞Kaggle的时候,建议选个入门容易的比赛。如何选择,简单来说就选个参赛人多的就好了,基本上认真搞搞结果还不会差呢。如果一个比赛还有自带Tutorial 就更好了。比如我们可以选泰坦尼克号的比赛,根据乘客的信息来判断他是不是可能在沉船中遇难。地址是 https://www.kaggle.com/c/titanic-gettingStarted

这个比赛有个很好的tutorial,第一次参加比赛的,可以在比赛过程里遇到但是不限于如下的问题:

  1. 数据怎么读取
  2. 有missing value怎么办
  3. 一等舱二等舱之类的feature为什么得当作categorial feature
  4. 。。。。

等等等等之类的问题。这些问题都是在数据科学领域的实际工作每天都能遇到的。最好的学习方法就是针对这个问题,你看Discuss Forum和Tutorial里面教你怎么解决,自己google一下看别人写好的代码怎么解决这些问题。这阶段我建议靠自己的力量搜索答案而不是去论坛上问一些伸手党类的SB问题,即使问了也没关系有人会替你解答的但是这不是慢嘛。

然后你会开始训练你的模型,又会遇到但是不限于以下的问题

  1. 啥叫random forest,咋用,为什么我调了这几个参数不灵呢
  2. 怎么我本地结果很好,但是提交名次掉成狗
  3. 原来我要Cross Validation啊(Andrew Ng的课里说到的那些看起来很无聊的曲线现在知道是为什么了吧)
  4. 。。。。。。

等等之类的。这些问题也是实际工作每天都能遇到的。你就看人家怎么调你就跟着模仿,然后体会思考一下不同调法对结果有什么区别。这比在@七月问答 上面问“如果某某情况我的随机森林的参数该怎么调才能避免这个情况”之类,对问题领悟的更深刻。折磨过几波模型调参,你就差不多知道这些模型的套路是什么了。

然后你开始刷名次,又会遇到但是不限于以下的问题:

  1. 怎么CV的结果挺好但是上去还是比不过呢
  2. 那谁说用Vowel Wabbit对每个分类做优化怎么搞啊
  3. 组合模型这概念我知道,但是实际怎么组合呢
  4. 。。。。。。

经过这些,你差不多就知道解决一个实际的机器学习问题需要做什么事情了。对的,这就是数据科学家几乎每天的工作,各部分比重不一样,但是理解问题、数据清理、模型调参、评估结果这些循环反复的动作,基本上就是数据科学家需要做的。

在这个摸索挨打的过程中,你可以快速学会数据科学的常用工具(numpy scipy pandas scikit等等),也会在别人的带动下发现新工具(比如@陈天奇怪 的xgboost,vowel wabbit之类的),也会学会新技能(比如深度学习以及如何用深度学习去解决实际的问题)。这个学习速度远超过于看书看blog,在挨打的过程里,回想一下从可可老师那里看到的每天十条数据科学经验,会不会觉得理解的更深入了呢?

在有实际工业界工作经验之前,搞搞Kaggle比赛几乎是最有效的跨过”数据科学家“门槛的方法。有了实际工作经验,搞搞Kaggle比赛也能扩大视野,也能把前沿研究的第一手结果用到实际问题里。大家加油,跳槽就翻倍的高薪工作指日可待(我没有保证能高薪啊,不要到时候把我拉出来批判一番)

最后插入广告,欢迎组队 https://www.kaggle.com/users/110702/phunter 你看我搞的很凑合但是排名还行啊对吧。

»阅读全部

芒格主义

转自微博The_Mechanic前辈的日志(http://blog.sina.com.cn/s/blog_687297e90101nwk4.html

1,大部分人都太浮躁、担心得太多。成功需要非常平静耐心,但是机会来临的时候也要足够进取

2,根据股票的波动性来判断风险是很傻的。我们认为只有两种风险:一,血本无归;二,回报不足。有些很好的生意也是波动性很大的,比如See’s糖果通常一年有两个季度都是亏钱的。反倒是有些烂透了的公司生意业绩很稳定。

3,所谓的“息税折摊前利润”就是狗屎。

4,巴菲特有时会提到“折现现金流”,但是我从来没见过他算这个。(巴菲特答曰“没错,如果还要算才能得出的价值那就太不足恃了”)

5,如果你买了一个价值低估的股票,你就要等到价格达到你算出来的内在价值时卖掉,这是很难算的。但是如果你买了一个伟大的公司,你就坐那儿待着就行了。

6,我们买过一个纺织厂(伯克希尔哈撒韦)和一个加州的存贷行(Wesco),这俩后来都带来了灾难。但是我们买的时候,价格都比清算价值打折还低。

7,互联网对于社会是极为美好的,但是对于资本家来说纯属祸害。互联网能提高效率,但是有很多东西都是提高效率却降低利润的。互联网会让美国的企业少赚钱而不是多赚钱

8,市面上对每个投资专家的评价都是高于平均的,不管有多少证据证明其实根本不是那回事儿。

9,同第5条。如果你买了一个伟大的公司,你就坐那儿待着就行了。

10,巴菲特每个礼拜有70个小时花在思考投资上。

11,人们算得太多、想得太少。

12,无论何时,如果你觉得有东西在摧毁你的生活,那个东西就是你自己。老觉得自己是受害者的想法是最削弱自己的利器。

13,税法决定了,还是买个伟大公司傻等它飞起来最划算。

14,如果你买的股票每年复利回报15%,持续30年,而你最后一次性卖掉的时候交35%的税,那你的年回报还有13.3%。反之,对于同一支股票,如果你每年都卖一次交一次税,那你的年回报就只有9.75%。这个3.5%的差距放大到30年是让人大开眼界的(小编注:30年后前者回报42.35倍,后者只有16.3倍,相差26.05倍)

15,最重要的,是要把股票看作对于企业的一小片所有权,以企业的竞争优势来判断内在的价值。要寻找未来折现的现金利润比你支付的股价高的机会。这是很基础的,你得明白概率,只有当你赢的概率更大的时候才去下赌注。 »阅读全部

前辈abord的回帖

如果谁觉得我说的片面,或者感觉不舒服,请见谅,我写几句的目的完全是为了把我知道的一些皮毛跟大家分享一下,谁能觉得受益了,那我也没白花这个时间。

先说说我个人,2001年的时候拉着箱子跑到美国,打算重新做人。因为本科学的机械相关,实在不够努力,完全因为实在对自己的专业没兴趣。毕业后中科院混了一年,坚决决定转行计算机,还好英语不错,最后混了美国大学全奖,在美国很痛苦的读完了IE的Master,中途幸福的转到CE读PhD。转眼到了2005,也生了娃儿,缺钱啊,找工作吧。那个时候其实还是很迷惘的,拼命学了两年编程,觉得只有去了Google才能体现自己的价值,也拿到了Google的面试,而且成功混到最后一轮面试,所以免费的去了纽约一趟,还住了纽约很贵的酒店,免费,农村人进城就是高兴啊,还免费,那个高兴。

我幸运的是,在真的有了想法要找工作的时候,有高人指点,可以去华尔街做Quant。可是当我看了那些面试题,我崩溃了,都不会阿。还好那个时候实验室没事,文章也攒的差不多毕业,就每天10个小时图书馆准备面试,就这样拼命准备了6个月的华尔街面试。 简历改了一遍又一遍,忐忑的发给了猎头。咱那个时候土阿,很多猎头打电话阿,高兴的要命,后来发现,猎头那就是例行公事,真的面试有没有,是另外一回事了。我现在还记得,一共有6个面试机会,有JP Morgan,有IB,还有RT,另外几个是啥忘了,就记得6个。JP第一轮被问了几个Conditional P的问题,我就晕了,RT是几个编程的问题,我完全不知道答案,开始信心崩溃,这些电话面试都没过就被砍了。 后来IB给了On site,信心回来了,其间一个小的hedge fund给了我on site,需要自费去面试,当时穷啊,还是咬牙买了机票去面试,结果在那里呆了7个小时,出来的时候脚都发飘。 就这么折腾了三个月,结果一个offer都没。当我快绝望的时候,那个小的hedge fund跟我说,要我了,当时我还记得,这不是做梦吧。

后来我在那个小的hedge fund干了4年,那个fund在08年成了整个华尔街当年最成功的CTA fund之一。后来09年想换个地方了,就换到了一个大的fund(算是当今最好的hedge fund之一吧)当PM,我清楚地记得,整个面试和谈判一共花了6个月,这样一干就是三年多。

我当年2005-2006年找工作的时候,那个时候没有特别多的MFE的那些program,现在大家去瞧瞧,美国哪个学校没有MFE啊,而且现在越来越多中国年轻人为了短平快的找工作,都自费去读那些专业。其实我们行内的都了解,读那些的基础不是特别好,开始可能就业比较容易,因为工作职位多阿,竞争也少,可是这些年积累下来,再加上那么多的MFE毕业生,街上的工作形势又那么差,所以很多MFE找不到好工作也是正常。不过比较Solid的PhD还是很容易在街上找到工作的。

大家没发现今年开始,很多量化的职位在中国?说明这个行业就要开始火了,不过能持续多久,俺可是不知道。

下面我就谈一些我对这个buy side quant招聘的了解,还有一些对想从事这个行业的同学的建议,不管对不对,轻拍吧。我这些年,一直在buy side,对sell side稍微有些了解,但是不敢瞎说,以免误人子弟。我还是说说buy side。

街上的buy side quant分类很多,这跟每个所在的team特点有关系。但是我觉得,只要你对quant trading有很强烈的兴趣,愿意把这个当作将来的职业,那么谁都有机会,尤其现在整个市场呈现朝阳产业的形势的时候。我共事过的的同事,有的是哥大本科学德国文学,有的是MIT物理,有的是三流大学学什么哲学的,照样这样干的都挺欢的,别气乃,只要热爱,就有机会。 不过实事求是,我面试了国内很多顶尖大学的学生,其中也不少奥赛金牌,别的不说,很多人的那个简历让我看得生气,最少你把简历搞得像样吧,随便扔一简历过来,我看都不看直接删,不是别的,这是态度问题。还有就是太多学生不注意细节,我打开信箱一看,有什么“风中之神”,“杀手本色”发给我的求职简历,你说我上来怎么想?

我跟大家说说我们作为招聘者,都关心啥

1)态度,要能咬牙坚持,虚心的拿出几年的时间来学习。有的高校的优秀学生,说话那态度觉得自己是什么baidu, google随便挑的。我想说的是,你申请工作,就要虚心,就冲那种目光无人的态度,你再强都没用。

2)数学基础很重要,但不是说你啥都会。比如我到现在不知道Black S怎么算,也不碍事。可是你得有一项专长吧,要末统计,要末工程数学,要末machine learning啥的,咋也得有一强项。

3)我是编程控,面试的时候,如果觉得你编程太差,直接砍,但是我个人认为编程是个最好提高的能力,只要你肯每天编几个小时,不出1年,就算水平很好。至于用什么语言,你得最少有一项非常强吧。

前辈afuafu的回帖

本人是统计物理出身的,所以可能立足点跟大伙不太一样,我觉得程序化交易本质上就是研究金融时间序列,然后编程实现。对于金融时间序列,我觉得有几点必须要说的:

一,首先肯定不是布朗运动过程(数学上的维纳过程),所以那些什么马尔可夫的方法用来交易会害死人的。当然有个好的地方,鞅过程的假设也不成立,所以会存在套利空间。

二,在高频的情况下,时间序列是长关联的,所以近独立关联的方法,或者说概率论那套思想基本上也不好用。

三,在此基础上中心极限是不适用的,所以什么大数定理啊,正态分布等等假设如果要用来交易肯定是错的,小概率事件远比中心极限里面的概率大,现在常常有所谓的肥尾分布提法。

四,平均值和方差是波动的,所以这个时间序列不是平稳的。虽然GARCH可以描述非平稳情况,但是并不是从动力学出发,过于维像,当然结果也不是那么可靠。特别是无法解释后面要提到的这两点。

五,金融时间序列的统计性质在不同尺度上有一定的相似性,但是并不一致,最明显的就是价格波动分布在不同时间间隔下都不一致。所以分析的时候一定要注意,原则上不同时间尺度的规律是不一样的。

补充非常重要的第六点、如果把价格当作位置(经常还取对数),那么价格的变化率就是速度。我们很容易看到,实际上时间尺度越小,速度越大,但是价格变化幅度是变小的。简单来讲,金融时间序列的速度是处处发散的,但又是处处可积的。由于这个性质存在,所以试图用拟合(经济上称为回归)的思想来作预测实际上是行不通的。例如:采用傅里叶展开的方法,有限元分析,多重神经网络等等。

经常看到研究金融时间序列的同行们存在以上的误区,把一些假设当成自然而然的定律。当然现在我所知道的过程方法都没法模拟出完全满足上面提到的统计性质的时间序列。我也是刚入行不久,懂得也不多,希望大家多加探讨。

程序方面,我认为最终是要完全程序化交易的,所以平台非常重要。外汇方面,mt4做得很好。国内的期货方面有几个平台,如开拓者,文华,但是感觉很不完善。国内股票没看过公开的平台,当然t+1单向也不太适合程序化交易。

前辈xinzaitiao的回帖

芒格说过:“我不会为了省5美分,就去买我不熟悉的口香糖,毕竟嘴巴是个私密性很高的地方”,所以他投资了绿箭。同样的道理发生在宝洁等个消品。

投资是种理念也是种经验,市场整体估值下降,牛股还在不断创历史新高,a股尤为明显。说实话,真正基本面好转的股票都没怎么跌,你看看今年的电力板块,充分收益于煤价下跌。去年几只进入电力的基金,今年这块50%收益不止。同样的事情在很多板块发生的,我看的歌尔声学,08年到现在何止10倍涨幅啊,还在不断创新高,这个行业真是产业链条上最受益智能手机大发展的细分行业,熊市一把啥都检验出来了。

你看看阳光私募今年还有+15%收益的品种。

还是芒格说的,你的性格如果把“把学习当成娱乐而不是工作,这会为你带来优势”。如果你的特质和他不一样,就必须找到适合你自己的思维方式。他86岁还会去研究比亚迪的新能源电池,向王传福讨教好的中国公司的模式。

你把学习投资思维当做乐趣而不是工作,把研究公司当做自己知识面的扩张而不是赚钱的压力,其实无论多低迷的市场,金融研究都是份不错的工作。

这也是我周五通宵,周六一天兴致勃勃研究以前完全没有涉及的,声电领域“主要技术指标含义和产品设计难点”的原因,我希望通过研究完这个公司,我能至少成为这个领域能跟技术专家对得上话的人,而不仅仅是几个金融模型和宏观趋势去DCF一下未来这个公司的估值。

前辈cyberboy的回帖

第一:需要先细化自己的目标,不要野心太大追逐圣杯和永动机,能够找到一个某些时空下可以有效工作地东西就可以偷笑了;全天候无差别攻击的飞行器不是地球人现阶段需要考虑的发展方向,你能找到一个三不管海域,想出AK47+快艇狼群战术就是福至心灵了。

第二:补习一下模型选择,不要扔到锅里就是菜,拿一大堆名字很酷的算法,你得知道各模型的优缺点,什么时候该用什么模型。个人认为最简单的kNN和NaiveBayesian以及规则推导(C4.5?不清楚现在版本)是最好用的,比很酷的向量机神经网络遗传退火蚂蚁什么都靠谱,而且这几个算法其实可以化生出绝大多数的算法了。

第三:重视Feature Engineering/Selection, 诚如Kanlee所责,光拿价格数据是不够的,加上更多的数据维度会有帮助,比如成交量,比如基本面数据,比如市场新闻,比如内部人行为,但也不是他所说完全没用,纯技术派某些市场某些产品某些时空可以称霸。安乐先生看见只鸟都可以知道南人北相,但在那之前你得有几十年的广博经验阅历打底。个人认为这块的投入资源应该远远超过其他所有的部分。

第四:你的评价函数和测试培训过程需要大幅度改变,应用一下主流基金评价体系比如风险调整后回报/最大回撤之类的会更好,其次不要用单一的数据划分去培训,我建议把时间序列数据作若干次随机划分,每次假定一个/两个划分时间点,之前数据训练,之后数据用于测试,有可能分成三段数据,加上Tunning会更好,综合若干次(总得百次以上才有意义)。

第五:确定你的战场。很多金工爱好者选国内期指,可以是一个方向,但是一个拥挤窄小的水潭,你们的资金也根本无法承受几张期货的涨跌,根本无法有效实盘作战。建议你们眼光放宽点,海外的标普/恒生/黄金/国债/石油都是非常好的品种,接近24小时交易的同时,大多有mini期货,可以让你的交易粒度更细,多玩几轮再死。另外一个能适应多个产品多个市场的模型/系统,适应性鲁棒性显然不用说,overfitting的可能大幅度降低。

第六:不要急着追逐成功,多输钱是好事,试着把所有能输钱的方式都试一次,离赢钱就不远了。在市场上生存下去远比输赢重要,明白这一点,可能有助于你解决第一个问题。

第七;给Kanlee这样的学院派或者经济学/基本面信徒,宇宙很大,大家各有各的生存方式,各有各的角度,没有谁能穷尽这个市场或者找到永远正确的整理,适者生存不断进化才是王道。定价是很重要,基本功,不过价位什么必须得定呢?经济学和书本上的东西有太多假设,实际金融市场是暗夜森林,弱肉强食。如果从数量上说,我相信目前市场上大多数东西是被人操纵定价多过市场定价或者基本面决定,别跟我说长期。让我推举金融学者这若干年值得学的东西,我的排序是Position Sizing/行为金融学/博弈论;我只相信超级大亨们的经济学,学院和政府食客的经济学,甚至主要国家的主要政客,绝大多数混口饭吃。你的身家说明你的经济学功底,这就是我的经济学评价函数,你觉得呢?

书单

乞丐版:

Pairs Trading: Quantitative Methods and Analysis

Mathemmatics for Finance: An Introduction to Financial Engineering

Paul Wilmott Introduces Quantitative Finance

Trading Exchanges: Market Microstructure for Practitioners

=========================================================================

诸神翻译Wilmott的推荐版:

0.0 First steps — General:

A. Black Scholes and Beyond: Option Pricing Models, N A Chriss
B. Derivative Securities, R Jarrow, S Turnbu
C. Introduction to Mathematical Finance: Discrete Time Models, S R Pliska (经济科学 中译本)

0.1 First steps — Interest rates:

A. Fixed Income Analytics, K Garbade

0.3 First steps — Stochastic Calculus:

A. An Introduction to the Mathematics of Financial Deivatives, S N Neftci.

0.5. First steps — Honourable mention:

A. Option Market Making: Trading and Risk Analysis for the Financial and Commodity Option Markets, A J Baird

=========================================================================

1.0. Introductory — General:

A. Options Markets, J C Cox, M Rubinstein (清华 影印本)
B. Options, Futures, and Other Derivatives, J C Hull (清华 影印本)
C. An Introduction to Mathematical Finance: Options and Other Topics, S M Ross
D. Paul Wilmott Introduces Quantitative Finance, P Wilmott.
E. The Mathematics of Financial Derivatives: A Student Introduction, P Wilmott, S Howison, J Dewynne

1.1 Introductory — Interest rates:

A. Modelling Fixed Income Securities and Interest Rate Options, R A Jarrow

1.2 Introductory — Exotics:

A. Structured Equity Derivatives: The Definitive Guide to Exotic Options and Structured Notes, H M Kat

1.3 Introductory — Stochastic Calculus:

A. Elementary Stochastic Calculus With Finance in View, T Mikosch.

1.4 Introductory — Computational:

A. Pricing Derivative Securities: An Interactive, Dynamic Environment with Maple V and Matlab, E Z Prisman

1.5 Introductory — Honourable mention:

A. Investment Under Uncertainty, A K Dixit, R S Pindyck (中译本)
B. The Complete Guide to Option Pricing Formulas, E G Haug
C. Real Options: Managerial Flexibility and Strategy in Resource Allocation, L Trigeorgis

=========================================================================

2.0 Halfway technical — General:

A. Quantitative Modeling of Derivative Securities From Theory To Practice, M Avellaneda, P Laurence
B. Financial Calculus : An Introduction to Derivative Pricing, M Baxter, A Rennie
C. Arbitrage Theory in Continuous Time, T Bjork
D. Theory of Financial Decision Making, J E Ingersoll
E. Risk-Neutral Valuation: Pricing and Hedging of Financial Derivatives, R Kiesel, N H Bingham
F. Mathematical Models of Financial Derivatives, Y K Kwok
G. Continuous-Time Finance, R C Merton (人大 中译本)
H. Paul Wilmott on Quantitative Finance, 2 Volume Set, P Wilmott.

2.2. Halfway technical — Stochastic Calculus:

A. Introduction to Stochastic Calculus with Applications, F C Klebaner

2.4. Halfway technical — Computational:

A. Implementing Derivatives Models, L Clewlow, Chr Strickland
B. Pricing Financial Instruments: The Finite Difference Method, D Tavella, C Randall

2.5. Halfway technical — Honourable mention:

A. The Treasury Bond Basis, G D Burghardt, T M Belton, M Lane, J Papa.
B. Dynamic Hedging, N Taleb.

=========================================================================

3.0 Technical — General:

A. Options, Futures and Exotic Derivatives, E Briys, M Bellalah, H M Mai, F de Varenne
B. Modelling And Hedging Equity Derivatives, O Brockhaus, A Ferraris, Ch Gallus, D Long, R Martin, M Overhaus
C. Dynamic Asset Pricing Theory, D Duffie
D. Derivatives in Financial Markets With Stochastic Volatility, J-P Fouque, G Papanicolaou, K R Sircar
E. Mathematics of Financial Markets, P E Kopp, R J Elliott
F. Option Pricing and Portfolio Optimization: Modern Methods of Financial Mathematics, R Korn, E Korn
F. Introduction to Stochastic Calculus Applied to Finance, D Lamberton, B Lapeyre, N Rabeau
G. Martingale Methods in Financial Modelling, M Musiela, M Rutkowski
H. Pricing and Hedging of Derivative Securities, L T Nielsen
I. Essentials of Stochastic Finance: Facts, Models, Theory, A N Shiryaev

3.1 Technical — Interest rates:

A. Interest Rate Models Theory and Practice: Theory and Practice, D Brigo, Fabio Mercurio
B. Efficient Methods for Valuing Interest Rate Derivatives, A Pelsser
C. Interest-Rate Option Models: Understanding, Analyzing and Using Models for Exotic Interest-Rate Options, R Rebonato
D. Interest Rate Modelling: Financial Engineering, N Webber, J James

3.2 Technical — Stochastic Calculus:

A. Brownian Motion and Stochastic Calculus, I Karatzas, S E Shreve
B. Stochastic Differential Equations, B Oksendal (以前世界图书有过影印本)
C. Stochastic Calculus and Financial Applications, J M Steele

3.5 Technical — Honourable mention:

A. Optimal Portfolios, R Korn
B. Option Valuation under Stochastic Volatility, A L Lewis

=========================================================================

4.0 Hard core — General:

A. Security Markets: Stochastic Models, D Duffie
B. Financial Derivatives in Theory and Practice, P J Hunt, J Kennedy
C. Introduction to Option Pricing Theory, R L Karandikar, G Kallianpur
D. Methods of Mathematical Finance, I Karatzas, S E Shreve

4.3 Hard core — Stochastic Calculus:

A. Continuous Martingales and Brownian Motion, D Revuz, M Yor
B. Diffusions, Markov Processes, and Martingales (two volumes), L C G Rogers, D Williams

……

把数据从 Oracle 迁移到 SQL Server 2008

过几天有 TB 级别的数据要从 Oracle 导到 SQL Server,今天学习了一下试了试单表迁移。记在这。

感谢名策数据gaiwei老师解惑。

目标:把数据从 Oracle 迁移到 SQL Server 2008。

1. 将 Oracle 中的表数据导出为以逗号分隔的 txt 文件。

2. 在 SQL Server 数据库上创建表。

3. 在SQL Server 数据库上生成导入数据文件所需的 format 文件:

bcp master..IF_QUOTE_1MIN format null -f IF_QUOTE_1MIN.fmt -c -t, -T -S GS16040D2

4. 用 bcp 导入(下例服务器名称 GS16040D2,库名 master,表名 IF_QUOTE_1MIN)

bcp.exe master..IF_QUOTE_1MIN in IF_QUOTE_1MIN_2011.txt -f IF_QUOTE_1MIN.fmt -e IF_QUOTE_1MIN.err -m 0 -t, -r\n -E   -T -S GS16040D2 -b50000 -k

先记在这。