2017.05专题

2017.05.27回顾

1、看机票做决策,最后是回家买好的 2、按照早前定好的评价方法进行评价,building sample内的弄完了,有很多手工的工作,想办法用自动化的方法去替代 上午只上了半天班,主要就是新模型评价

2017.05.26回顾

1、星期五很多时间是在看飞机票,然后在下午确定了请假计划,提交了申请,完成请假 2、尝试找了下在excel中怎么对连续变量进行分段,没有找到解决方案,还是要在python去完成 星期五还干了什么呢?感觉好难回忆起来,我觉得应该是建模相关的吧,还是那句话啊,一定一定要预留好时间,写好每日回顾,早点着手写!!!

2017.05.25回顾 lift转roc 不会出现前期发力模型

1、上午连续写了两篇小结 2、继续上一篇小结中的第一个问题,定性上觉得可以loss来判断,但是觉得定量上证明比较复杂,我就曲线救国,研究了下这些lift画出roc是什么样子 蓝线是我正常模型的lift曲线,红线是根据boss的描述画出来的,因为E(lift) = 1(这里有错,是当每个decile接近于等分的时候有这个性质),所以红线后面只能越来越平缓,直线是我自己构造出来的,每个dec

2017.05.24回顾 mysql添加索引

1、上午review了下模型的地区规则,boss提出了两点质疑,一个是对模型有效性,二个是提出了一种用地域去加减分的方法,当时他提有效性,我没有反驳,其实我对一些rank order的性质也不熟悉说明,后来我去做rank order的时候发现,前面的分隔本身就不明显,然后观察了其他的模型,不同的方法都是同一种分布,经验判断,模型都是这样,但是boss说看过前期发力的模型,我画了下,感性上认为,这样

2017.05.23回顾 python引用赋值 reset_index pd.concat

这两天实在是太忙,甚至都忽略了写博客,今天把23和24的博客补起来,节奏不能乱,不管多忙,老子都要写博客,磨刀不费砍柴时,博客写好,后续的工作效率会更高 1、23号我上主要是在建模写拉数据的SQL,上午基本完成 2、测试来找我改一些假接口,测试FOX的写入需求,中午完成,都是有bug,下午改了几次 3、IT来找我,对AS结果进行组合,改好上线 4、下午剩余的时间继续建模,我对别人的WOE工

2017.05.22回顾

1、处理BUG,查看监控信息,开始着手证明R2和相关系数关系 2、下午各种开会,最后找到一个已有的证明,学习了并补充在上次小结中,有一些证明题的技巧 3、开始着手建合作方的模型,我想很认真地写SQL,花了一些时间,效率有点低,动作慢了 差不多以上

2017.05.19回顾 TSS = ESS + RSS证明

1、对风控描述文档进行了修改,交付给了相关同事 2、然后就是把Ken的接口加入到合作方决策引擎中,没什么问题,还是老套路,只是对于AS前置模型的情况进行了一些小处理 3、下午我记得还Henry微信沟通了一下,放宽了AS某个渠道的客户 4、下午还研究了手机三要素的问题,发现根本就没拉3A的手机三要素,然后又是一番沟通,过程中也了解到3A的一些库表结构 5、下午的另外一半时间都是集中在领悟线性