博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
业界 | 数据科学家要先学逻辑回归?图样图森破!
阅读量:6603 次
发布时间:2019-06-24

本文共 842 字,大约阅读时间需要 2 分钟。

近期,数据科学圈出现了不少“数据科学家应最先学习逻辑回归”的声音。作为一名与市场营销人员、销售人员、工程师一起工作的“孤立的”统计学家,我深深反对这一说法!

有许多工作尤其是生物统计领域都要求从业人员能够掌握并运用逻辑回归的知识。如果你在大学曾学过一些逻辑回归,这会对你很有帮助,但对于初学者来说,它并不是入门课程。

在我的职业生涯中,我可以灵活地选择使用哪些方法和工具,如今许多从业者都处于类似的环境中。

因此有一定的几率,初学者在对逻辑回归的原理了解很少的情况下,使用像黑盒工具一样的逻辑回归,然后把自己拉入深坑。

2c2494ffe960aec87bef37543bdd7c626b4f005d

下面列出了5条逻辑回归应放在最后学习的理由:

  • 存在着上百种不同类型的逻辑回归,一些适用于分类变量,一些适用于特定的分布(例如泊松分布)。专家在使用时也常常感到困惑,初学者和你的老板更会如此。

  • 转换因变量后(通常是比例或二值型因变量,例如本文观点正确/错误),问题就变成了线性回归。虽然纯粹主义者声称实际的逻辑回归模型更精确,然而相较于模型的精确度,数据的质量才是至关重要的。如果数据有20%的噪声,或者理论模型是对实际情况的粗略估计,那么模型精确度高出1%并没有实际用处。

  • 除非能够妥善处理(例如使用ridge或Lasso回归),否则在噪声、缺失值和脏数据的影响下会导致模型过度拟合及缺乏稳健性(使用例如梯度优化等技术的迭代算法)。

  • 逻辑回归的系数不容易解释。当你对决策者或者其他部门解释模型时,很少有人能够理解。

  • 最好的模型通常会将多种方法混合到一起,以便能尽可能多的获得/解释差异。在我作为数据科学家长达30年的职业生涯中,从未使用过纯逻辑回归,但我开发出了一项更加稳健且便于使用及编程的混合技术,结果也容易解读。它将“不纯的”逻辑回归和“不纯的”决策树混合在一起,效果十分显著,尤其是对于你的“不纯”数据评分时。详情请戳。

原文发布时间为:2018-05-29
本文作者:王梦泽、笪洁琼 、夏雅薇
本文来自云栖社区合作伙伴“ ”,了解相关信息可以关注“ ”。

转载地址:http://nawso.baihongyu.com/

你可能感兴趣的文章
我的友情链接
查看>>
Python 编程中常用的12种基础知识总结
查看>>
关于/.svn/源代码泄漏的问题
查看>>
Winetricks download
查看>>
编译型语言VS解释型语言
查看>>
Event handling for iOS - how hitTest:withEvent: and pointInside:withEvent: are related?
查看>>
Mybatis Generator 不识别主键
查看>>
Nginx 400 Bad Request | The plain HTTP request was sent to HTTPS port
查看>>
ftp指定本地用户访问的目录
查看>>
python 自定义模块的引用
查看>>
Zabbix 监控ESXi服务器【非虚拟机】CPU、内存、硬盘、网络带宽
查看>>
HTML5之SessionStorage本地存储
查看>>
error: cannot find javah找不到javah解决办法
查看>>
我的友情链接
查看>>
三种问题可能导致无线路由间歇断开网络
查看>>
MySQL的安装和使用
查看>>
lduan SCDPM 保护组与系统状态(五)
查看>>
我的友情链接
查看>>
docker command and docker file variables
查看>>
说说红黑树
查看>>