Multivariate-Statistics-Self-Learning

记录多元统计分析的数据、代码、结果。

目录

课程教材

《应用多元统计分析》, 高慧璇, 北京大学出版社.

配套资料:课程网站上有ppt、例题SAS代码和部分习题解答。

推荐阅读:

代码

平时作业

平时作业已全部上传到我的博客里 在这个页面:https://lucajiang.github.io/2020/11/27/Multivariate-Statistics-HW/

期末大作业

可以在此处围观大作业的pdf文件:https://lucajiang.github.io/2020/11/16/Kaggle-Mushroom-Dataset/

最后

很有意思的是, 2017级多元统计课程并没有选用这本书作为教材, 而是选用了Modern Multivariate Statistical Techniques– 一本介绍现代多元统计的英文书作为教材. 课程内容包括: 主成分分析 线性判别分析 决策树 聚类分析 支持向量机 集成学习等.

以及, 感谢star本项目的同学给我的支持. 欢迎大家顺手去逛逛我的个人博客.

大作业使用的模型包括: 主成分回归、线性判别分析、LASSO 回归、逐步回归、决策树(CART、C4.5、C5.0)、 随机森林、XGBoost、kNN、SVM 、NN、RIPPER 和 PART(两个类似决策树的模型,虽然很多教材都没涉及,但尤其适合我选择的数据集). 涉及了数据的探索性分析,预处理,建模等内容. 如果感兴趣, 可以看看.

附 Modern Multivariate Statistical Techniques 教材主页的网址: https://astro.temple.edu/~alan/MMST/