IT人告诉你【泰坦尼克号】上哪类人更易活下来?

《泰坦尼克号》都知道,杰克和露丝的爱情,既美好又悲伤,在看电影的时候,不知你是否想过这样一个问题:在【泰坦尼克号】沉船事故中,什么样的人更容易生存下来呢?

作为一名程序员,我们可以通过数据来预测船员和乘客的生还状况。

实验楼上有一门课程:【利用随机森林算法预测 Titanic 乘客生还概率】,就是教你利用机器学习的方法来预测泰坦尼克号上的乘客生还概率。

如果你对机器学习感兴趣,那么推荐这个项目课程,该课程将解决分类中的 2 分类任务,即类别只有正反两类(生还或死亡)。课程包括数据清洗及可视化、模型训练及评估,以及随机森林分类器调参等内容。

课程内容:

该课程共分为3个实验,具体如下:

1、数据清洗及可视化

实验内容:

数据清洗是数据分析中非常重要的一部分,也最繁琐,做好这一步需要大量的经验和耐心。这门课程中,我将和大家一起,一步步完成这项工作。该实验学习数据清洗的基本思路以及具体操作,同时,练习使用 Pandas 数据分析工具、Seaborn 统计分析可视化工具。

实验知识点:

  • 离群点分析
  • 缺失值处理
  • 偏态分布数据处理

2、分类模型训练及评价

实验内容:

实验将评估不同模型的测试精度以及过拟合问题。学习器没有最好,只有适不适合,模型评估和性能度量的重要性可想而知。该实验的重点在模型评估的实现过程,对分类算法不了解的不用担心,在下一个实验中,我们将对算法以及进行深入学习。

实验知识点:

  • 交叉验证法
  • 过拟合
  • 学习曲线

3、随机森林分类器参数调节

实验内容:

该实验学习集成学习的随机森林算法,参数调节,并解决上一节实验当中遇到的过拟合问题。我们将继续使用 Python sklean 机器学习工具。

实验知识点:

  • 决策树
  • 集成学习
  • 随机森林算法
  • 参数调节

最后

如果你想知道【泰坦尼克号】上哪类人更易活下来,亦或者对机器学习感兴趣,那么点击【利用随机森林算法预测 Titanic 乘客生还概率】即可开始学习,通过自己的学习,通过数据来评估出哪类人更容易生存下来。

  • 如果你对机器学习感兴趣,你也可以点击【机器学习工程师】学习路径,带你通过大量的实战操作掌握机器学习。

推荐阅读更多精彩内容