这次实战的Kaggle比赛,其实只是其中一个没有奖金的公益比赛。
主页:/c/titanic-gettingStarted
主题是:
Titanic: Machine Learning from Disaster
在比赛之中,官方给出了一些原始的一半的数据作为比赛用的训练集与测试集。另外一半作为官方自己的测试集。最后成绩评定也是会使用官方自己留着的一半数据进行评比。
注意: 有一个取巧的方式,那就是去网上去搜索全部原始数据并依此为基础提交算法。 好吧,我用的是比这个笨的方法:)
在这里介绍一下,我比较擅长的是java,并且也希望使用java完成这次比赛。
如果希望使用Python,可以参考://09/05/a-complete-guide-to-getting-0-79903-in-kaggles-titanic-competition-with-python/
为了完成这次比赛,首先需要下载官方的数据集。
训练集用Excel打开之后的样子:
下面解释一下训练集之中的数据:
最后,在打开看了一下训练数据之后,第一反应就是使用决策树来实现预测功能。
下一篇文章将讲诉我是如何进行 数据预处理 的
如果觉得《[Kaggle实战] Titanic 逃生预测 (1) - 项目起步》对你有帮助,请点赞、收藏,并留下你的观点哦!