Files

21 lines
1.4 KiB
Markdown
Raw Permalink Blame History

This file contains ambiguous Unicode characters
This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.
# 数据说明
项目介绍及数据来源见 Kaggle[Spaceship Titanic](https://www.kaggle.com/competitions/spaceship-titanic/overview)。
数据详情:
- `data.csv` 训练集样本量约为 8700 人;
- 数据字段详情:
- 数据字段共有 14 个;
- 字段详情:
- `PassengerId`:每个乘客的唯一标识。其形式为 `gggg_pp`,其中 `gggg` 表示乘客一同乘坐的团体,`pp` 是他们在团体中的编号。团体中的个人通常是家庭成员,**但这也不是绝对的**
- `HomePlanet`:乘客所离开的星球,通常是他们永久居住的星球;
- `CryoSleep`:表示乘客是否选择在航行期间进入深度睡眠,处于深度睡眠状态的乘客被限制在他们坐在的船舱内;
- `Cabin`:乘客所住的船舱及座位号,采取 `甲板/编号/侧面` 的形式编号,其中侧面的 P 代表左舷船身左半边S 代表右舷(船身右半边);
- `Destination`:乘客此次航行的目的地;
- `Age`:乘客的年龄;
- `VIP`:乘客是否为 VIP
- `RoomService``FoodCourt``ShoppingMall``Spa``VRDeck`:即乘客在太空船的众多豪华设施项中的**花销金额**
- `Name`:乘客的名字和姓氏;
- `Transported`:乘客是否被运送到另一个空间,**这也是训练集的参考答案以及需要在测试集中预测的结果**。