21 lines
1.4 KiB
Markdown
21 lines
1.4 KiB
Markdown
# 数据说明
|
||
|
||
项目介绍及数据来源见 Kaggle:[Spaceship Titanic](https://www.kaggle.com/competitions/spaceship-titanic/overview)。
|
||
|
||
数据详情:
|
||
|
||
- `data.csv` 训练集样本量约为 8700 人;
|
||
- 数据字段详情:
|
||
- 数据字段共有 14 个;
|
||
- 字段详情:
|
||
- `PassengerId`:每个乘客的唯一标识。其形式为 `gggg_pp`,其中 `gggg` 表示乘客一同乘坐的团体,`pp` 是他们在团体中的编号。团体中的个人通常是家庭成员,**但这也不是绝对的**;
|
||
- `HomePlanet`:乘客所离开的星球,通常是他们永久居住的星球;
|
||
- `CryoSleep`:表示乘客是否选择在航行期间进入深度睡眠,处于深度睡眠状态的乘客被限制在他们坐在的船舱内;
|
||
- `Cabin`:乘客所住的船舱及座位号,采取 `甲板/编号/侧面` 的形式编号,其中侧面的 P 代表左舷(船身左半边),S 代表右舷(船身右半边);
|
||
- `Destination`:乘客此次航行的目的地;
|
||
- `Age`:乘客的年龄;
|
||
- `VIP`:乘客是否为 VIP;
|
||
- `RoomService`,`FoodCourt`,`ShoppingMall`,`Spa`,`VRDeck`:即乘客在太空船的众多豪华设施项中的**花销金额**;
|
||
- `Name`:乘客的名字和姓氏;
|
||
- `Transported`:乘客是否被运送到另一个空间,**这也是训练集的参考答案以及需要在测试集中预测的结果**。
|