## 创建一个 Dataset

In [1]:
import tablib

data = tablib.Dataset(["100gle", "male", "author"])
print(data)

100gle|male|author


## 为 Dataset 设置字段名

In [2]:
data.headers = ("name", "gender", "job")
print(data)

name |gender|job 
------|------|------
100gle|male |author


In [3]:
data = tablib.Dataset(
 *[[1, 2, 3], [4, 5, 6]],
 headers=["a", "b", "c"],
)

print(data)

a|b|c
-|-|-
1|2|3
4|5|6


## 将数据添加进 Dataset 中

In [4]:
data = tablib.Dataset()
data.headers = ("name", "gender", "job")
data.append(["100gle", "male", "author"])
data.append(["100gle", "male", "programmer"])

print(data)

name |gender|job 
------|------|----------
100gle|male |author 
100gle|male |programmer


In [5]:
data.lpush(["Marry", "female", "artist"])
print(data)

name |gender|job 
------|------|----------
Marry |female|artist 
100gle|male |author 
100gle|male |programmer


In [6]:
data.append_col([1, 2, 3], header="tag")
print(data)

name |gender|job |tag
------|------|----------|---
Marry |female|artist |1 
100gle|male |author |2 
100gle|male |programmer|3 


In [7]:
data.lpush_col(["a", "b", "c"], header="id")
print(data)

id|name |gender|job |tag
--|------|------|----------|---
a |Marry |female|artist |1 
b |100gle|male |author |2 
c |100gle|male |programmer|3 


## 索引与删除 Dataset 数据

In [8]:
data["name"]

['Marry', '100gle', '100gle']

In [9]:
data.get_col(3)

['artist', 'author', 'programmer']

In [10]:
data[0]

('a', 'Marry', 'female', 'artist', 1)

In [11]:
data[1:]

[('b', '100gle', 'male', 'author', 2),
 ('c', '100gle', 'male', 'programmer', 3)]

In [12]:
data[-1]

('c', '100gle', 'male', 'programmer', 3)

In [13]:
del data[0]
print(data)

id|name |gender|job |tag
--|------|------|----------|---
b |100gle|male |author |2 
c |100gle|male |programmer|3 


In [14]:
del data["gender"]
print(data)

id|name |job |tag
--|------|----------|---
b |100gle|author |2 
c |100gle|programmer|3 


In [15]:
data.wipe()
print(data)




## 通过标签筛选数据

In [16]:
from uuid import uuid4

import tablib

blogs = tablib.Dataset(headers=["id", "title", "content", "create_at"])
records = [
 [
 (uuid4(), "URL Schema 的 1000 种使用方式", "如何使用 URL Schema...", "2022-09-06"),
 ["iOS", "Automatic"],
 ],
 [(uuid4(), "Python 基础快速入门", "快速入门 Python...", "2022-09-06"), ["Python", "Basic"]],
 [
 (uuid4(), "使用 Tablib 来完成数据表格操作", "有关 Tablib 的使用技巧...", "2022-10-01"),
 ["Python", "Python Library"],
 ],
 [
 (uuid4(), "使用 Django 从零打造一个博客系统", "Django 基础...", "2022-09-30"),
 ["Python", "Web", "Django", "Python Library"],
 ],
]

for record, tags in records:
 blogs.append(record, tags=tags)

print(blogs)

id |title |content |create_at 
------------------------------------|-----------------------|------------------|----------
f2097b2c-6d62-469a-a7ee-d44e53fc5458|URL Schema 的 1000 种使用方式|如何使用 URL Schema...|2022-09-06
2cb43639-a76f-4e9f-8e7f-d7c5809b5489|Python 基础快速入门 |快速入门 Python... |2022-09-06
9eca4106-6520-4b82-93fd-a273eaf0cb6f|使用 Tablib 来完成数据表格操作 |有关 Tablib 的使用技巧...|2022-10-01
cbcf0041-5198-47c7-84e5-e9a88bd09ecc|使用 Django 从零打造一个博客系统 |Django 基础... |2022-09-30


In [17]:
blogs.filter(["iOS"]).dict

[OrderedDict([('id', UUID('f2097b2c-6d62-469a-a7ee-d44e53fc5458')),
 ('title', 'URL Schema 的 1000 种使用方式'),
 ('content', '如何使用 URL Schema...'),
 ('create_at', '2022-09-06')])]

In [18]:
blogs.filter(["Python"]).dict

[OrderedDict([('id', UUID('2cb43639-a76f-4e9f-8e7f-d7c5809b5489')),
 ('title', 'Python 基础快速入门'),
 ('content', '快速入门 Python...'),
 ('create_at', '2022-09-06')]),
 OrderedDict([('id', UUID('9eca4106-6520-4b82-93fd-a273eaf0cb6f')),
 ('title', '使用 Tablib 来完成数据表格操作'),
 ('content', '有关 Tablib 的使用技巧...'),
 ('create_at', '2022-10-01')]),
 OrderedDict([('id', UUID('cbcf0041-5198-47c7-84e5-e9a88bd09ecc')),
 ('title', '使用 Django 从零打造一个博客系统'),
 ('content', 'Django 基础...'),
 ('create_at', '2022-09-30')])]

## 动态列

In [19]:
del blogs["id"]
print(blogs)

title |content |create_at 
-----------------------|------------------|----------
URL Schema 的 1000 种使用方式|如何使用 URL Schema...|2022-09-06
Python 基础快速入门 |快速入门 Python... |2022-09-06
使用 Tablib 来完成数据表格操作 |有关 Tablib 的使用技巧...|2022-10-01
使用 Django 从零打造一个博客系统 |Django 基础... |2022-09-30


In [20]:
def uid(row):
 return uuid4()

blogs.append_col(uid, header="uid")
print(blogs)

title |content |create_at |uid 
-----------------------|------------------|----------|------------------------------------
URL Schema 的 1000 种使用方式|如何使用 URL Schema...|2022-09-06|140f7af0-63fc-43b9-847b-666c76075cfb
Python 基础快速入门 |快速入门 Python... |2022-09-06|5ec020fd-6a10-4c4b-935c-19220f642b92
使用 Tablib 来完成数据表格操作 |有关 Tablib 的使用技巧...|2022-10-01|6c3f75f6-a9f0-490e-9725-de7ec2712323
使用 Django 从零打造一个博客系统 |Django 基础... |2022-09-30|d5e9c8ac-3d8e-4c98-be5f-d9ba4182cecf


In [21]:
from datetime import datetime

def month(row):
 date_str = row[2]
 date = datetime.strptime(date_str, "%Y-%m-%d")
 return date.month


blogs.append_col(month, header="month")
print(blogs)

title |content |create_at |uid |month
-----------------------|------------------|----------|------------------------------------|-----
URL Schema 的 1000 种使用方式|如何使用 URL Schema...|2022-09-06|140f7af0-63fc-43b9-847b-666c76075cfb|9 
Python 基础快速入门 |快速入门 Python... |2022-09-06|5ec020fd-6a10-4c4b-935c-19220f642b92|9 
使用 Tablib 来完成数据表格操作 |有关 Tablib 的使用技巧...|2022-10-01|6c3f75f6-a9f0-490e-9725-de7ec2712323|10 
使用 Django 从零打造一个博客系统 |Django 基础... |2022-09-30|d5e9c8ac-3d8e-4c98-be5f-d9ba4182cecf|9 


## 读取数据并转换成 Dataset

In [22]:
import tablib

csv = """\
id,name,email
1,100gle,100gle@example.com
2,Steve,steve@example.com
3,Harry,harry@exmaple.com
"""

data = tablib.Dataset().load(csv)
print(data)

id|name |email 
--|------|------------------
1 |100gle|100gle@example.com
2 |Steve |steve@example.com 
3 |Harry |harry@exmaple.com 


In [23]:
json = """\
[
 {
 "id": 1,
 "name": "100gle",
 "email": "100gle@example.com"
 },
 {
 "id": 2,
 "name": "Steve",
 "email": "steve@example.com"
 },
 {
 "id": 3,
 "name": "Harry",
 "email": "harry@example.com"
 }
]
"""

data = tablib.Dataset().load(json, format="json")
print(data)

id|name |email 
--|------|------------------
1 |100gle|100gle@example.com
2 |Steve |steve@example.com 
3 |Harry |harry@example.com 


## 将 Dataset 数据导出

In [24]:
data.dict

[OrderedDict([('id', 1), ('name', '100gle'), ('email', '100gle@example.com')]),
 OrderedDict([('id', 2), ('name', 'Steve'), ('email', 'steve@example.com')]),
 OrderedDict([('id', 3), ('name', 'Harry'), ('email', 'harry@example.com')])]

In [25]:
data.json

'[{"id": 1, "name": "100gle", "email": "100gle@example.com"}, {"id": 2, "name": "Steve", "email": "steve@example.com"}, {"id": 3, "name": "Harry", "email": "harry@example.com"}]'

In [26]:
data.yaml

'- {email: 100gle@example.com, id: 1, name: 100gle}\n- {email: steve@example.com, id: 2, name: Steve}\n- {email: harry@example.com, id: 3, name: Harry}\n'

In [27]:
data.cli

' id name email\n 1 100gle 100gle@example.com\n 2 Steve steve@example.com\n 3 Harry harry@example.com'

In [28]:
print(data.export("cli", tablefmt="grid"))

+------+--------+--------------------+
| id | name | email |
| 1 | 100gle | 100gle@example.com |
+------+--------+--------------------+
| 2 | Steve | steve@example.com |
+------+--------+--------------------+
| 3 | Harry | harry@example.com |
+------+--------+--------------------+


In [29]:
print(data.export("cli", tablefmt="fancy_grid"))

╒══════╤════════╤════════════════════╕
│ id │ name │ email │
╞══════╪════════╪════════════════════╡
│ 1 │ 100gle │ 100gle@example.com │
├──────┼────────┼────────────────────┤
│ 2 │ Steve │ steve@example.com │
├──────┼────────┼────────────────────┤
│ 3 │ Harry │ harry@example.com │
╘══════╧════════╧════════════════════╛


In [30]:
print(data.export("jira"))

||id||name||email||
|1|100gle|100gle@example.com|
|2|Steve|steve@example.com|
|3|Harry|harry@example.com|
