# Bonus 括号里的分值为最高得分(分数为期末总分),最终得分由 code review 确定。另请注意,总分值不能超过 1 分。 ## B+ 树相关 ### 缓存 *(0.2%)* 如果将一些常用数据存在内存中,可以省去大量从外存上读取的时间,这就是缓存的意义。 此 bonus 根据实现难度和工作量给分。推荐使用 [LRU 算法](https://en.wikipedia.org/wiki/Cache_replacement_policies#Least_recently_used_(LRU))。 关于正确性,你需要用开启缓存的程序通过 OJ 测试。 **注意:** 不允许把全部数据储存在内存中。 ### 空间回收 *(0.1%)* 在删除 B+ 树中某些数据后,可能会产生一些空间碎片。此 bonus 要求实现空间回收功能,使得删除数据后,B+ 树可以在下次需要空间时利用这些空间。 关于正确性,你需要用开启空间回收的程序通过 OJ 测试。 ### 并发 *(1%)* 对于一个强大的数据库系统来说,并发功能是非常重要的。在本任务中,你需要实现 B+ 树的并发功能。 从 Wikipedia 上可以找到对于并发的定义: > In computer science, concurrency is the ability of different parts or units of a program, algorithm, or problem to be executed out-of-order or in partial order, without affecting the final outcome. 此 bonus 仅是对于 B+ 树的要求,如果感兴趣,你也可以让你的主体支持高并发操作。此 bonus 无需通过 OJ 测试,但会在 code review 时检查正确性。 **注意:** 准备尝试此任务的同学请务必与助教联系并讨论自己的实现思路。 ### 快照 *(0.8%)* 对于一个强大的数据库系统来说,支持快照与恢复功能是非常重要的。在本任务中,你需要实现一个快照系统,实现任意快照间的切换。 一个快照几乎不会占用额外存储空间: - 在一个状态上创建一个快照,应该只会占用很小的额外存储来记录这个快照本身的信息,不会将快照的内容完全复制一遍; - 在同样的内容上创建 100 个快照,应该只会占用很小的额外存储,不会使磁盘占用增加 100 倍; - 在创建快照之后改动一小部分内容,再创建一个快照,也应该只会占用很小的额外存储,不会使磁盘占用增加一倍。 要做到这点,可以利用 [Copy-on-write](https://en.wikipedia.org/wiki/Copy-on-write) 的做法。简单来说,就是令所有块都是不可变的,在试图修改一个块的时候,对这个块做复制,然后在复制出的新块上做修改。但是如果在不快照的时候也对这些块做 copy-on-write 的话,每修改一次数据,就会增加一个新块,这是不可接受的。因此,你需要只在快照的时候做 copy-on-write。 你需要实现以下接口:(以下内容中 `SnapshotID` 为快照 ID,是一个最大长度为 16 的字符串,字符只包含大小写英文字母和数字) - **创建快照** (create) - 在当前状态上创建一个快照,名称为 `SnapshotID`。 - 如果 `SnapshotID` 已经存在,则不做任何事并抛出异常。 - **还原快照** (restore) - 还原到名称为 `SnapshotID` 的快照状态。 - 如果 `SnapshotID` 不存在,则不做任何事并抛出异常。 - 还原快照并不会影响任何快照的状态。它不会使被还原到的快照失效,也不会使其他快照失效。 - **删除快照** (delete) - 删除名称为 `SnapshotID` 的快照状态,不改变当前状态。 - 其占用的存储空间也需一并释放; - 如果 `SnapshotID` 不存在,则不做任何事并抛出异常。 **注意:** 准备尝试此任务的同学请务必与助教联系并讨论自己的实现思路。 ### 容错 *(1%)* 程序执行时,我们可能会遇到突然断电等意外情况,导致操作中断。如果此时恰好在对磁盘进行读写操作,那么原本的文件系统就会被破坏,从而造成数据损坏的情况。 在 Unix 中常用的文件系统中,删除一个文件可以分为 3 步: 1. 删除访问的 entry 指针 2. 释放对应的 index node 3. 归还对应的磁盘空间 如果操作发生中断,一个常见的恢复方式是从第一条输入指令开始,重新执行一整轮操作,但是时间成本显然难以接受。 因此,我们可以实现一个 journaling file system,利用日志来恢复文件,保证文件的数据不被损坏。 我们可以考虑把一个指令分为多个 **原子操作** (atomic operation),在 journal 中保存每个原子操作。当程序中断时,我们就可以知道保存了哪些原子操作,进而进行文件恢复。 **Hint**:请思考一下在不同步骤发生中断时,应该如何选取合适的原子操作,并通过原子操作来恢复文件。 [reference link](https://en.wikipedia.org/wiki/Journaling_file_system) ## 管理系统 ### GUI 前端 *(0.9%)* 提供一个用户友好的图形化前端(Qt、Gtk、Web、Tcl/Tk 等均可)。基本要求为: - 前后端分离,即前端代码不过度侵入主体逻辑; - 用户能通过用户友好的图形化界面完成**所有**操作; - 提供完整的《系统安装手册》; - (可选)提供更方便的操作,如查询后提供一键订票等。 **注意:** 准备尝试此任务的同学请务必与助教联系并讨论自己的实现思路。 关于用户友好,这里有一些具体的要求: - 查询车票后可以直接点击购票; - 尽可能减少用户需要输入的内容; - 除了对于普通用户友好,对于工作人员也要有友好的操作界面; 对于使用 Web 方式完成的前端(包括使用Vue、React、Bootstrap、Electron 等框架),需要满足以下要求: - 在不同电脑上应该可以同时运行多个前端(网页)并连接到同一后端(服务器),不会相互干扰,模拟现实情况下多用户场景; - Web服务崩溃不能影响后端数据服务的正常运行; - 设计合理的方式来关闭或重启Web前端服务器或后端数据服务器,而不是手动 kill 进程或者 Ctrl+C,并保证处理完成已接收到的指令,完成数据的保存。可以参考 `nginx -s restart`。 - ~~不得使用 TesutoHime 作为模板~~ ### 守护进程 *(0.1%)* 完成此任务需要先完成前置任务 GUI前端。 对于服务器来说,保证服务的稳定性是非常重要的。 在现代的linux系统中,可以很容易地使用 systemd 等工具来管理服务,完成开机自动启动、崩溃自动重启、定时执行等任务。 在本任务中,你需要通过两个途径实现下面的几个功能: - 在同一个数据目录下,能且仅能运行一个程序实例; - 当程序崩溃时,能自动重启; - 接受信号,如 `SIGTERM` 时,能够优雅关闭当前的程序实例。 途径分别是: 1. 在现代的linux中,已经有一些工具(发行版相关)为我们提供了相关功能,如 systemd。为你的程序编写 systemd service 文件,完成上面的功能。你也可以考虑使用其他的工具。 2. 手动实现一个简单的守护进程。参考 `fork` 等系统调用。