什么是 PostgreSQL?
PostgreSQL 是一种现代的数据库管理系统。它经常被用来存储和操作与网站和应用程序相关的信息。
与任何有价值的数据一样,实施备份方案以防止数据丢失是非常重要的。本指南将涵盖一些实用的方法,可以用来备份您的 PostgreSQL 数据。
我们将使用一个安装了 PostgreSQL 9.1 的 Ubuntu 12.04 VPS。大多数现代发行版和最近的 PostgreSQL 版本都会以类似的方式运行。
如何使用 pg_dump 备份 PostgreSQL 数据库
PostgreSQL 包含一个名为 “pg_dump” 的实用程序,可以用于将数据库信息转储到文件以备份目的。
pg_dump 实用程序是从 Linux 命令行运行的。命令的基本语法是:
pg_dump <span class="highlight">数据库名称</span> > <span class="highlight">备份文件名称</span>
该命令必须由具有读取所有数据库信息权限的用户运行,因此大多数情况下会以超级用户身份运行。
举个实际的例子,我们可以登录到 “postgres” 用户,并在默认数据库 “postgres” 上执行该命令:
sudo su - postgrespg_dump postgres > postgres_db.bak
该命令实际上是一个 PostgreSQL 客户端程序,因此只要该系统可以访问数据库,就可以从远程系统运行。
如果您希望备份远程系统,可以传递 “-h” 标志来指定远程主机,以及 “-p” 标志来指定远程端口:
pg_dump -h <span class="highlight">远程主机</span> -p <span class="highlight">远程端口 数据库名称</span> > <span class="highlight">备份文件名称</span>
如果需要,您还可以使用 “-U” 选项指定不同的用户。语法将是:
pg_dump -U <span class="highlight">用户名</span> -h <span class="highlight">远程主机</span> -p <span class="highlight">远程端口 数据库名称</span> > <span class="highlight">备份文件名称</span>
请记住,pg_dump 与任何其他客户端程序一样,都需要相同的身份验证要求。这意味着您必须确保您的登录凭据对您尝试备份的系统是有效的。
如何使用 PostgreSQL 恢复 pg_dump 的数据转储
要恢复由 pg_dump 创建的备份,您可以将文件重定向到 psql 标准输入:
psql <span class="highlight">空数据库</span> < <span class="highlight">备份文件</span>
注意:此重定向操作不会创建相关的数据库。这必须在运行命令之前单独完成。
例如,我们可以创建一个名为 “restored_database” 的新数据库,然后通过执行以下命令重定向名为 “database.bak” 的转储:
createdb -T template0 restored_databasepsql restored_database < database.bak
应该使用 “template0” 作为基础创建空数据库。
为了正确恢复,还必须执行另一个步骤,即重新创建在数据库中拥有或具有授予权限的用户。
例如,如果您的数据库有一个由用户 “test_user” 拥有的表,您必须在导入之前在恢复系统上创建它:
createuser test_userpsql restored_database < database.bak
处理恢复错误
默认情况下,PostgreSQL 会尝试继续恢复数据库,即使在途中遇到错误。
在许多情况下,出于明显的原因,这是不希望的。试图弄清楚需要执行哪些操作才能将数据库恢复到正确状态可能会很痛苦。
我们可以告诉 PostgreSQL 遇到任何错误时立即停止,方法是输入:
psql --set ON_ERROR_STOP=on <span class="highlight">恢复的数据库</span> < <span class="highlight">备份文件</span>
这将导致 PostgreSQL 恢复操作在遇到错误时立即停止。
这仍会使您得到一个未完全恢复的残缺数据库,但现在您可以在出现错误时处理它们,而不是在最后处理错误列表。
在许多情况下,更好的选择可能是 “-1”(数字一)或 “–single-transaction” 选项:
psql -1 <span class="highlight">恢复的数据库</span> < <span class="highlight">备份文件</span>
此选项在单个事务中执行所有恢复细节。
该选项与 “ON_ERROR_STOP” 设置的区别在于,这要么完全成功,要么不导入任何内容。
对于较大的恢复来说,这可能是一个昂贵的权衡,但在许多情况下,不留下部分恢复的数据库的好处远远超过了成本。
如何备份和恢复 PostgreSQL 中的所有数据库
为了节省时间,如果您想备份系统中的所有数据库,有一个名为 “pg_dumpall” 的实用程序。
该命令的语法与常规 pg_dump 命令非常相似,但它不指定数据库。相反,该命令备份所有可用的数据库:
pg_dumpall > <span class="highlight">备份文件</span>
您可以通过将文件传递给 psql,并使用默认数据库来恢复数据库:
psql -f <span class="highlight">备份文件</span> postgres
结论
备份是任何数据存储计划中必不可少的组成部分。幸运的是,PostgreSQL 为您提供了必要的工具来有效地备份您的重要信息。
与任何备份一样,定期测试您的备份以确保创建的副本可以正确恢复是非常重要的。您创建的备份只有在实际上可以用来恢复系统时才有用。