wangwengwu 发表于 2016-11-21 02:33:47

PostgreSQL中国用户会DBA2000培训计划北京第一课笔记

PostgreSQL及中国用户会简介
  主讲人 李元佳 galy
  原文地址:http://chenlinux.com/2012/03/17/postgreSQL-DBA-2000-note1/

数据库分类
  商业数据库: Oracle, DB2, SQLserver, Sybase… 开源数据库: MySQL, PostgreSQL, Firebird, SQLite, Apache Derby…

PostgreSQL沿革
  类BSD许可的,面向对象的,关系型数据库管理系统。
  MIT –> Ingres –> Postgres –> PostgreSQL ( 同源的还有SQLserver等 )
  支持SQL2008标准的大部分功能特性,是各种RDBMS的SQL方言中最贴近标准的。

PostgreSQL简介
  主讲人 萧少聪 Scott.Siu

用户与进程

  注意在上图中,不管是workmem还是sharebuffer,每个page都是8KB大小。

复制流程
  stream replica的流程如下:

client --> postgres --> WAL (not file)--> slave --> (return OK) --> master --> commit

  在master上的流程细节如下:

client --> write-ahead log(WAL) buffer --> commit --> (async/fsync~~160%) --> WAL Files (16MB * 132个)
^
|--> share buffer--> bgwriter --> db files
^                            |
|--      check point   <-- ## 安装

  linux: 注意使用独立的非root用户来安装启动pgsql。在version9.1后,可以跟SElinux结合使用,提高安全性。
win: 只能在NTFS文件系统上创建表空间。
窗口统一式安装,可以方便的安装stack builder套件。

目录
  默认使用窗口安装的情况下,目录结构如下:

/opt/PostgreSQL/9.1/
|
|--> bin/
|--> doc/
|--> include/
|--> lib/
|--> share/
|--> install/
|--> data/
|--> base/存放table和index的ID号
|--> global/
|--> pg_clog/运行日志
|--> pg_xlog/WAL日志
|--> pg_tblspc/表空间ID,实质为到真实数据目录的软连接
|--> postgresql.conf
|--> pg_hba.conf

创建


[*]使用bin/initdb命令;
[*]修改data/pg_hba.conf里的连接地址段和登录权限;
[*]修改data/postgresql.conf里的监听网卡。

启动与停止
  使用bin/pg_ctl命令。其停止命令可指定三种类型:


[*]smart模式,即等待全部client连接断开后停止;
[*]fast模式,即直接回滚全部尚未完成的事务后停止;
[*]immediate模式,即立刻中止全部进程。

配置说明


[*]
work_mem: 
并不是每个client连接的postgres进程分配一个work mem,而是SQL每一次的排序work使用一个work mem。包括join和order by。如果没有排序,就不用work mem。如果一条sql里同时使用了N次排序,那么就要使用N个work mem。所以理想的使用方法不是提供太大的work mem来排序,而是尽量缩小需要排序的数据大小,设置为4/8MB即可。 
该配置是可以online修改的。命令如下: 
SET work_mem = 2048; SET work_mem = ‘2MB’; 上面两条命令等价。可以看书其计量单位为1KB,且类型为字符串,所以在自定义计量时需要用引号。

[*]
share_buffers: 
理论上为机器物理内存的40%大小。实际测试显示大于8GB后,性能不会有相应的提升,即可认为最大设置到8GB。

[*]
temp_buffers: 
无修改意义

[*]
max_prepared_transactions: 
并发事务数

[*]
maintenance_work_mem: 
vacuum、create index、alter table add foreign key等管理命令使用的work_mem,建议设置1G。因为这些命令经常涉及全表扫描。


postgreSQL的数据集概念

                      DataBase Cluster
|
|---------|---------|
|         |         |
user   database   tablespace
|
schema

  这里的cluster不是HA cluster,而是数据集。
一个database里可以有多个schema,一个user可以有多个schema的管理权限,但一个schema只能归属于一个user。
默认有一个template0为schema的基础,不可修改,在template0基础上有template1,可以修改。实际创建schema时就是复制template1出来。 创建user时,一般都会再创建一个同名的schema,并规定该schema的所属人为该user。这样在pgsql连接到database后,其默认schema即为该同名schema。

备份与恢复

备份
  pg_dump命令,使用-s指定只备份数据结构,-t指定只备份数据内容。

基于时间点的备份恢复


[*]select pg_start_backup(‘FullBackup’);
[*]tar zcvf full_backup/week1.tgz /opt/PostgreSQL/9.1/data/
[*]
select pg_stop_backup();

[*]tar zxvf full_backup/week1.tgz -C /
[*]echo ‘restore_command=”cp %f %p”’ > data/recovery.conf
页: [1]
查看完整版本: PostgreSQL中国用户会DBA2000培训计划北京第一课笔记