设为首页 收藏本站
查看: 812|回复: 0

[经验分享] MySQL开源引擎infobright数据仓库解决方案

[复制链接]

尚未签到

发表于 2017-10-23 17:14:40 | 显示全部楼层 |阅读模式
infobright是开源的MySQL数据仓库解决方案,它基于在MySQL上二次开发,infobright主要实现的就是一个存储引擎,但因为它自身存储逻辑跟关系型数据库根本不同,所以,它不能像InnoDB那样直接作为插件挂接到mysql,它的逻辑层是mysql的逻辑 层加上它自身的优化器。  infobright有以下几个特点:
1、高强度的数据压缩在普通10:1, 在极限情况下可以达到40:1 甚至更高,自己在使用infobright过程中曾把5.1G的数据可以压缩成152M左右;

2、优化的统计计算(使用sum/avg/group by/count等),特别适用于统计函数生成的报表数据;

3、不需要建索引,就避免了维护索引及索引随着数据膨胀的问题。把每列数据分块压缩存放,每块有知识网格节点记录块内的统计信息,代替索引,加速搜索;
4、列式存储,在没有索引的情况下同理也没有主键、自动递增字段、无符号。

  infobright产品分为社区版ICE和企业版IEE,其使用的引擎是BRIGHTHOUSE,在使用IEE版本是没有限制的,但是使用ICE版本则有3个限制:
1、不支持数据更新,因此在导入数据的时候只能用“LOAD DATA INFILE”的方式导入数据,此外一旦入库后就不能在仓库中用UPDATE、INSERT等方式写入;
2、不支持对CPU多核的使用,使得性能极低,要知道入数据仓库的数据都是极大的数据,没有多核支持查询大量的数据极慢;
3、只能单机使用,不具备任何的复制以及扩展,这样就限制了大规模集群的可能性。
所以日常使用建议还是使用IEE版本,而infobright的安装部署也十分简单可以在官网下载rpm包来进行安装部署,可以把安装过的服务器上把文件打包后直接解压后修改参数部署,其配置文件my-ib.cnf可以事先写好,如果在安装后需要重新修改参数可以使用内置的postconfig.sh脚本修改默认参数,默认的配置文件在support-files中

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
[iyunv@localhost local]# cd /usr/local/infobright/
[iyunv@localhost infobright]# chmod +x ./*.sh && chmod +x bin/* && chmod +x scripts/mysql_install_db
[iyunv@localhost infobright]# cp support-files/mysql.server /etc/init.d/mysqld-ib
[iyunv@localhost infobright]# chmod +x /etc/init.d/mysqld-ib
[iyunv@localhost infobright]# cp support-files/my-ib.cnf.in /etc/my-ib.cnf#其中参数变量需要修改
…略…
[client]
…略…
default_character_set=utf8
…略…
[mysqld]
user        = root#也可以用mysql用户
port            = 5029
socket          = /tmp/mysql-ib.sock
basedir = /usr/local/infobright
datadir = /data/infobright_data
log-error = /data/infobright_data/localhost.err
…略…
default_character_set=utf8
collation_server=utf8_general_ci
character_set_server=utf8
[iyunv@localhost infobright]# vim /etc/profile.d/infobright.sh#在没有MySQL的服务器上添加环境变量
export PATH=$PATH:/usr/local/infobright/bin
[iyunv@localhost infobright]# source /etc/profile.d/infobright.sh
[iyunv@localhost infobright]# ./scripts/mysql_install_db --force --defaults-file=/etc/my-ib.cnf --datadir=/data/infobright_data --user=root
[iyunv@localhost infobright]# cd /data/infobright_data/
[iyunv@localhost infobright_data]# vim brighthouse.ini#修改BRIGHTHOUSE引擎参数
################## BrightHouse configuration file ####################
# To change values, uncomment the parameter and specify desired value.

############ Critical Disk Settings ############

# Data Folder: check where you installed brighthouse data folder (directory this file is in) - it should be on a fast disk.

# CacheFolder - a place in which temporary database objects (memory cache) are stored.
# Should be on a fast drive, possibly not the same as data. Allow at least 20 GB of free space (depending on database size).
CacheFolder = /data/infobright_data/cache

############  Critical Memory Settings ############
# System Memory    Server Main Heap Size     Server Compressed Heap Size   Loader Main Heap Size
# 32GB                 24000                      4000                       800
# 16GB                 10000                      1000                       800
#  8GB                  4000                       500                       800
#  4GB                  1300                       400                       400
#  2GB                  600                        250                       320

# The default values are set to 600, 250, and 320 respectively, and performance may be  impacted.

# ServerMainHeapSize - Size of the main memory heap in the server process, in MB
ServerMainHeapSize = 4000

# LoaderMainHeapSize - Size of the memory heap in the loader process, in MB.
LoaderMainHeapSize = 800

############ Logging Settings ############

# ControlMessages - Set to 2 to turn the control messages on. This is usually needed by Infobright to support performance investigation.
# ControlMessages = 0

############  Other Settings ############

# KNFolder - Directory where the Knowledge Grid is stored.
KNFolder = BH_RSI_Repository

# AllowMySQLQueryPath can be set to 0 to disable MySQL Query path or 1 to enable it.
AllowMySQLQueryPath = 1
[iyunv@localhost infobright_data]# /etc/init.d/mysqld-ib start
[iyunv@localhost infobright_data]# mysql -S /tmp/mysql-ib.sock -p



在这里需要注意的是修改BRIGHTHOUSE参数时重要的参数如下:
1
2
3
4
5
6
CacheFolder 临时数据目录,用于缓存处理查询的中间结果集,与Datadir相异为宜,可用空间大于20G
ServerCompressedHeapSize 服务进程的压缩堆栈空间,存放压缩数据
LoaderMainHeapSize Bhloader数据导入缓冲区,随目标表的列数增加而调整,loader进程的堆栈空间,一般最大不超过800M
ControlMessages 控制盒查询日志的信息量级别(1-3之间)
KNFolder 知识网络目录,默认在datadir目录下
AllowMySQLQueryPath 是否支持Mysql原生的SQL查询,支持修改为1,否则0



8f7ab2b336b88b049de95c8732293b2a.png-wh_500x0-wm_3-wmp_4-s_204123840.png 4b2bda455b8b044733a647f155a1c64a.png-wh_500x0-wm_3-wmp_4-s_4244572167.png
最后在infobright尽可能使用的数据类型:TINYINT,SMALLINT,MEDIUMINT,INT,BIGINT,DECIMAL(尽量减少小数点位数),DATE ,TIME,而效率比较低的、不推荐使用的数据类型有:BINARY VARBINARY,FLOAT,DOUBLE,VARCHAR,TINYTEXT TEXT,在infobright要把数据导出成sql脚本则需要使用mysqldump的“--single-transaction”参数使用单事务的方式导出,及事务的REPEATABLE READ隔离模式

运维网声明 1、欢迎大家加入本站运维交流群:群②:261659950 群⑤:202807635 群⑦870801961 群⑧679858003
2、本站所有主题由该帖子作者发表,该帖子作者与运维网享有帖子相关版权
3、所有作品的著作权均归原作者享有,请您和我们一样尊重他人的著作权等合法权益。如果您对作品感到满意,请购买正版
4、禁止制作、复制、发布和传播具有反动、淫秽、色情、暴力、凶杀等内容的信息,一经发现立即删除。若您因此触犯法律,一切后果自负,我们对此不承担任何责任
5、所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其内容的准确性、可靠性、正当性、安全性、合法性等负责,亦不承担任何法律责任
6、所有作品仅供您个人学习、研究或欣赏,不得用于商业或者其他用途,否则,一切后果均由您自己承担,我们对此不承担任何法律责任
7、如涉及侵犯版权等问题,请您及时通知我们,我们将立即采取措施予以解决
8、联系人Email:admin@iyunv.com 网址:www.yunweiku.com

所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其承担任何法律责任,如涉及侵犯版权等问题,请您及时通知我们,我们将立即处理,联系人Email:kefu@iyunv.com,QQ:1061981298 本贴地址:https://www.iyunv.com/thread-405780-1-1.html 上篇帖子: 老男孩MySQL数据库19部视频全 下篇帖子: MySQL双主双活+Keepalived高可用方案关建配置点
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

扫码加入运维网微信交流群X

扫码加入运维网微信交流群

扫描二维码加入运维网微信交流群,最新一手资源尽在官方微信交流群!快快加入我们吧...

扫描微信二维码查看详情

客服E-mail:kefu@iyunv.com 客服QQ:1061981298


QQ群⑦:运维网交流群⑦ QQ群⑧:运维网交流群⑧ k8s群:运维网kubernetes交流群


提醒:禁止发布任何违反国家法律、法规的言论与图片等内容;本站内容均来自个人观点与网络等信息,非本站认同之观点.


本站大部分资源是网友从网上搜集分享而来,其版权均归原作者及其网站所有,我们尊重他人的合法权益,如有内容侵犯您的合法权益,请及时与我们联系进行核实删除!



合作伙伴: 青云cloud

快速回复 返回顶部 返回列表