在进行评估规划集群存储容量方面有一个问题,就是压缩率。如果我的数据存储在.txt格式文件中,100G的数据数据量,如果存储在巨杉数据库,会占用多大的磁盘空间?
数据压缩是对普通记录才起作用的。关于压缩的的情况,可以参考 createCL() 函数( http://doc.sequoiadb.com/cn/index-cat_id-1432190821-edition_id-304) ,搜索“压缩算法选择策略” 查看相关详情。
如果你这100G数据不是普通记录,而是一些非结构化数据,比如图片、视频,那么建议使用lob来存储。而使用lob存储,数据是不压缩的。在这种需要使用Lob存储的情况下,为了节省磁盘空间,我们建议在createCS的时候,指定lobPageSize 为 16K 比较合适(该值默认为256K)。
如还有其它问题,请继续留言。谢谢。
使用lzw压缩算法时,压缩比例直接跟数据的重复度相关,经验中压缩比在10%~70%都有,数据重复度高,压缩效果就更好。