mongodb支持多大数据量,MogDB大对象LargeObject存取测试

 2023-09-22 阅读 17 评论 0

摘要:openGauss/MogDB数据库里bytea二进制类型受segment size编译参数限制,默认不能超过1GB,如果字段存储数据超过1GB可以使用lo(Large Object)扩展类型。01lo类型需要先创建lo extension$ gsql -p5432 -Uomm postgres -r gsql ((MogDB 2.0.1 build f

7ae269ffa0b2b191f551a510e865a283.gif

openGauss/MogDB数据库里bytea二进制类型受segment size编译参数限制,默认不能超过1GB,如果字段存储数据超过1GB可以使用lo(Large Object)扩展类型。

01

lo类型需要先创建lo extension

$ gsql -p5432 -Uomm postgres -r
gsql ((MogDB 2.0.1 build f892ccb7) compiled at 2021-07-09 16:15:21 commit 0 last mr  )
Non-SSL connection (SSL connection is recommended when requiring high-security)
Type "help" for help.postgres=# create extension lo;
CREATE EXTENSION

创建完lo扩展,我们新建test_lo表,info字段使用lo类型。

postgres=# create table test_lo(id int,info lo);
CREATE TABLE

创建test_lo表管理触发器,对update和delete操作使用lo_manage函数管理,不然会产生孤立大对象。

postgres=# create trigger test_lo before UPDATE OR DELETE ON test_lo FOR EACH ROW EXECUTE procedure lo_manage(info);
WARNING:  Trigger function with non-plpgsql type is not recommended.
DETAIL:  Non-plpgsql trigger function are not shippable by default.
HINT:  Unshippable trigger may lead to bad performance.
CREATE TRIGGER

使用dd生成2GB文件:

postgres=#  \! dd if=/dev/zero of=test_lo bs=1M count=2048 && sync
记录了2048+0 的读入
记录了2048+0 的写出
2147483648字节(2.1 GB,2.0 GiB)已复制,0.805435 s,2.7 GB/s

02

测试lo_import函数导入数据到数据表

postgres=# insert into test_lo values(1,lo_import('/home/omm/test_lo'));
INSERT 0 1

可以看到数据可以正常导入,如果不使用lo类型,使用bytea类型会提示下面的报错。

ERROR:  requested length too large

03

mongodb支持多大数据量,测试lo_export函数导出数据表数据到文件

postgres=# select lo_export(test_lo.info,'/home/omm/test_ext_lo') from test_lo where id=1;lo_export 
-----------1
(1 row)

可以看到数据正常导出。

查看导入导出的数据文件,也可以使用diff命令进行比对。

postgres=# \! ls -lh test_*
-rw-r--r-- 1 omm dbgrp 2.0G 12月 17 13:00 test_ext_lo
-rw------- 1 omm dbgrp 2.0G 12月 17 12:58 test_lo

04

查看数据表大对象字段大小

分两步进行,首先查大对象字段的oid(lo类型字段在用户表里面只存储一个oid引用指针,并不实际存数据)

postgres=# select * from test_lo;id | info  
----+-------1 | 16392
(1 row)

实际数据使用多条bytea记录存储在pg_largeobject表,可以根据oid查询统计字段的大小。

postgres=# select loid,pg_size_pretty(sum(octet_length(data)))
from pg_largeobject 
where loid =16392  
group by loid;loid  | pg_size_pretty 
-------+----------------16392 | 2048 MB
(1 row)

也可以使用如下函数来查询:

create or replace function get_lo_size(oid)
returns bigint
volatile strict
as $function$
declarefd integer;sz bigint;
beginfd := lo_open($1, x'40000'::int);perform lo_lseek64(fd, 0, 2);sz := lo_tell64(fd);perform lo_close(fd);return sz;
end;
$function$ language plpgsql;

查询结果如下:

postgres=# select pg_size_pretty(get_lo_size(16392));pg_size_pretty 
----------------2048 MB
(1 row)

再来测试JDBC应用层的使用:

05

JDBC-Java文件入库

public static void main(String[] args) throws Exception{ Class.forName("org.postgresql.Driver");Connection conn = DriverManager.getConnection("jdbc:postgresql://ip:port/dbname","username","password");conn.setAutoCommit(false);LargeObjectManager lobj = conn.unwrap(org.postgresql.PGConnection.class).getLargeObjectAPI();long oid = lobj.createLO(LargeObjectManager.READ | LargeObjectManager.WRITE);LargeObject obj = lobj.open(oid, LargeObjectManager.WRITE);File file = new File("c:/work/test_lo");FileInputStream fis = new FileInputStream(file);byte buf[] = new byte[10*1024*1024];int s, tl = 0;while ((s = fis.read(buf, 0, 2048)) > 0){obj.write(buf, 0, s);tl += s;}obj.close();PreparedStatement ps = conn.prepareStatement("INSERT INTO test_lo VALUES (?, ?)");ps.setInt(1, 100);ps.setLong(2, oid);ps.executeUpdate();ps.close();fis.close();conn.commit();conn.close();}

06

JDBC-Java读数据输出到文件

public static void main(String[] args) throws Exception{ Class.forName("org.postgresql.Driver");Connection conn = DriverManager.getConnection("jdbc:postgresql://ip:port/dbname","username","password");conn.setAutoCommit(false);LargeObjectManager lobj = conn.unwrap(org.postgresql.PGConnection.class).getLargeObjectAPI();PreparedStatement ps = conn.prepareStatement("SELECT info FROM test_lo WHERE id = ?");ps.setInt(1, 100);ResultSet rs = ps.executeQuery();File file = new File("c:/work/test_out_lo");FileOutputStream fos = new FileOutputStream(file);while (rs.next()){long oid = rs.getLong(1);LargeObject obj = lobj.open(oid, LargeObjectManager.READ);byte buf[] = new byte[10*1024*1024];int s, tl = 0;while ((s = obj.read(buf, 0, 2048)) > 0){fos.write(buf, 0, s);tl += s;}obj.close();}rs.close();ps.close();fos.close();conn.commit();conn.close();}

Jdbc-Java Large Object示例参考:(复制链接至浏览器中浏览)

https://jdbc.postgresql.org/documentation/head/binary-data.html


墨天轮原文链接:https://www.modb.pro/db/214758?sjhy复制链接至浏览器或点击文末阅读原文查看)

Java遍历大数据量比较内容、关于作者

彭冲,云和恩墨PG技术顾问,网名“多米爸比”,PG社区认证专家,中国首期PostgreSQL ACE Partner,多年从事基于PostgreSQL数据库的软件研发,擅长于PL/PGSQL业务迁移及优化,Oracle到PostgreSQL的迁移升级,异构数据库整合;作为墨天轮PostgreSQL实践专栏作者,热衷于PostgreSQL实践技术分享,在自己的岗位积极推广PostgreSQL,致力为PG社区多做奉献。

END

推荐阅读:2021数据技术嘉年华视频回放及PPT下载


2021数据技术嘉年华50余个PPT下载、视频回放已上传墨天轮平台,可在“数据和云”公众号回复关键词“2021DTC”获得!

深度探索c++对象模型 百度网盘、你知道吗?我们的视频号里已经发布了很多精彩的内容,快去看看吧!↓↓↓

点击下图查看更多 ↓

b9c1be5337a22d04b0166e06fb5915e4.png

47ecabf924ea0b08458ed2c3e561908e.png

09cc8fd01fe49cb5db5c1a32881b07d4.png

云和恩墨大讲堂 | 一个分享交流的地方

长按,识别二维码,加入万人交流社群

请备注:云和恩墨大讲堂

  点个“在看” 

你的喜欢会被看到❤

版权声明:本站所有资料均为网友推荐收集整理而来,仅供学习和研究交流使用。

原文链接:https://hbdhgg.com/5/83103.html

发表评论:

本站为非赢利网站,部分文章来源或改编自互联网及其他公众平台,主要目的在于分享信息,版权归原作者所有,内容仅供读者参考,如有侵权请联系我们删除!

Copyright © 2022 匯編語言學習筆記 Inc. 保留所有权利。

底部版权信息