tencent cloud

腾讯云数据仓库 TCHouse-D

产品简介
产品概述
基本概念
集群架构
产品优势
应用场景
购买指南
计费概述
续费说明
到期与欠费说明
退费说明
配置变更计费说明
快速入门
通过控制台使用腾讯云数据仓库 TCHouse-D
通过客户端使用腾讯云数据仓库 TCHouse-D
操作指南
集群操作
监控和告警配置
账户权限管理
数据管理
查询管理
配置管理
节点管理
日志分析
SQL 工作区
开启资源隔离
开发指南
数据表设计
数据导入
数据导出
基础功能
查询优化
生态扩展功能
API 文档
History
Introduction
API Category
Making API Requests
Cluster Operation APIs
Database and Table APIs
Cluster Information Viewing APIs
Hot-Cold Data Layering APIs
Database and Operation Audit APIs
User and Permission APIs
Resource Group Management APIs
Data Types
Error Codes
云上生态
为子账号授予 CAM 策略
查询加速腾讯云 DLC
实践教程
基本功能使用
高级特性使用
资源规格选型及调优建议
命名规范及库表限制
表设计与数据导入
查询调优
建议规避的用法
通过 JDBC 方式公网访问 TCHouse-D
性能测试
TPC-H 性能测试
SSB 性能测试
TPC-DS 性能测试
常见问题
常见操作问题
常见报错
联系我们
词汇表
产品协议
服务等级协议
隐私政策
数据处理和安全协议

测试方案介绍

PDF
聚焦模式
字号
最后更新时间: 2024-12-25 17:55:17
本文将为您介绍如何使用 TPC-DS 对腾讯云数据仓库 TCHouse-D 进行性能测试。下文以测试 100GB 数据集下的 TPC-DS 查询性能为例,给出参考测试方案。

关于 TPC-DS 性能测试

TPC-DS 是一个以决策支持为重点的基准测试,旨在评估数据仓库和分析系统的性能。它是由 TPC(Transaction Processing Performance Council)组织开发的,用于比较不同系统在处理复杂查询和大规模数据分析方面的能力。
TPC-DS 的设计目标是模拟现实世界中的复杂决策支持工作负载。它通过一系列复杂的查询和数据操作来测试系统的性能,包括联接、聚合、排序、过滤、子查询等。这些查询模式涵盖了从简单到复杂的各种场景,如报表生成、数据挖掘、OLAP(联机分析处理)等。

测试方案介绍

测试环境准备

硬件环境

在本文给出的参考方案中,所测试的集群包含 FE 3台、BE 3台 , FE/BE 节点进程均为单独部署,具体规格如下所示。需要特别说明的是,实际测试中不会消耗如此多的硬件资源。
节点类型
节点规格
FE 3台 标准型
CPU:16 cores
内存:64 GB
磁盘:增强型SSD云硬盘200 GB
BE 3台 标准型
CPU:16 cores
内存:64 GB
磁盘:增强型SSD云硬盘1000 GB

软件版本

腾讯云 TChouse-D 2.1.7

测试脚本准备

工具包地址下载 TPC-DS 工具包并编译

TPC-DS 100G数据测试

生成100G数据集

sh bin/gen-tpcds-data.sh -s 100
执行后生成的数据如下:
# du -sh bin/tpcds-data/
96G bin/tpcds-data/
表名
原始文本文件大小
100G 导入后的大小
分桶数
行数
call_center
9.2KiB
13.784 KB
1
30
catalog_page
2.8MiB
1.216 MB
3
20400
catalog_returns
2.2GiB
736.137 MB
32
14404374
catalog_sales
29GiB
9.225 GB
960
143997065
customer
256MiB
111.185 MB
12
2000000
customer_address
106MiB
21.386 MB
12
1000000
customer_demographics
76MiB
6.468 MB
12
1920800
date_dim
9.8MiB
1.823 MB
12
73049
dbgen_version
111B
1.184 KB
1
1
household_demographics
142KiB
20.372 KB
3
7200
income_band
308B
724.000 B
1
20
inventory
7.7GiB
871.378 MB
32
399330000
item
56MiB
25.314 MB
12
204000
promotion
122KiB
73.989 KB
1
1000
reason
1.9KiB
7.748 KB
1
55
ship_mode
1.1KiB
3.251 KB
1
20
store
104KiB
54.449 KB
1
402
store_returns
3.3GiB
1.090 GB
32
28795080
store_sales
38GiB
12.529 GB
960
287997024
time_dim
4.8MiB
1.087 MB
12
86400
warehouse
1.8KiB
4.999 KB
1
15
web_page
193KiB
38.753 KB
1
2040
web_returns
998MiB
350.227 MB
32
7197670
web_sales
15GiB
4.645 GB
960
72001237
web_site
6.7KiB
11.185 KB
1
24
Total
96G
29.566 GB
3096
959037906

建表

修改 doris-cluster.conf 配置文件。
修改配置:FE_HOST 和 PASSWORD,还有 DB。
# cat doris-cluster.conf

# Any of FE host
export FE_HOST='127.0.0.1'
# http_port in fe.conf
export FE_HTTP_PORT=8030
# query_port in fe.conf
export FE_QUERY_PORT=9030
# Doris username
export USER='root'
# Doris password
export PASSWORD=''
# The database where TPC-DS tables located
export DB='tpch_100g'
建表
sh bin/create-tpcds-tables.sh -s 100

导入数据

sh load-tpcds-data.sh

Start time: Thu Oct 31 21:03:55 CST 2024
End time: Thu Oct 31 21:14:44 CST 2024
Finish load tpcds data, Time taken: 649 seconds
============================================
analyze database tpcds_100g
analyze database tpcds_100g with full with sync;
analyze database tpcds_100g with full with sync total time: 67 s

MySQL [tpcds_100g]> show data;
+------------------------+-------------+--------------+------------+
| TableName | Size | ReplicaCount | RemoteSize |
+------------------------+-------------+--------------+------------+
| call_center | 13.784 KB | 1 | 0.000 |
| catalog_page | 1.216 MB | 3 | 0.000 |
| catalog_returns | 736.137 MB | 32 | 0.000 |
| catalog_sales | 9.225 GB | 960 | 0.000 |
| customer | 111.185 MB | 12 | 0.000 |
| customer_address | 21.386 MB | 12 | 0.000 |
| customer_demographics | 6.468 MB | 12 | 0.000 |
| date_dim | 1.823 MB | 12 | 0.000 |
| dbgen_version | 1.184 KB | 1 | 0.000 |
| household_demographics | 20.372 KB | 3 | 0.000 |
| income_band | 724.000 B | 1 | 0.000 |
| inventory | 871.378 MB | 32 | 0.000 |
| item | 25.314 MB | 12 | 0.000 |
| promotion | 73.989 KB | 1 | 0.000 |
| reason | 7.748 KB | 1 | 0.000 |
| ship_mode | 3.251 KB | 1 | 0.000 |
| store | 54.449 KB | 1 | 0.000 |
| store_returns | 1.090 GB | 32 | 0.000 |
| store_sales | 11.713 GB | 960 | 0.000 |
| time_dim | 1.087 MB | 12 | 0.000 |
| warehouse | 4.999 KB | 1 | 0.000 |
| web_page | 38.753 KB | 1 | 0.000 |
| web_returns | 350.227 MB | 32 | 0.000 |
| web_sales | 4.645 GB | 960 | 0.000 |
| web_site | 11.185 KB | 1 | 0.000 |
| Total | 28.750 GB | 3096 | 0.000 |
| Quota | 1024.000 TB | 1073741824 | |
| Left | 1023.972 TB | 1073738728 | |
| Transaction Quota | 1000 | 1000 | |
+------------------------+-------------+--------------+------------+
29 rows in set (0.02 sec)

查询

# bash bin/run-tpcds-queries.sh -s 100
由此,即完成了针对 100GB 数据集场景下的 TPC-DS 数据生成、建表、导入和查询。


帮助和支持

本页内容是否解决了您的问题?

填写满意度调查问卷,共创更好文档体验。

文档反馈