Embian Blog

Scylla vs. Cassandra benchmark 따라하기 1 : VirtualBox에서 테스트

Scylla vs. Cassandra benchmark 따라하기 2 : 사내 개발장비 테스트

ScyllaDB 테스트 마무리

이전 포스트에서는 3차례에 걸쳐서 ScyllaDB vs. Cassandra Benchmark를 테스트해봤다. 3번에 걸친 테스트에서 ScyllaDB에서 주장하는 10배의 성능 향상을 직접 확인하지는 못했다. 그렇다고 ScyllaDB가 홈페이지에서 정확하지도 않은 내용을 주장하는 것은 아니다.

테스트 환경이 제한적이다보니 10배의 성능 향상을 확인 못한 것이지 ScyllaDB에서 테스트한 것과 동일한 사양으로 테스트를 진행한다면 충분히 가능할 것이라 생각한다.

중간 규모의 서비스에서는 Cassandra를 운영한다 하더라도 시스템 사양을 24Core/128Gb로 맞추기는 힘들다. 그나마 적절한 수준이 8~16Core/32Gb일 것이고 현실적으로는 8Core/16Gb정도의 사양으로 운영하게 될 수 있다.

사내 개발장비를 통해서 진행한 테스트(ScyllaDB vs. Cassandra benchmark 따라하기 2 : 사내 개발장비 테스트)가 현실과 가장 유사할 수 있다.

사내 개발장비 테스트에서 보여준 ScyllaDB의 성능은 "그럭저럭한 Request 부하에서는 Cassandra에 가까운 성능을 보여준다"고 할 수 있다. 하지만 AWS를 통한 테스트(ScyllaDB vs. Cassandra benchmark 따라하기 3 : AWS 테스트)에서 확인할 수 있었던 것 처럼 "Request가 증가할수록 ScyllaDB는 Cassandra보다 더 좋은 성능을 보여준다"는 것을 확인할 수 있었다.

지금까지 확인된 사실을 바탕으로 ScyllaDB와 Cassandra의 성능을 짐작해보면 다음과 같이 표현할 수 있다.

<그림 1. Cassandra와 ScyllaDB의 초당 Request 증가에 따른 TPS 변화 예상>

적절한 시스템 사양만 갖춘다면 "Redis의 속도를 가진 Cassandra"를 갖는 것이 불가능하지만은 않다고 보인다.

<그림 2. Redis의 속도를 가진 Cassandra>

만약 현재 Cassandra를 운영하고 있는 경우라면 2016년 1월에 ScyllaDB GA버전이 나온 후 ScyllaDB로 교체하는 것을 고려해볼만한 가치가 있는 것 같다.

그리고 rowkey, column name 등이 정렬된다는 특징을 이용하면 Message Queue, Time Series DB, CEP 등을 구현하는데 매우 유용할 수 있을 것 같다.

'NOSQL' 카테고리의 다른 글

Scylla vs. Cassandra benchmark 따라하기 3 : AWS 테스트 (0)	2015.12.03
Scylla vs. Cassandra benchmark 따라하기 2 : 사내 개발장비 테스트 (0)	2015.12.03
Scylla vs. Cassandra benchmark 따라하기 1 : VirtualBox에서 테스트 (0)	2015.12.02
ScyllaDB 소개 (1)	2015.11.26
HBase에 대해서 간단히 알아보자! #2 (HBase의 특징) (1)	2013.10.18

Posted by 알 수 없는 사용자

Scylla vs. Cassandra benchmark 따라하기 3 : AWS 테스트

NOSQL 2015. 12. 3. 15:11

:: ScyllaDB 소개 및 테스트 바로가기 ::

Scylla vs. Cassandra benchmark 따라하기 1 : VirtualBox에서 테스트

Scylla vs. Cassandra benchmark 따라하기 2 : 사내 개발장비 테스트

Scylla vs. Cassandra benchmark 따라하기 3 : AWS 테스트

ScyllaDB의 Benchmark 따라하기

지난 포스팅에서는 VirtualBox, 사내 개발장비에서 각각 ScyllaDB와 Cassandra의 성능을 테스트해보았다. 역시나 ScyllaDB 홈페이지에 나와있는 성능 10배 향상은 확인할 수 없었다. 게다가 사내 개발장비에서 테스트한 결과에서는 Cassandra가 약간이나마 더 좋은 성능을 보여줬다.

하지만 앞에서 진행한 2번의 테스트는 아직은 정확한 성능을 측정했다고는 할 수 없다. 부하를 주는 클라이언트가 1대뿐인 환경에서 진행되었고 시스템 사양도 실제 서비스에서 사용하기에는 무리가 있을만하기 때문이다.

이번에는 AWS에서 ScyllaDB와 Cassandra를 테스트해보도록 하겠다. 각 DB의 구성은 Single Node로 구성해서 테스트했다.

테스트에 사용할 EC2 Instance는 다음과 같다.

DB서버(ScyllaDB/Cassandra)

m3.xlarge : vCPU=4, 메모리=15G
Volume : m3.xlarge에서 기본 제공되는 SSD 사용

부하 테스트 클라이언트

t2.micro : vCPU=1, ECU=변수, 메모리=1G

:: m3.xlarge DB Server, 부하테스트 클라이언트 1대로 테스트 ::

1) 쓰기 테스트

쓰기 테스트에 사용한 명령은 앞서 진행했던 명령어와 동일하다.

cassandra-stress write duration=10m -mode native cql3 -rate threads=700 -node $SERVER

쓰기 성능테스트를 한 결과는 다음과 같다.

ScyllaDB 평균 TPS : 17792

Cassandra 평균 TPS : 22692

ScyllaDB는 앞서 진행했던 사내 개발장비에서보다 낮은 성능을 보여주고 있다. AWS의 Instance Disk I/O 성능이 사내 개발장비보다 낮기 때문에 당연한 결과일 수 있다.

2) 읽기 테스트

VirtualBox 테스트와 마찬가지로 데이터를 먼저 채워넣은 후 읽기 테스트를 진행했다.

읽기 테스트는 다음의 명령은 다음과 같다.

cassandra-stress mixed 'ratio(read=1)' duration=10m -pop 'dist=gauss(1..10000000,5000000,500000)' -mode native cql3 -rate threads=700 -node $SERVER

결과는 다음과 같다.

ScyllaDB 평균 TPS : 15911

Cassandra 평균 TPS : 27918

3) 읽기/쓰기 테스트

테스트에 사용한 명령은 다음과 같다.

cassandra-stress mixed 'ratio(read=1,write=1)' duration=10m -pop 'dist=gauss(1..10000000,5000000,500000)' -mode native cql3 -rate threads=700 -node $SERVER

결과는 다음과 같다.

ScyllaDB 평균 TPS

읽기 : 9262, 쓰기 : 9241

Cassandra 평균 TPS

읽기 : 1700, 쓰기 : 1689

결과를 종합해서 살펴보면 다음과 같다.

	ScyllaDB	Cassandra
쓰기	17792	22692
읽기	15911	27918
읽기/쓰기	7772/7767	10729/10739

<표 1. AWS에서의 benchmark결과>

m3.xlarge가 vCPU가 4개뿐이어서 큰 기대를 하지는 않았다. 그런데 결과는 기대 이하로 Cassandra가 더 빠르게 나왔다.

이정도까지 했으면 "ScyllaDB가 결과를 너무 과대포장했네~"라고 생각할 수 있을만 하다. 그런데 테스트 중 측정된 Load Average를 보면 좀 더 테스트가 필요하다는 필요성을 느낄 수 있다.

ScyllaDB와 Cassandra 테스트 중 측정된 Load Average는 다음과 같다.

	ScyllaDB	Cassandra
Load Average	4.2 ~ 5.5	10.5 ~ 15.5

<표 2. 테스트 중 측정된 Load Average>

만약 이렇다면 부하 테스트 클라이언트의 수를 늘렸을 때 ScyllaDB는 더 많은 일을 할 수 있을 것 같다. 물론 ScyllaDB는 Architecture상 Load Average가 크게 올라가지 않을 수 있다.

:: m3.xlarge DB Server, 부하테스트 클라이언트 10대로 테스트 ::

1) 쓰기 테스트

테스트 결과는 다음과 같다.

ScyllaDB 평균 TPS : 71983

Cassandra 평균 TPS : 32966

2) 읽기 테스트

결과는 다음과 같다.

ScyllaDB 평균 TPS : 60496

Cassandra 평균 TPS : 27739

3) 읽기/쓰기 테스트

결과는 다음과 같다.

ScyllaDB 평균 TPS

읽기 : 29018, 쓰기 : 28994

Cassandra 평균 TPS

읽기 : 12555, 쓰기 :

결과를 종합해서 살펴보면 다음과 같다.

	ScyllaDB	Cassandra
쓰기	71983	32966
읽기	60496	27739
읽기/쓰기	29018/28994	12555/12540

<표 2. AWS에서 Client가 10개인 경우의 benchmark결과>

부하테스트 클라이언트를 1대로만 했을때는 Cassandra의 약 80%의 성능 정도만 보이던 ScyllaDB였다. 그런데 클라이언트를 10대로 하니 Cassandra의 2배 이상의 성능을 보여주고 있다.

특이한 점은 Cassandra의 경우 부하를 1대에서 주는 경우와 10대에서 주는 경우 읽기 성능이 크게 달라지지 않았다. 반면에 ScyllaDB는 쓰기 성능과 비슷한 비율로 증가한 것을 알 수 있다.

'NOSQL' 카테고리의 다른 글

ScyllaDB 테스트 마무리 (0)	2015.12.09
Scylla vs. Cassandra benchmark 따라하기 2 : 사내 개발장비 테스트 (0)	2015.12.03
Scylla vs. Cassandra benchmark 따라하기 1 : VirtualBox에서 테스트 (0)	2015.12.02
ScyllaDB 소개 (1)	2015.11.26
HBase에 대해서 간단히 알아보자! #2 (HBase의 특징) (1)	2013.10.18

Posted by 알 수 없는 사용자

Scylla vs. Cassandra benchmark 따라하기 2 : 사내 개발장비 테스트

NOSQL 2015. 12. 3. 14:50

:: ScyllaDB 소개 및 테스트 바로가기 ::

Scylla vs. Cassandra benchmark 따라하기 1 : VirtualBox에서 테스트

Scylla vs. Cassandra benchmark 따라하기 2 : 사내 개발장비 테스트

ScyllaDB의 Benchmark 따라하기 2

지난 포스팅에서는 VirtualBox를 통해서 ScyllaDB와 Cassandra의 성능을 테스트해보았다. 결과에서 ScyllaDB 홈페이지에서 주장하던 10배의 성능 향상을 볼 수는 없었다. 몇가지 조건은 오히려 ScyllaDB쪽에 불리한 것도 있었기 때문에 이번에는 사내에 있는 개발장비에서 성능테스트를 진행해봤다. 사내에서 테스트에 활용할 수 있는 개발장비는 다행히 3대가 있었다.

사내에는 남는 개발장비가 3대 있다. 시스템 사양은 각각 다음과 같다.

DB서버(ScyllaDB/Cassandra)

CPU : 4 Core
메모리 : 16G
HDD : 128G SSD

부하 테스트 서버

CPU : 2 Core
메모리 : 16G
HDD : 250G SSD

1) 쓰기 테스트

쓰기 테스트에 사용한 명령은 앞서 진행했던 VirtualBox 테스트에 사용한 명령어와 동일하다.

cassandra-stress write duration=10m -mode native cql3 -rate threads=700 -node $SERVER

사내 개발장비에서 성능테스트를 한 결과는 다음과 같다.

ScyllaDB 평균 TPS : 56191

Cassandra 평균 TPS : 58621

오히려 Cassandra가 더 좋은 성능을 보여주고 있다.

2) 읽기 테스트

VirtualBox 테스트와 마찬가지로 데이터를 먼저 채워넣은 후 읽기 테스트를 진행했다.

읽기 테스트는 다음의 명령은 다음과 같다.

cassandra-stress mixed 'ratio(read=1)' duration=10m -pop 'dist=gauss(1..10000000,5000000,500000)' -mode native cql3 -rate threads=700 -node $SERVER

결과는 다음과 같다.

ScyllaDB 평균 TPS : 47363

Cassandra 평균 TPS : 56500

읽기에서도 오히려 Cassandra가 더 좋은 성능을 보여주고 있다.

3) 읽기/쓰기 테스트

테스트에 사용한 명령은 다음과 같다.

cassandra-stress mixed 'ratio(read=1,write=1)' duration=10m -pop 'dist=gauss(1..10000000,5000000,500000)' -mode native cql3 -rate threads=700 -node $SERVER

결과는 다음과 같다.

ScyllaDB 평균 TPS

읽기 : 25183, 쓰기 : 25146

Cassandra 평균 TPS

읽기 : 27023, 쓰기 : 27038

결과를 종합해서 살펴보면 다음과 같다.

	ScyllaDB	Cassandra
쓰기	56191	58621
읽기	47363	56500
읽기/쓰기	25183/25146	27023/27038

<표 1. 사내 개발장비에서의 benchmark결과>

테스트 결과 ScyllaDB가 말하는 "Cassandra보다 10배 빠르다"는 확인할 수 없었다. 오히려 Cassandra보다 떨어지는 성능을 보여주고 있었다.

그런데 이번 테스트에서는 ScyllaDB 홈페이지에서 진행한 것 처럼 여러대의 Client에서 부하를 준 것이 아니라 한대의 시스템에서만 부하를 준 것이다. 이번 결과로 확인할 수 있었던 것은 그럭저럭한 사양의 시스템에서 그리 많지 않은 수준의 Request가 들어오는 경우에는 Cassandra가 더 빠를 수 있다는 것이다.

사내 개발장비에서는 여러대의 클라이언트에서 부하를 주는 등의 테스트 진행이 불가능하기 때문에 다음번 포스트에서는 아마존 AWS에서 테스트를 진행해보도록 할 계획인다.

'NOSQL' 카테고리의 다른 글

ScyllaDB 테스트 마무리 (0)	2015.12.09
Scylla vs. Cassandra benchmark 따라하기 3 : AWS 테스트 (0)	2015.12.03
Scylla vs. Cassandra benchmark 따라하기 1 : VirtualBox에서 테스트 (0)	2015.12.02
ScyllaDB 소개 (1)	2015.11.26
HBase에 대해서 간단히 알아보자! #2 (HBase의 특징) (1)	2013.10.18

Posted by 알 수 없는 사용자

Scylla vs. Cassandra benchmark 따라하기 1 : VirtualBox에서 테스트

NOSQL 2015. 12. 2. 10:54

:: ScyllaDB 소개 및 테스트 바로가기 ::

Scylla vs. Cassandra benchmark 따라하기 1 : VirtualBox에서 테스트

Scylla vs. Cassandra benchmark 따라하기 2 : 사내 개발장비 테스트

Scylla vs. Cassandra benchmark 따라하기 1 : VirtualBox에서 테스트

ScyllaDB의 Benchmark 따라하기 1

ScyllaDB가 주장하는 10배 빠르다는 사실을 확인하기 위해서 ScyllaDB 홈페이지의 Scylla vs. Cassandra benchmark에 나와있는 내용을 직접 확인해보도록 하자.

홈페이지에 나와있는대로 하려면 DB서버는 24Core CPU, 128G 메모리가 있어야 한다. NIC도 DB서버에는 10Gbps를 사용했다.

우선 그런건 다 무시하고 PC에서 VirtualBox를 통해서 ScyllaDB와 Cassandra를 테스트해봤다. 테스트 환경은 다음과 같다.

DB 서버 (ScyllaDB/Cassandra)

CPU : 1 Core
메모리 : 2G
HDD : 20G 고정크기 저장소

부하 테스트 서버

없음. DB서버하고 같이 사용함.

1) 쓰기 테스트

다음의 명령을 사용하여 테스트했다.

cassandra-stress write duration=10m -mode native cql3 -rate threads=700 -node $SERVER

ScyllaDB 홈페이지에서도 사용한 명령을 적어주긴 했는데 대충 적은듯한 티가 많이 난다. duration=15min으로 되어있는 부분은 duration=15m이 되어야 한다.

VirtualBox에서 테스트한 결과는 다음과 같다.

ScyllaDB 평균 TPS : 20636

Cassandra 평균 TPS : 19789

2) 읽기 테스트

읽기 테스트를 진행하기 전에 다음의 명령으로 채워넣어놨다.

cassandra-stress write n=10000000 -pop "seq=1..100000000" -mode native cql3 -rate threads=700 -node $SERVER

읽기 테스트는 다음의 명령을 사용했다.

cassandra-stress mixed 'ratio(read=1)' duration=10m -pop 'dist=gauss(1..10000000,5000000,500000)' -mode native cql3 -rate threads=700 -node $SERVER

ScyllaDB에 테스트를 할 때 데이터가 늦게 나온다 싶더니 나오라는 결과는 안나오고 다음의 메시지만 나오고 있었다.

com.datastax.driver.core.exceptions.ReadTimeoutException: Cassandra timeout during read query at consistency LOCAL_ONE (1 responses were required but only 0 replica responded)

메시지가 말해주는건 다음과 같다.

"LOCAL_ONE Consistency level을 가지고 read를 수행하려 했는데 timeout이 발생했다! LOCAL_ONE Consistency level에서는 1개의 응답이 와야 하는데 아무것도 못받았다"

아무래도 thread 700개는 무리였던 것 같다. ScyllaDB 홈페이지에서 테스트에 사용했던 시스템은 24core에 128Gb 메모리를 가진 시스템이었기 때문에 thread를 300개로 낮춰서 다시한번 테스트한 결과는 다음과 같다.

ScyllaDB 평균 TPS : 236

Cassandra 평균 TPS : 150

ScyllaDB가 약 65%의 성능 향상이 있는 것으로 결과가 나오긴 했지만 테스트 중 ScyllaDB는 ReadTimeoutException이 한두번 발생하기는 했다. ReadTimeoutException은 Cassandra에서는 발생하지 않았다.

3) 읽기/쓰기 테스트

읽기/쓰기 테스트는 읽기 테스트에 사용했던 명령에 ratio만 read=1,write=1로 수정해서 테스트했다. 그런데 Cassandra에서 ReadTimeoutException이 많이 발생해서 thread 수를 300 -> 100 -> 50 으로 줄여나갔다.

cassandra-stress mixed 'ratio(read=1,write=1)' duration=10m -pop 'dist=gauss(1..10000000,5000000,500000)' -mode native cql3 -rate threads=100 -node $SERVER

결과는 다음과 같다.

ScyllaDB 평균 TPS

읽기 : 249, 쓰기 : 255

Cassandra 평균 TPS

읽기 : 114, 119

결과를 종합해서 살펴보면 다음과 같다.

	ScyllaDB	Cassandra
쓰기	20636	19789
읽기	236	150
읽기/쓰기	230/234	114/119

<표 1. VirtualBox에서의 benchmark결과>

ScyllaDB가 아주 약간의 성능 향상이 보여지기는 했다. 그리고 특히 읽기/쓰기 테스트에서는 Cassandra에서만 ReadTimeoutException이 발생해서 Thread 수를 줄여나가야 했다.

아무래도 테스트 환경이 VirtualBox이고 매우 낮은 사양의 VM이라서 이런 결과가 나온 것일 수 있다. 특히 VM마다 CPU Core를 하나만 할당했기 때문에 Request당 하나의 CPU를 할당하는 ScyllaDB는 좀 더 불리한 상황에서 테스트를 진행한 것이다.

아무튼 ScyllaDB가 Cassandra보다 약간 빠른 성능을 보여주는 것은 확인되었다. 다음번에는 사내 개발장비에서 테스트를 진행해보도록 할 계획이다.

'NOSQL' 카테고리의 다른 글

Scylla vs. Cassandra benchmark 따라하기 3 : AWS 테스트 (0)	2015.12.03
Scylla vs. Cassandra benchmark 따라하기 2 : 사내 개발장비 테스트 (0)	2015.12.03
ScyllaDB 소개 (1)	2015.11.26
HBase에 대해서 간단히 알아보자! #2 (HBase의 특징) (1)	2013.10.18
HBase에 대해서 간단히 알아보자! #1 (HBase? -_-?) (0)	2013.07.19

Posted by 알 수 없는 사용자

ScyllaDB 소개

NOSQL 2015. 11. 26. 18:44

:: ScyllaDB 소개 및 테스트 바로가기 ::

ScyllaDB 소개

Scylla vs. Cassandra benchmark 따라하기 2 : 사내 개발장비 테스트