'분류 전체보기' 카테고리의 글 목록 (93 Page)

[spark] parquet 사용 예제 (0)	2017.05.26
[spark] zipWithIndex, for-yield 예제 (0)	2017.05.25
[spark] where과 filter의 차이 (0)	2017.05.23
[spark2] spark SQL 예제 (0)	2017.05.20
[spark2] spark2 rdd 생성 -makeRDD (0)	2017.04.29

[spark] zipWithIndex, for-yield 예제 (0)	2017.05.25
[spark] join 예제 (0)	2017.05.23
[spark2] spark SQL 예제 (0)	2017.05.20
[spark2] spark2 rdd 생성 -makeRDD (0)	2017.04.29
[scala] 라인 피드("\n") 관련 예시 코드 (0)	2017.04.24

아파치 스파크 2017 발표 자료 (0)	2017.06.14
[펌] 스파크의 사용 환경 내용 - data bricks (0)	2017.05.24
[펌] uber 아키텍처 (0)	2017.05.22
goto 2017(chicago, 2017/5/1~2017/5/2) 자료 다운받기 (0)	2017.05.16
간단한 http client - okhttp (0)	2017.04.28

[elasticsearch 5] trainsient / persistent (0)	2017.05.25
[elasticsearch 5] 라우팅(routing)를 이용한 데이터 저장 (0)	2017.05.24
[elasticsearch 5] bootstrap 검사 (0)	2017.05.22
[elasticsearch 5] _cat/shards (0)	2017.05.20
[elasticsearch 5] 인덱스 통계 보기 (0)	2017.05.17

[elasticsearch 5] bootstrap 검사

Elasticsearch 2017. 5. 22. 20:08

elasticsearch 5에서 elasticsearch를 실행할 때 다른 sql처럼 bootstrap 검사를 시작한다.

관련 내용은 다음을 참고한다.

https://www.elastic.co/guide/en/elasticsearch/reference/master/bootstrap-checks.html

https://www.elastic.co/blog/bootstrap_checks_annoying_instead_of_devastating

'Elasticsearch' 카테고리의 다른 글

[elasticsearch 5] 라우팅(routing)를 이용한 데이터 저장 (0)	2017.05.24
[elasticsearch 5] _cat/nodes (0)	2017.05.23
[elasticsearch 5] _cat/shards (0)	2017.05.20
[elasticsearch 5] 인덱스 통계 보기 (0)	2017.05.17
[elasticsearch 5] 매트릭스 통계(matrix stats) (0)	2017.05.17

Posted by '김용환'

,

[펌] 스파크의 사용 환경 내용 - data bricks (0)	2017.05.24
[성과] OKR (0)	2017.05.23
goto 2017(chicago, 2017/5/1~2017/5/2) 자료 다운받기 (0)	2017.05.16
간단한 http client - okhttp (0)	2017.04.28
아파치 오로라(Apache Aurora) (0)	2017.04.21

[nginx] no live upstreams while connecting to upstream 에러의 트러블 슈팅

nginx 2017. 5. 20. 06:59

nginx에 upstream을 사용하고 있는데, 에서 어느 시간부터 다음과 같은 에러가 선형적으로 늘어가기 시작했고 엄청난 양의 에러가 발생하기 시작했다.

no live upstreams while connecting to upstream, client: ip_address , server: example.com, request: "GET / HTTP/1.1", upstream: "http://example.com", host: "example.com", referrer: "http://example.com/mypages/"

upstream prematurely closed connection while reading response header from upstream, client: ip_address , server: example.com, request: "GET / HTTP/1.1", upstream: "http://example.com", host: "example.com", referrer: "http://example.com/mypages/"

문제 해결 방법을 차례로 테스트했다.

1. timeout (proxy_timeout 등등)

2. upstream keepalive

3. backend resource thread pool

그러나 여전히 문제를 해결할 수 없었다.

2개의 backend를 보면 upstream을 보던 설정을 1개의 backend로 보게 하고 tcpdump를 뜨면서 에러가 날 때 어떠한 현상이 있는지 확인했다.

no live upstreams while connecting to upstream, upstream prematurely closed connection while reading response header from upstream 에러 발생과 tcpdump 덤프와의 인과 관계가 없음을 확인했다.

이 문제는 nginx 내부의 문제로 생긴 것으로 생각하고 소스를 확인해봤다.

https://github.com/nginx/nginx/blob/master/src/stream/ngx_stream_proxy_module.c#L696

if (rc == NGX_BUSY) {

ngx_log_error(NGX_LOG_ERR, c->log, 0, "no live upstreams");

ngx_stream_proxy_finalize(s, NGX_STREAM_BAD_GATEWAY);

return;

}

https://github.com/nginx/nginx/blob/beaaeb9f9e642d1d153ee65569d99499eef624e9/src/http/ngx_http_upstream.c#L3551

if (upstream->read->eof) {

ngx_log_error(NGX_LOG_ERR, upstream->log, 0,

"upstream prematurely closed connection");

ngx_http_upstream_finalize_request(r, u,

NGX_HTTP_BAD_GATEWAY);

return;

}

connection 이슈인 것을 확인했다..

nginx 설정을 보니 아... 내가 못 보던 nginx 사용자 정의 모듈이 있었고 해당 모듈이 특정 서버를 바라보고 있었다.

해당 모듈의 통신이 upstream에 영향을 주는 것으로 판단하고 해당 모듈을 사용하지 않도록 하니..

더이상 에러는 발생되지 않았다..

저작자표시

'nginx' 카테고리의 다른 글

proxy_pass 사용할 때 유의사항 - Host (0)	2017.02.02
HTTP 1.1 스펙에 따르면 반드시 Host 헤더를 추가해야 한다. (0)	2017.02.01
[nginx] no resolver defined to resolve (0)	2017.02.01
[openresty] health check url 만들기 (0)	2017.01.24
[openresty] lua 처음 다루기 (0)	2017.01.24

Posted by '김용환'

,

[elasticsearch 5] _cat/shards

Elasticsearch 2017. 5. 20. 06:48

참조

https://www.elastic.co/guide/en/elasticsearch/reference/current/cat-shards.html

전체 인덱스에 대한 shard 정보를 얻으려면 _cat/shards를 실행한다.

$ curl localhost:9200/_cat/shards

persons 0 p STARTED 10 4.1kb 127.0.0.1 5OEGj_a

persons 0 r UNASSIGNED

..

특정 인덱스의 샤드 정보는 다음 커맨드를 사용한다.

$ curl localhost:9200/_cat/shards/wikinews

wikinews 2 p STARTED 4214 71mb 127.0.0.1 5OEGj_a

wikinews 2 r UNASSIGNED

wikinews 1 p STARTED 4112 69.2mb 127.0.0.1 5OEGj_a

wikinews 1 r UNASSIGNED

wikinews 3 p STARTED 4310 73.6mb 127.0.0.1 5OEGj_a

wikinews 3 r UNASSIGNED

wikinews 4 p STARTED 4285 72.4mb 127.0.0.1 5OEGj_a

wikinews 4 r UNASSIGNED

wikinews 0 p STARTED 4146 69.6mb 127.0.0.1 5OEGj_a

wikinews 0 r UNASSIGNED

인덱스의 정보를 상세하게 보려면 h 매개변수에 옵션을 추가할 수 있다. 만약 unassinged라면 이유도 확인할 수 있다.

$ curl localhost:9200/_cat/shards/wikinews?h=index,shard,prirep,state,unassigned.reason

wikinews 2 p STARTED

wikinews 2 r UNASSIGNED INDEX_CREATED

wikinews 1 p STARTED

wikinews 1 r UNASSIGNED INDEX_CREATED

wikinews 3 p STARTED

wikinews 3 r UNASSIGNED INDEX_CREATED

wikinews 4 p STARTED

wikinews 4 r UNASSIGNED INDEX_CREATED

wikinews 0 p STARTED

wikinews 0 r UNASSIGNED INDEX_CREATED

document number를 샤드단위로 볼 수 있기 때문에 라우팅 테스트를 쉽게 할 수 있다.

documents 1 p STARTED 3 9.6kb 127.0.0.1 5OEGj_a

documents 0 p STARTED 1 3.2kb 127.0.0.1 5OEGj_a

저작자표시

'Elasticsearch' 카테고리의 다른 글

[elasticsearch 5] _cat/nodes (0)	2017.05.23
[elasticsearch 5] bootstrap 검사 (0)	2017.05.22
[elasticsearch 5] 인덱스 통계 보기 (0)	2017.05.17
[elasticsearch 5] 매트릭스 통계(matrix stats) (0)	2017.05.17
[elasticsearch 5] 파이프라인 집계 (0)	2017.05.17

Posted by '김용환'

,

feature toggle 용어

영어앤영문권 2017. 5. 20. 06:39

특정 기능 여부를 실행하게 하려면

또는 A/B 테스트 여부를 실행하게 하려면

또는 트래픽을 특정 서버에 보내거나 안 보내게 하려면

Flag 같은 기능을 써서 사용한다.

보통 이 Flag는 자바로 하면 property 파일 또는 실행시 -D옵션으로 전달하는 매개 변수로 사용했었다.

요즘에는 분산 coordinator인 zookeeper를 이용해 Flag 여부를 사용해 개발한다.

이런 형태의 고급 용어를 feature toogle이라 불리는 것 같다. 아마도 이렇게들 개발은 할텐데.. 막상 IT 영어로는 잘 모를 수 있다.

참고 자료.

https://martinfowler.com/articles/feature-toggles.html

저작자표시

'영어앤영문권' 카테고리의 다른 글

=> 를 영어로 어떻게 발음할까? (0)	2017.11.24
언커링: dual transformation/double transformation (0)	2017.11.21
[it] 결과를 씹다. - eat the result (0)	2017.01.16
plausible reasoning (0)	2016.09.21
parameter sweep - 매개변수 비우기, 매개변수로 전달하기 (0)	2016.09.21

Posted by '김용환'

,

[spark2] spark SQL 예제

scala 2017. 5. 20. 06:33

Spark sql 예제이다.

scala> val dataset = Seq("samuel", "jackson", "kin").toDF("name_string")

dataset: org.apache.spark.sql.DataFrame = [name_string: string]

scala> dataset.registerTempTable("names")

warning: there was one deprecation warning; re-run with -deprecation for details

scala> sql("""select name_string from names""").show

+-----------+

|name_string|

+-----------+

| samuel|

| jackson|

| kin|

+-----------+

scala> sql("""select name_string from names where name_string ='kin' """).show

+-----------+

|name_string|

+-----------+

| kin|

+-----------+

like 검색은 조금 신경써서 해야 한다.

일반적인 like 검색일 때는 결과가 나타나지 않는다.

scala> sql("""select name_string from names where name_string like '*' """).show

+-----------+

|name_string|

+-----------+

like concat을 사용하면 like 검색을 할 수 있다.

scala> sql("""select name_string from names where name_string like concat('%','sam','%') """).show

+-----------+

|name_string|

+-----------+

| samuel|

+-----------+

오래전 부터 SQL문이 아닌 ETL 파이프라인 방식으로 사용할 수도 있었다.

(ETL 파이프은 조금 쓰기 불편하다.. )

scala> dataset.groupBy("name_string").count().filter($"count" >= 1).show()

+-----------+-----+

|name_string|count|

+-----------+-----+

| jackson| 1|

| kin| 1|

| samuel| 1|

+-----------+-----+

scala> dataset.groupBy("name_string").count().filter($"count" >= 2).show()

+-----------+-----+

|name_string|count|

+-----------+-----+

scala> dataset.select("name_string").show()

+-----------+

|name_string|

+-----------+

| samuel|

| jackson|

| kin|

+-----------+

scala> dataset.select("name_string").where($"name_string".equalTo("samuel")).show()

+-----------+

|name_string|

+-----------+

| samuel|

+-----------+

scala> dataset.select("name_string").where($"name_string".contains("sam")).show()

+-----------+

|name_string|

+-----------+

| samuel|

+-----------+

scala> dataset.select("name_string").groupBy($"name_string").count().show()

+-----------+-----+

|name_string|count|

+-----------+-----+

| jackson| 1|

| kin| 1|

| samuel| 1|

+-----------+-----+

그리고 Spark SQL에는 다양한 UDF 함수를 지원한다. 다음은 관련 예제이다.

scala> val dataset2 = Seq(("samuel", "01/05/2017"), ("noah", "01/05/2018"))

dataset2: Seq[(String, String)] = List((samuel,01/05/2017), (noah,01/05/2018))

scala> val dataset2 = Seq(("samuel", "01/05/2017"), ("noah", "01/05/2018")).toDF("name", "create_date")

dataset2: org.apache.spark.sql.DataFrame = [name: string, create_date: string]

scala> dataset2.registerTempTable("reservation")

warning: there was one deprecation warning; re-run with -deprecation for details

scala> sql("""SELECT * from reservation""").show

+------+-----------+

| name|create_date|

+------+-----------+

|samuel| 01/05/2017|

| noah| 01/05/2018|

+------+-----------+

몇 요일인지 확인하려면 다음과 같다.

scala> sql("""SELECT name,create_date,from_unixtime(unix_timestamp(create_date, 'MM/dd/yyyy'), 'EEEE') as day from reservation where name='samuel' """).show

+------+-----------+--------+

| name|create_date| day|

+------+-----------+--------+

|samuel| 01/05/2017|Thursday|

+------+-----------+--------+

이번에는 cass class를 이용한 sql 작업이다.

scala> case class Num(x:Int)

defined class Num

scala> val rdd=sc.parallelize(List(Num(1), Num(2), Num(3)))

rdd: org.apache.spark.rdd.RDD[Num] = ParallelCollectionRDD[12] at parallelize at <console>:34

scala> spark.createDataFrame(rdd).show

+---+

| x|

+---+

| 1|

| 2|

| 3|

+---+

scala> val df = spark.createDataFrame(rdd)

df: org.apache.spark.sql.DataFrame = [x: int]

scala> df.registerTempTable("num")

warning: there was one deprecation warning; re-run with -deprecation for details

scala> sql("""select * from num where x=2""").show

+---+

| x|

+---+

| 2|

+---+

저작자표시

'scala' 카테고리의 다른 글

[spark] join 예제 (0)	2017.05.23
[spark] where과 filter의 차이 (0)	2017.05.23
[spark2] spark2 rdd 생성 -makeRDD (0)	2017.04.29
[scala] 라인 피드("\n") 관련 예시 코드 (0)	2017.04.24
[scala] Iterator의 continually함수 (0)	2017.04.24

Posted by '김용환'

,

'분류 전체보기'에 해당되는 글 4074건

[spark] join 예제

'scala' 카테고리의 다른 글

[spark] where과 filter의 차이

defwhere(condition: Column): DataFrame

'scala' 카테고리의 다른 글

[성과] OKR

'scribbling' 카테고리의 다른 글

[elasticsearch 5] _cat/nodes

'Elasticsearch' 카테고리의 다른 글

[elasticsearch 5] bootstrap 검사

'Elasticsearch' 카테고리의 다른 글

[펌] uber 아키텍처

'scribbling' 카테고리의 다른 글

[nginx] no live upstreams while connecting to upstream 에러의 트러블 슈팅

'nginx' 카테고리의 다른 글

[elasticsearch 5] _cat/shards

'Elasticsearch' 카테고리의 다른 글

feature toggle 용어

'영어앤영문권' 카테고리의 다른 글

[spark2] spark SQL 예제

'scala' 카테고리의 다른 글

카테고리

태그목록

최근에 올라온 글

최근에 달린 댓글

최근에 받은 트랙백

글 보관함

달력

링크

티스토리툴바