'2018/10 글 목록 (2 Page)

'2018/10'에 해당되는 글 21건

2018.10.20 크롬 브라우저의 쿠기 확인하기 - sqlite
2018.10.20 [python] 모듈 프로그래밍 환경 설정 (ModuleNotFoundError 에러 해결)
2018.10.19 [펌] commit 정리하기에 정말 좋은 git rebase 참조 링크,
2018.10.18 mac OS에서 분할 압축
2018.10.17 java.io.IOException: Unable to open "edu/stanford/nlp/models/pos-tagger/english-left3words/english-left3words-distsim.tagger" as class path, filename or URL 해결하기
2018.10.16 쿠버네티스 + 스파크 연동 참조 자료(spark 2.3.0)
2018.10.16 linkerd 버전 2 언어를 scala에서 go로 변경
2018.10.12 [spark] 기본 파티션 개수
2018.10.12 파이썬에서 selenium과 phantomjs를 연동한 간단 예시
2018.10.11 [scala] 암시 - 타입 어노테이션 관련

크롬 브라우저의 쿠기 확인하기 - sqlite

Web service 2018. 10. 20. 13:41

맥 High Sierra OS 버전의 크롬 브라우저의 쿠키를 확인하려면 sqlite를 확인하면 된다.

table을 확인할 수 있고

schema를 사용하면 스키마 정보를 볼 수 있다.

$ cd /Users/sameul/Library/Application Support/Google/Chrome/Default

$ sqlite3 Cookies

SQLite version 3.19.3 2017-06-27 16:48:08

Enter ".help" for usage hints.

sqlite> .tables

cookies meta

sqlite> .schema

CREATE TABLE meta(key LONGVARCHAR NOT NULL UNIQUE PRIMARY KEY, value LONGVARCHAR);

CREATE TABLE cookies (creation_utc INTEGER NOT NULL,host_key TEXT NOT NULL,name TEXT NOT NULL,value TEXT NOT NULL,path TEXT NOT NULL,expires_utc INTEGER NOT NULL,is_secure INTEGER NOT NULL,is_httponly INTEGER NOT NULL,last_access_utc INTEGER NOT NULL, has_expires INTEGER NOT NULL DEFAULT 1, is_persistent INTEGER NOT NULL DEFAULT 1,priority INTEGER NOT NULL DEFAULT 1,encrypted_value BLOB DEFAULT '',firstpartyonly INTEGER NOT NULL DEFAULT 0,UNIQUE (host_key, name, path));

sqlite3에 읽을 데이터 파일 이름을 주지 않아도 .open 커맨드를 사용해 파일을 읽을 수 있다.

$ sqlite3

SQLite version 3.19.3 2017-06-27 16:48:08

Enter ".help" for usage hints.

Connected to a transient in-memory database.

Use ".open FILENAME" to reopen on a persistent database.

sqlite> .open Cookies

cookies 테이블 정보를 인덴트를 주어 보고 싶다면 다음 커맨드를 사용한다.

sqlite> .schema --indent cookies

CREATE TABLE cookies(

creation_utc INTEGER NOT NULL,

host_key TEXT NOT NULL,

name TEXT NOT NULL,

value TEXT NOT NULL,

path TEXT NOT NULL,

expires_utc INTEGER NOT NULL,

is_secure INTEGER NOT NULL,

is_httponly INTEGER NOT NULL,

last_access_utc INTEGER NOT NULL,

has_expires INTEGER NOT NULL DEFAULT 1,

is_persistent INTEGER NOT NULL DEFAULT 1,

priority INTEGER NOT NULL DEFAULT 1,

encrypted_value BLOB DEFAULT '',

firstpartyonly INTEGER NOT NULL DEFAULT 0,

UNIQUE(host_key, name, path)

);

encrypted_value를 보려면 파이썬을 활용할 수 있다.

저작자표시 비영리 동일조건

'Web service' 카테고리의 다른 글

[sentry] nginx, PG 매개 변수 튜닝 (0)	2019.03.21
firefox 쿠키 파싱하기 - lz4json (0)	2018.10.23
[jquery] file upload 예제 (0)	2017.05.30
구글 place api : request_denied (0)	2016.06.28
HTTPS 페이지에서 HTTP 페이지로 링크로 넘어갈 때, 브라우져에서 Referer 안 남기는 이유 (0)	2016.03.24

Posted by '김용환'

[python] 모듈 프로그래밍 환경 설정 (ModuleNotFoundError 에러 해결)

python 2018. 10. 20. 10:33

파이썬에서 모듈 프로그래밍(디렉토리 , ___init__.py)를 진행할 때,

ModuleNotFoundError를 부딪힐 일이 있다.

$ python util/scrapers.py

Traceback (most recent call last):

File "util/scrapers.py", line 3, in <module>

from util.all_scrapers import re_scraper, bs_scraper, \

ModuleNotFoundError: No module named 'util'

이 이유는 파이썬 패스를 못찾다 보니 모듈을 찾지 못한 것이다.

PYTHONPATH를 bash 설정 파일(예, bash_profile)에 지정하면 된다.

$ cat ~/bash_profile

PYTHONPATH=$PYTHONPATH:/~/dev/python/scraping/code

export PYTHONPATH

저작자표시 비영리 동일조건

'python' 카테고리의 다른 글

python으로 해결하는 JSONP 파싱 예시 (0)	2018.11.06
pip 설치 모듈 확인하기 (0)	2018.10.25
파이썬에서 selenium과 phantomjs를 연동한 간단 예시 (0)	2018.10.12
파이썬의 try ... import .. except 예시 (0)	2018.10.08
파이썬의 선(Zen of Python) (0)	2018.09.23

Posted by '김용환'

[펌] commit 정리하기에 정말 좋은 git rebase 참조 링크,

scribbling 2018. 10. 19. 15:40

commit 정리하기에 정말 좋은 git rebase 참조 링크,

* 개념

http://dogfeet.github.io/articles/2012/git-merge-rebase.html

* rebase 활용 사례

https://wckhg89.github.io/archivers/rebase

저작자표시 비영리 동일조건

'scribbling' 카테고리의 다른 글

okhttp3와 moshi 개발이 편하다.. (0)	2018.11.06
구글 드라이브 용량 부족시 해결 방법 (0)	2018.10.22
[macos] no valid sudoers sources found, quitting 해결, sudo 이슈 해결하기 (0)	2018.09.25
[펌] maven/gradle 도커 빌드 (0)	2018.09.05
OpenTsdb 분석 (0)	2018.08.31

Posted by '김용환'

mac OS에서 분할 압축

etc tools 2018. 10. 18. 19:46

zip은 표준을 지키기 때문에 분할 압축 기능을 지원하지 않는다.

그러나 7zip은 압축도 좋고 분할 압축이 가능하다.

mac OS에서 brew를 통해 7zip을 다운받는다.

$ brew update

$ brew install p7zip

zip -9 (압축률 최고) 보다 7zip이 더 압축률이 좋다.

압축 / 해지 방법

$ 7z a rating.zip rating.csv

$ 7z x rating.zip

500메가 텍스트 파일을 압축할 때,

zip으로 압축하면 130메가 짜리 압축 파일을..

7zip으로 압축하면 80메가 짜리 찹축 파일을 생성한다.

압축 파일을 용량 단위로 분할 압축할 수 있다. 단점은 하나의 파일로 압축하는 것보다 용량이 더 커질 수 있다는 단점이 있다.

예)

$ 7z a ratings.zip ratings.csv -v50m

-rw-r--r-- 1 samuel.kim staff 52428800 10 18 19:43 ratings.zip.001

-rw-r--r-- 1 samuel.kim staff 52428800 10 18 19:43 ratings.zip.002

-rw-r--r-- 1 samuel.kim staff 2845551 10 18 19:43 ratings.zip.003

저작자표시 비영리 동일조건

'etc tools' 카테고리의 다른 글

Squirrel SQL 설치 후 실행 이상시 참조할 내용 (0)	2018.10.30
git - pull request할 때 발생할 수 있는 업스트림 처리 (0)	2018.10.22
[윈도우] powershell을 admin권한으로 실행하기 (0)	2018.07.25
[git] commit/push한 내용을 수정해서 다시 commit/push하기 (0)	2018.06.20
grafana 웹에서 버전 확인하기 (0)	2018.05.17

Posted by '김용환'

java.io.IOException: Unable to open "edu/stanford/nlp/models/pos-tagger/english-left3words/english-left3words-distsim.tagger" as class path, filename or URL 해결하기

general java 2018. 10. 17. 13:43

stanford의 corenlp를 사용하다 다음과 같은 에러가 발생하면

Exception in thread “main” java.lang.RuntimeException: edu.stanford.nlp.io.RuntimeIOException: Error while loading a tagger model (probably missing model file)

java.io.IOException: Unable to open "edu/stanford/nlp/models/pos-tagger/english-left3words/english-left3words-distsim.tagger"

as class path, filename or URL at edu.stanford.nlp.io.IOUtils.getInputStreamFromURLOrClasspathOrFileSystem(IOUtils.java:485) at

edu.stanford.nlp.tagger.maxent.MaxentTagger.readModelAndInit(MaxentTagger.java:765) ... 11 more

classifier "models"을 따로 임포트해야 한다.

libraryDependencies += "edu.stanford.nlp" % "stanford-corenlp" % "3.9.1"

libraryDependencies += "edu.stanford.nlp" % "stanford-corenlp" % "3.9.1" classifier "models"

버전 정보는 아래를 확인한다.

https://mvnrepository.com/artifact/edu.stanford.nlp/stanford-corenlp

저작자표시 비영리 동일조건

'general java' 카테고리의 다른 글

[debezium] 일반적인 설정 (0)	2019.03.21
intellij 기본 jvm 메모리 설정 변경 (느린 이유는 intellij 메모리 설정) (0)	2019.01.24
리눅스 장비에서 사용 중인 jenkins plugin 목록 뽑기 (0)	2018.09.12
spring logback json 출력 (0)	2018.08.20
javax.validation.ValidationException: HV000183: Unable to initialize 'javax.el.ExpressionFactory'. 해결하기 (0)	2018.07.30

Posted by '김용환'

쿠버네티스 + 스파크 연동 참조 자료(spark 2.3.0)

Cloud 2018. 10. 16. 17:21

쿠버네티스 + 스파크 예시

https://weidongzhou.wordpress.com/2018/04/29/running-spark-on-kubernetes/

https://medium.com/@timfpark/cloud-native-big-data-jobs-with-spark-2-3-and-kubernetes-938b04d0da57

저작자표시 비영리 동일조건

'Cloud' 카테고리의 다른 글

[kubernetes] namespace에 자원 제한(reousrce limit) 예시 (0)	2018.11.26
[kubernetes] 자원 제약(resource limit) 걸기 예제 (0)	2018.11.26
linkerd 버전 2 언어를 scala에서 go로 변경 (0)	2018.10.16
[kubernetes] pods 재시작하기 (0)	2018.09.19
[docker] [jenkins] BUILD_URL 설정이 안되면. 새로운 글로벌 변수를 정의한다. (0)	2018.09.17

Posted by '김용환'

linkerd 버전 2 언어를 scala에서 go로 변경

Cloud 2018. 10. 16. 11:49

쿠버네티스의 service discovery 컴포넌트로 istio와 linkered가 있는데..

https://linkerd.io/ 는 version 1(https://github.com/linkerd/linkerd)은 스칼라로 개발되었는데..

version2(https://github.com/linkerd/linkerd2)부터는 go언어로 개발되었다.

go로 간 이유는 성능적인 요소와 쿠버네티스 생태계에 가까워지기 위함이라고 한다.

참고

https://www.sdxcentral.com/articles/news/linkerd-2-0-update-moves-closer-to-kubernetes/2018/09/

저작자표시 비영리 동일조건

'Cloud' 카테고리의 다른 글

[kubernetes] 자원 제약(resource limit) 걸기 예제 (0)	2018.11.26
쿠버네티스 + 스파크 연동 참조 자료(spark 2.3.0) (0)	2018.10.16
[kubernetes] pods 재시작하기 (0)	2018.09.19
[docker] [jenkins] BUILD_URL 설정이 안되면. 새로운 글로벌 변수를 정의한다. (0)	2018.09.17
jenkins-docker (master-slave) 구축할 때 유의사항 (0)	2018.09.14

Posted by '김용환'

[spark] 기본 파티션 개수

scala 2018. 10. 12. 15:22

scala> val rdd_one = sc.parallelize(Seq(1,2,3))

rdd_one: org.apache.spark.rdd.RDD[Int] = ParallelCollectionRDD[0] at parallelize at <console>:24

scala> rdd_one.getNumPartitions

res0: Int = 12

scala>

scala> sc.defaultParallelism

res1: Int = 12

기본 파티션 개수는 cpu 개수를 기반으로 만들어지거나 (장비별로 다른 값이 나옴, defaultParallelism으로 확인할 수 있다.) 스파크 설정 매개 변수 spark.default.parallelism 또는 클러스터의 코어 개수 중 하나이다

그외에 큰 자원을 읽을 때 기본 파티션 개수가 변경될 수 있다.

파티션 개수는 RDD 트랜스포메이션을 실행할 태스크 수에 직접적인 영향을 주기 때문에 파티션 개수가 중요하다.

파티션 개수가 너무 적으면 많은 데이터에서 아주 일부의 CPU/코어만 사용하기 때문에 성능이 저하되고 클러스터를 제대로 활용하지 못하게 된다.

반면에 파티션 개수가 너무 많으면 실제로 필요한 것보다 많은 자원을 사용하기 때문에 멀티 테넌트 환경에서는 자원 부족 현상이 발생할 수 있다.

저작자표시 비영리 동일조건

'scala' 카테고리의 다른 글

Unable to find encoder for type stored in a Dataset. Primitive types (Int, String, etc) and Product types (case classes) are supported by importing spark.im plicits._ Support for serializing other types will be added in future releases. (0)	2018.10.29
[spark] - spark streaming의 누산기 예시 (0)	2018.10.25
[spark] "랜덤 포레스트를 이용한 MNIST 데이터셋 분류" 예 (0)	2018.06.01
[spark] 로지스틱 회귀 분석을 이용한 멀티 클래스 분류 (0)	2018.05.31
[spark] spark-shell 메모리/cpu 설정 (0)	2018.05.31

Posted by '김용환'

파이썬에서 selenium과 phantomjs를 연동한 간단 예시

python 2018. 10. 12. 10:38

파이썬에서 selenium과 phantomjs를 연동한 간단 예시이다.

>>> from selenium import webdriver

>>> driver = webdriver.Firefox()

이전 커맨드를 실행하면 빈 브라우저 창이 열린다. 에러가 발생하면 geckodriver(https://github.com/mozilla/geckodriver/releases)를 설치하고 geckodriver를 사용할 수 있도록 PATH 변수에 추가해야 한다.

geckodriver 파일을 압축을 푼 후 바이너르를 PATH에 추가한 후, executable(예, chmod 755)로 변경한다.

>>> driver.get('https://www.google.com')

driver를 사용해 엘리먼트를 파싱하거나, 파이어폭스가 커맨드를 따라 변경되는 것을 볼 수 있다.

phantomjs와 같은 헤드리스 브라우져와 연동할 수 있다.

http://phantomjs.org/download.html

>>> from selenium import webdriver

>>> driver = webdriver.PhantomJS()

패스에 넣거나 다음처럼 phantomjs 경로를 사용할 수 있다.

>>> driver = webdriver.PhantomJS('utils/phantomsjs')

>>> driver.get('http://python.org')

>>> driver.save_screenshot('python_website.png')

True

이렇게 파일을 확인할 수 있다.

스크린 샷 파일이 긴 윈도우이다. maximize_window를 사용하거나 set_window_size로 윈도우 크기를 설정해 윈도우 크기를 변경할 수 있다.

https://selenium-python.readthedocs.io/api.html

저작자표시 비영리 동일조건

'python' 카테고리의 다른 글

pip 설치 모듈 확인하기 (0)	2018.10.25
[python] 모듈 프로그래밍 환경 설정 (ModuleNotFoundError 에러 해결) (0)	2018.10.20
파이썬의 try ... import .. except 예시 (0)	2018.10.08
파이썬의 선(Zen of Python) (0)	2018.09.23
[python] pickle 예시 (0)	2018.09.12

Posted by '김용환'

[scala] 암시 - 타입 어노테이션 관련

카테고리 없음 2018. 10. 11. 16:04

(상당히 유명한 내용이긴 한데. 암시를 처음보는 분들이 헤매는 내용이라 정리한다)

scala에서 double 타입의 값을 int 변수에 저장하려 하면 반드시 타입 에러가 난다.

scala> val x:Int = 18.0

<console>:11: error: type mismatch;

found : Double(18.0)

required: Int

val x:Int = 18.0

그래서 이를 위해서는 double을 int로 변경하는 함수가 필요하다.

scala> def doubleToInt(d:Double) = d.toInt

doubleToInt: (d: Double)Int

scala> val x:Int = doubleToInt(18.0)

x: Int = 18

값을 사용하는 시점에 컴파일러가 타입을 확인해서 암시를 적용한다.

scala> implicit def doubleToInt(d: Double) = d.toInt

doubleToInt: (d: Double)Int

scala> val x:Int = 18.0

x: Int = 18

저작자표시 비영리 동일조건

Posted by '김용환'

이전 1 2 3 다음

'2018/10'에 해당되는 글 21건

크롬 브라우저의 쿠기 확인하기 - sqlite

'Web service' 카테고리의 다른 글

[python] 모듈 프로그래밍 환경 설정 (ModuleNotFoundError 에러 해결)

'python' 카테고리의 다른 글

[펌] commit 정리하기에 정말 좋은 git rebase 참조 링크,

'scribbling' 카테고리의 다른 글

mac OS에서 분할 압축

'etc tools' 카테고리의 다른 글

java.io.IOException: Unable to open "edu/stanford/nlp/models/pos-tagger/english-left3words/english-left3words-distsim.tagger" as class path, filename or URL 해결하기

'general java' 카테고리의 다른 글

쿠버네티스 + 스파크 연동 참조 자료(spark 2.3.0)

'Cloud' 카테고리의 다른 글

linkerd 버전 2 언어를 scala에서 go로 변경

'Cloud' 카테고리의 다른 글

[spark] 기본 파티션 개수

'scala' 카테고리의 다른 글

파이썬에서 selenium과 phantomjs를 연동한 간단 예시

'python' 카테고리의 다른 글

[scala] 암시 - 타입 어노테이션 관련

카테고리

태그목록

최근에 올라온 글

최근에 달린 댓글

최근에 받은 트랙백

글 보관함

달력

링크

티스토리툴바