일래스틱서치의 phrase 쿼리에 사용할 수 있는 3가지 스무딩 모델에 대한 설명이다. 어려워서 정리해놨다.. 



아래 일래스틱서치 문서를 보면 관련 내용이 잠깐 나온다. 


https://www.elastic.co/guide/en/elasticsearch/reference/current/search-suggesters-phrase.html#_smoothing_models


Smoothing Modelsedit

The phrase suggester supports multiple smoothing models to balance weight between infrequent grams (grams (shingles) are not existing in the index) and frequent grams (appear at least once in the index).

stupid_backoff

a simple backoff model that backs off to lower order n-gram models
if the higher order count is
 0 and discounts the lower order n-gram model by a constant factor. The default discount is 0.4. Stupid Backoff is the default model.

laplace

a smoothing model that uses an additive smoothing where a constant
(typically
 1.0 or smaller) is added to all counts to balance weights, The default alpha is 0.5.

linear_interpolation

a smoothing model that takes the weighted mean of the unigrams,
bigrams and trigrams based on user supplied weights (lambdas).
Linear Interpolation doesn’t have any default values. All parameters (
trigram_lambda, bigram_lambda, unigram_lambda) must be supplied.





stupid backoff는 일래스틱서치의 phrase 제안자에서 사용되는 기본 스무딩 모델이다. 해당 스무딩 모델을 변경하거나 강제로 사용하려면 stupid_backoff라는 이름을 사용해야 한다. stupid backoff 스무딩 모델은 더 높은 차수의 n-gram 개수가 0이면 낮은 차수의 n-gram을 사용하는 구현이다(그리고 stupid_backoff는 discount 속성의 값과 동일한 할인을 제공한다). 예제를 설명하기 위해 일반적이고 제안자가 사용하는 인덱스에 존재하는 ab 바이그램(bigram)과 c 유니그램(unigram)을 사용한다고 가정한다. 그러나 abc 트라이그램(trigram)는 갖고 있지 않다. stupid backoff은 abc가 존재하지 않기 때문에 ab 바이그램을 사용할 것이고 물론 ab 바이그램 모델은 discount 속성의 값과 동일한 할인을 받게 될 것이다.



stupid backoff 모델은 discount 속성이라는 변경할 수 있는 단일 속성을 제공한다. 기본적으로 discount 값은 0.4로 설정되어 있고, 낮은 차수의 n-gram 모델의 discount 인자로 사용된다.

n-gram 스무딩 모델에 대한 자세한 내용은 http://en.wikipedia.org/wiki/N-gram#Smoothing_techniques와 http://en.wikipedia.org/wiki/Katz's_back-off_model(설명한 stupid backoff 모델과 비슷하다)을 통해 더 살펴볼 수 있다.



라플라스(laplace)는 부가적인 스무딩 모델이라 불린다. 라플라스가 사용될 때(라플라스를 사용하려면 laplace 값을 사용해야 한다), alpha 매개 변수의 값과 동일한 상수값(기본값은 0.5 이다)은 빈번하고 자주 발생하지 않는 가중치의 균형을 유지하기 위해 개수에 추가된다. 언급한 것처럼 라플라스는 기본값이 0.5인 alpha 매개 변수를 사용해 설정할 수 있다. 일반적으로 alpha 매개 변수의 일반적인 값은 1.0이하이다.

부가적 스무딩에 대한 자세한 내용은 http://en.wikipedia.org/wiki/Additive_smoothing을 참조한다.



Posted by '김용환'
,


2013년도에 부동산 경기가 좋지 않아서 조세특례제한법 99조 2가 통과되었는데, 

1항에 맞는 조건자에 한해서는 5년간 양도 소득세 면제 뿐 아니라 거주자 소유주택으로 보지 않는다는 특이한 조항이 있다.



이 때 지방 자치단체로부터 확인/날감을 받은 매매계약서에 대해서는 적용이 된다고 한다. 즉, 납세지 관할 세무서장에게 제출한 경우에만 해당 과세특례를 적용받을 수 있다.



또한 2항에 따르면 2013년도에 위 조건에 맞게 부동산을 산 사람은 최소 5년(또는 최대 평생) 무택자가 될 수 있다. 

추후 이 부분은 국세청에 확인할 필요가 있을 것 같다. 





 ○ 조세특례제한법 제99조의 2 【 신축주택 등 취득자에 대한 양도소득세의 과세특례 】

  ① 거주자 또는 비거주자가 대통령령으로 정하는 신축주택, 미분양주택 또는 1세대 1주택자의 주택으로서 취득가액이 6억원 이하이거나 주택의 연면적(공동주택의 경우에는 전용면적)이 85제곱미터 이하인주택을 2013년 4월 1일부터 2013년 12월 31일까지 「주택법」 제38조따라 주택을 공급하는 사업주체 등 대통령령으로 정하는 자와 최초로 매매계약을 체결하여 그 계약에 따라 취득(2013년 12월 31일까지 매매계약을 체결하고 계약금을 지급한 경우를 포함한다)한 경우에 해당 주택을 취득일부터 5년 이내에 양도함으로써 발생하는 양도소득에 대하여는 양도소득세의 100분의 100에 상당하는 세액을 감면하고, 취득일부터 5년이 지난 후에 양도하는 경우에는 해당 주택의 취득일부터 5년간 발생한 양도소득금액을 해당 주택의 양도소득세 과세대상소득금액에서 공제한다. 이 경우 공제하는 금액이과세대상소득금액을 초과하는 경우 그 초과금액은 없는 것으로 한다.

  ②「소득세법」 제89조제1항제3호를 적용할 때 제1항을 적용받는 주택은해당 거주자의 소유주택으로 보지 아니한다.



소득세법 제 89제1항제3호의 내용은 다음과 같다.


. 다음 각 목의 어느 하나에 해당하는 주택(가액이 대통령령으로 정하는 기준을 초과하는 고가주택은 제외한다)과 이에 딸린 토지로서 건물이 정착된 면적에 지역별로 대통령령으로 정하는 배율을 곱하여 산정한 면적 이내의 토지(이하 이 조에서 "주택부수토지"라 한다)의 양도로 발생하는 소득


가. 1세대가 1주택을 보유하는 경우로서 대통령령으로 정하는 요건을 충족하는 주택


나. 1세대가 1주택을 양도하기 전에 다른 주택을 대체취득하거나 상속, 동거봉양, 혼인 등으로 인하여 2주택 이상을 보유하는 경우로서 대통령령으로 정하는 주택


Posted by '김용환'
,