'scala' 카테고리의 글 목록 (17 Page)

Intellij에서 scala-play2 환경 구축하기

scala 2017. 3. 8. 18:21

Intellij에서 play2를 import했지만, scala object를 추가하기 어렵고 play스럽지 않아서 개발이 불편할 수 있다.

만약 아래와 같은 문구까지 나오면 다음 팁을 따른다.

Info: SBT compilation for play framework 2.x disabled by default

1) Intellij 설정 변경

Settings -> Langauges & Frameworks -> Play2 -> Compiler -> User Play 2 compiler for this project.

Info: SBT compilation for play framework 2.x disabled by default이 나오면 Intellij를 재시작한다.

2) 프로젝트 설정 변경

프로젝트에서 마우스 오른쪽 클릭 -> Add Framework Support -> Play2 추가.

저작자표시 (새창열림)

'scala' 카테고리의 다른 글

[scala] 컬렉션의 head,last,init,lastOption,tail 예제 (0)	2017.03.09
[scala] 컬렉션의 take,drop,dropRight,takeWhile,slice 예제 (0)	2017.03.09
[scala] scala.collection.GenTraversableOnce[?] 해결 하기 (0)	2017.03.07
[scala] List와 Array의 lift 메소드 (0)	2017.03.04
[펌] spark 2.0 소개(성능) (0)	2017.03.02

Posted by '김용환'

,

[scala] scala.collection.GenTraversableOnce[?] 해결 하기

scala 2017. 3. 7. 20:07

scala의 collection에서 [error] required: scala.collection.GenTraversableOnce[?] 에러가 나는 경우가 있다..

예)

scala> List(1, "x").flatten

<console>:12: error: No implicit view available from Any => scala.collection.GenTraversableOnce[B].

List(1, "x").flatten

scala> List(1, "x").flatMap(a => a)

<console>:12: error: type mismatch;

found : Any

required: scala.collection.GenTraversableOnce[?]

List(1, "x").flatMap(a => a)

^

실제 api를 보면 다음과 같이 A => GenTraversableOnce라는 타입을 받는다.

def flatten[B](implicit asTraversable: A => /*<:<!!!*/ GenTraversableOnce[B]): CC[B] = {

final override def flatMap[B, That](f: A => GenTraversableOnce[B])
                       (implicit bf: CanBuildFrom[List[A], B, That]): That = {

재미있는 것은 Option은 GenTraversableOnce으로 implicit으로 변환할 수 있다.

이전에 에러를 수정하려면 다음처럼 수정하면 될 것이다.

scala> List(Some(1), Some("x"), None).flatten

res9: List[Any] = List(1, x)

scala> List(1, "x").flatMap(a => Some(a))

res8: List[Any] = List(1, x)

저작자표시 (새창열림)

'scala' 카테고리의 다른 글

[scala] 컬렉션의 take,drop,dropRight,takeWhile,slice 예제 (0)	2017.03.09
Intellij에서 scala-play2 환경 구축하기 (0)	2017.03.08
[scala] List와 Array의 lift 메소드 (0)	2017.03.04
[펌] spark 2.0 소개(성능) (0)	2017.03.02
[spark] spark의 OutOfMemoryError 발생시 (0)	2017.02.24

Posted by '김용환'

,

Intellij에서 scala-play2 환경 구축하기 (0)	2017.03.08
[scala] scala.collection.GenTraversableOnce[?] 해결 하기 (0)	2017.03.07
[펌] spark 2.0 소개(성능) (0)	2017.03.02
[spark] spark의 OutOfMemoryError 발생시 (0)	2017.02.24
[spark] spark summit 자료 (0)	2017.02.22

primitive	Spark 1.6	Spark 2.0
filter	15ns	1.1ns
sum w/o group	14ns	0.9ns
sum w/ group	79ns	10.7ns
hash join	115ns	4.0ns
sort (8-bit entropy)	620ns	5.3ns
sort (64-bit entropy)	620ns	40ns
sort-merge join	750ns	700ns

[scala] scala.collection.GenTraversableOnce[?] 해결 하기 (0)	2017.03.07
[scala] List와 Array의 lift 메소드 (0)	2017.03.04
[spark] spark의 OutOfMemoryError 발생시 (0)	2017.02.24
[spark] spark summit 자료 (0)	2017.02.22
[scala] Array.transpose 예시 (0)	2017.02.17

[spark] spark의 OutOfMemoryError 발생시

scala 2017. 2. 24. 12:21

Spark에서 Executor 또는 Driver의 메모리가 너무 적으면 OutOfMemoryError가 발생할 수 있다.

WARN TaskSetManager: Lost task 68.0 in stage 9.0 (TID 510, story-hadoop-dn11.dakao.io): java.lang.OutOfMemoryError: GC overhead limit exceeded

	at java.io.ObjectStreamClass.newInstance(ObjectStreamClass.java:967)
	at java.io.ObjectInputStream.readOrdinaryObject(ObjectInputStream.java:1785)
	at java.io.ObjectInputStream.readObject0(ObjectInputStream.java:1351)
	at java.io.ObjectInputStream.readObject(ObjectInputStream.java:371)
	at org.apache.spark.serializer.JavaDeserializationStream.readObject(JavaSerializer.scala:76)
	at org.apache.spark.serializer.DeserializationStream.readKey(Serializer.scala:169)
	at org.apache.spark.serializer.DeserializationStream$$anon$2.getNext(Serializer.scala:201)
	at org.apache.spark.serializer.DeserializationStream$$anon$2.getNext(Serializer.scala:198)
	at org.apache.spark.util.NextIterator.hasNext(NextIterator.scala:73)
	at scala.collection.Iterator$$anon$12.hasNext(Iterator.scala:396)
	at scala.collection.Iterator$$anon$11.hasNext(Iterator.scala:369)
	at org.apache.spark.util.CompletionIterator.hasNext(CompletionIterator.scala:32)
	at org.apache.spark.InterruptibleIterator.hasNext(InterruptibleIterator.scala:39)
	at scala.collection.Iterator$class.foreach(Iterator.scala:742)
	at org.apache.spark.InterruptibleIterator.foreach(InterruptibleIterator.scala:28)
	at org.apache.spark.rdd.SubtractedRDD.integrate$1(SubtractedRDD.scala:122)
	at org.apache.spark.rdd.SubtractedRDD.compute(SubtractedRDD.scala:127)
	at org.apache.spark.rdd.RDD.computeOrReadCheckpoint(RDD.scala:306)

Spark는 모두 메모리에 올리기 때문에. 이런 현상이 자주 발생될 수 있는데,

해결하기 위해서는 Hdfs 파일의 크기(압축이라면 이에 맞게 *8 또는 *10해서 대략 예측 크기를 고려한다)

core 개수와 driver, executer 메모리도 이에 맞게 늘리면 더 이상 문제가 발생하지 않는다.

저작자표시 (새창열림)

'scala' 카테고리의 다른 글

[scala] List와 Array의 lift 메소드 (0)	2017.03.04
[펌] spark 2.0 소개(성능) (0)	2017.03.02
[spark] spark summit 자료 (0)	2017.02.22
[scala] Array.transpose 예시 (0)	2017.02.17
[spark1.6] rdd를 dataframe으로 만드는 방법 (0)	2017.02.14

Posted by '김용환'

,

[펌] spark 2.0 소개(성능) (0)	2017.03.02
[spark] spark의 OutOfMemoryError 발생시 (0)	2017.02.24
[scala] Array.transpose 예시 (0)	2017.02.17
[spark1.6] rdd를 dataframe으로 만드는 방법 (0)	2017.02.14
[spark] foreachPartition 예시 (0)	2017.02.14

[spark] spark의 OutOfMemoryError 발생시 (0)	2017.02.24
[spark] spark summit 자료 (0)	2017.02.22
[spark1.6] rdd를 dataframe으로 만드는 방법 (0)	2017.02.14
[spark] foreachPartition 예시 (0)	2017.02.14
[zepplin] 여러 spark context 사용하기 (0)	2017.02.14

[spark1.6] rdd를 dataframe으로 만드는 방법

scala 2017. 2. 14. 17:35

rdd를 dataframe으로 만드는 방법 (1.6)

1) SQLContext를 사용하는 방법

val sqlContext = new SQLContext(sc)

import sqlContext.implicits._

rdd.toDF()

2) HiveContext를 이용해 DataFrame.createDataframe 이용

import scala.io.Source

import org.apache.spark.sql.types._

import org.apache.spark.sql.Row

import org.apache.spark.SparkConf

import org.apache.spark.SparkContext

import org.apache.spark.sql.hive.HiveContext

val peopleRDD = sc.textFile(filename)

val schemaString = "name age"

val fields = schemaString.split(" ")

.map(fieldName => StructField(fieldName, StringType, nullable = true))

val schema = StructType(fields)

val rowRDD = peopleRDD

.map(_.split(","))

.map(attributes => Row(attributes(0), attributes(1).trim))

val sqlContext = new HiveContext(sc)

val peopleDF = sqlContext.createDataFrame(rowRDD, schema)

peopleDF.registerTempTable("people")

val results = sqlContext.sql("SELECT name FROM people")

results.collect().foreach(println)

저작자표시 (새창열림)

'scala' 카테고리의 다른 글

[spark] spark summit 자료 (0)	2017.02.22
[scala] Array.transpose 예시 (0)	2017.02.17
[spark] foreachPartition 예시 (0)	2017.02.14
[zepplin] 여러 spark context 사용하기 (0)	2017.02.14
scala에서 uuid 생성하는 방법 (0)	2017.02.09

Posted by '김용환'

,

[scala] Array.transpose 예시 (0)	2017.02.17
[spark1.6] rdd를 dataframe으로 만드는 방법 (0)	2017.02.14
[zepplin] 여러 spark context 사용하기 (0)	2017.02.14
scala에서 uuid 생성하는 방법 (0)	2017.02.09
[scala] spark에서 partition 줄이기 - repartition, coalesce (0)	2017.02.08

[zepplin] 여러 spark context 사용하기

scala 2017. 2. 14. 10:52

zepplin에서 spark을 테스트하다가 아래와 같은 에러를 만날 수 있다.

여러 spark context가 쓰인 이유인데, allowMultipleContext를 true로 설정하면 문제가 없다.

org.apache.spark.SparkException: Only one SparkContext may be running in this JVM (see SPARK-2243). To ignore this error, set spark.driver.allowMultipleContexts = true. The currently running SparkContext was created at:

문제 해결

val sparkConf = new SparkConf()

.setAppName("abc")

.set("spark.driver.allowMultipleContexts", "true");

저작자표시 (새창열림)

'scala' 카테고리의 다른 글

[spark1.6] rdd를 dataframe으로 만드는 방법 (0)	2017.02.14
[spark] foreachPartition 예시 (0)	2017.02.14
scala에서 uuid 생성하는 방법 (0)	2017.02.09
[scala] spark에서 partition 줄이기 - repartition, coalesce (0)	2017.02.08
[scala] List concatenation 리스트 결합 예시 (0)	2017.01.11

Posted by '김용환'

,

'scala'에 해당되는 글 273건

Intellij에서 scala-play2 환경 구축하기

'scala' 카테고리의 다른 글

[scala] scala.collection.GenTraversableOnce[?] 해결 하기

'scala' 카테고리의 다른 글

[scala] List와 Array의 lift 메소드

'scala' 카테고리의 다른 글

[펌] spark 2.0 소개(성능)

'scala' 카테고리의 다른 글

[spark] spark의 OutOfMemoryError 발생시

'scala' 카테고리의 다른 글

[spark] spark summit 자료

'scala' 카테고리의 다른 글

[scala] Array.transpose 예시

'scala' 카테고리의 다른 글

[spark1.6] rdd를 dataframe으로 만드는 방법

'scala' 카테고리의 다른 글

[spark] foreachPartition 예시

'scala' 카테고리의 다른 글

[zepplin] 여러 spark context 사용하기

'scala' 카테고리의 다른 글

카테고리

태그목록

최근에 올라온 글

최근에 달린 댓글

최근에 받은 트랙백

글 보관함

달력

링크

티스토리툴바