'분류 전체보기' 카테고리의 글 목록 (37 Page)

flask에서 개발할 때 jsonify, json.dump 없이 json 응답 보내기

python 2018. 11. 8. 18:22

flask에서는 json encoder를 사용해서 json 응답을 보내줘야 한다.

예

@app.route("/getEmployeeList") def getEmployeeList(): try: # Initialize a employee list employeeList = [] # create a instances for filling up employee list for i in range(0,2): empDict = { 'firstName': 'Roy', 'lastName': 'Augustine'} employeeList.append(empDict) # convert to json data jsonStr = json.dumps(employeeList) except Exception ,e: print str(e) return jsonify(Employees=jsonStr)

https://codehandbook.org/create-json-using-python-flask/

그러나 flask에 flask-restful을 추가해 설치한후,, 아래와 같이 설정한다면..

from flask import Flask
from flask_restful import Resource, Api

app = Flask(__name__)
api = Api(app)

class HelloWorld(Resource):
    def get(self):
        return {'hello': 'world'}

api.add_resource(HelloWorld, '/')

if __name__ == '__main__':
    app.run(debug=True)

그냥 기본 타입과 collection은 자동으로 json으로 변환한다. 그 이유가 멀까?

json.dump(aaa) 이런 코드가 필요없어서 참 좋았다.

https://github.com/flask-restful/flask-restful/blob/master/flask_restful/__init__.py#L474

make_response()에서 default decorator로 json을 출력한다.

아래 코드를 보면, indent 4칸에 newline으로 예쁘게 출력하는 코드가 있다.

https://github.com/flask-restful/flask-restful/blob/master/flask_restful/representations/json.py

from __future__ import absolute_import
from flask import make_response, current_app
from flask_restful.utils import PY3
from json import dumps


def output_json(data, code, headers=None):
    """Makes a Flask response with a JSON encoded body"""

    settings = current_app.config.get('RESTFUL_JSON', {})

    # If we're in debug mode, and the indent is not set, we set it to a
    # reasonable value here.  Note that this won't override any existing value
    # that was set.  We also set the "sort_keys" value.
    if current_app.debug:
        settings.setdefault('indent', 4)
        settings.setdefault('sort_keys', not PY3)

    # always end the json dumps with a new line
    # see https://github.com/mitsuhiko/flask/pull/1262
    dumped = dumps(data, **settings) + "\n"

    resp = make_response(dumped, code)
    resp.headers.extend(headers or {})
    return resp

저작자표시 비영리 동일조건

'python' 카테고리의 다른 글

[python] subprocess- paramiko 예시 (부제 - TypeError: startswith first arg must be bytes or a tuple of bytes, not str 해결하기) (0)	2018.12.28
[python] pre-commit 추가하기 (0)	2018.11.09
python으로 해결하는 JSONP 파싱 예시 (0)	2018.11.06
pip 설치 모듈 확인하기 (0)	2018.10.25
[python] 모듈 프로그래밍 환경 설정 (ModuleNotFoundError 에러 해결) (0)	2018.10.20

Posted by '김용환'

,

okhttp3와 moshi 개발이 편하다..

scribbling 2018. 11. 6. 18:55

okhttp3와 moshi만 있으면 자바/스칼라 http 통신이 완전 편해진다..

okhttp3와 moshi는 json serialization/deserialization 개발 공부를 크게 낮춘다.

https://github.com/square/okhttp/wiki/Recipes

https://github.com/square/moshi

저작자표시 비영리 동일조건

'scribbling' 카테고리의 다른 글

LB 장비 개념 이해를 도와주는 링크 (0)	2018.11.23
쿠버네티스 네트워킹(kubernetes networking)에 대한 이해를 돕는 링크 (0)	2018.11.22
구글 드라이브 용량 부족시 해결 방법 (0)	2018.10.22
[펌] commit 정리하기에 정말 좋은 git rebase 참조 링크, (0)	2018.10.19
[macos] no valid sudoers sources found, quitting 해결, sudo 이슈 해결하기 (0)	2018.09.25

Posted by '김용환'

,

python으로 해결하는 JSONP 파싱 예시

python 2018. 11. 6. 07:43

python으로 해결하는 JSONP 파싱 예시이다.

>>> import requests

>>> url = '...'

>>> jsonp = requests.get(url % 1000)

>>> jsonp.content

b'callback({"status":{

...

})'

>>> import json

>>> pure_json = jsonp.text[jsonp.text.index('(') + 1 : jsonp.text.rindex(')')]

>>> dealers = json.loads(pure_json)

>>> dealers.keys()

dict_keys(['status'])

>>> dealers['count']

10

저작자표시 비영리 동일조건

'python' 카테고리의 다른 글

[python] pre-commit 추가하기 (0)	2018.11.09
flask에서 개발할 때 jsonify, json.dump 없이 json 응답 보내기 (0)	2018.11.08
pip 설치 모듈 확인하기 (0)	2018.10.25
[python] 모듈 프로그래밍 환경 설정 (ModuleNotFoundError 에러 해결) (0)	2018.10.20
파이썬에서 selenium과 phantomjs를 연동한 간단 예시 (0)	2018.10.12

Posted by '김용환'

,

[spark] Spark Structed Streaming 코드 예시 (value , value.c, value.k2)

scala 2018. 11. 5. 20:28

Spark Structed Streaming 코드로 읽는 부분에 대한 예시

kafka에서 json만 value로 받는다.

json도 필드로, json에 있는 json 값의 내용도 필드로 꺼집어 내서 DataSet으로 구성하는 예이다.

즉,

json 필드는 log 컬럼로,

json 필드의 tag 값은 tag 컬럼으로,

json 필드의 @timestamp 값은 @timestamp 컬럼으로,

json 필드의 uuid는 uuid 컬럼으로 생성해, 총 4개의 컬럼으로 구성하는 예시이다.

val schema = StructType(

List(

StructField("tag", StringType, nullable = true),

StructField("@timestamp", StringType, nullable = true),

StructField("uuid", StringType, nullable = true)

)

val ds = spark.readStream.format("kafka")

.option("kafka.bootstrap.servers", config.getString(s"kafka.$phase.brokers"))

.option("startingOffsets", "latest")

.option("key.deserializer", "classOf[StringDeserializer]")

.option("value.deserializer", "classOf[StringDeserializer]")

.option("subscribe", config.getString(s"kafka.$phase.topic.name"))

.load()

.selectExpr("CAST(value AS STRING)")

.select(from_json($"value", schema).as("data"), col("value").cast("string").as("log"))

.select("data.*", "log")

.withColumnRenamed("tag", "tag")

.withColumnRenamed("@timestamp", "timestamp")

.withColumnRenamed("uuid", "uuid")

.as[(String, String, String, String)]

기초 지식 참고

https://people.apache.org/~pwendell/spark-nightly/spark-master-docs/latest/structured-streaming-kafka-integration.html

저작자표시 비영리 동일조건

'scala' 카테고리의 다른 글

[spark] ERROR 25505: A read-only user or a user in a read-only database is not permitted to disable read-only mode on a connection. 해결하기 (0)	2018.11.29
[spark] 백프레셔(Backpressure) (0)	2018.11.20
[spark] spark structed streaming 코드 + 카산드라 예시 (코드 펌) (0)	2018.11.05
[spark, kafka] object Subscribe in package kafka010 cannot be accessed in package org.apache.spark.streaming.kafka010 , symbol apply is inaccessible from this place 에러 해결하기 (0)	2018.11.02
[spark] spark structured streaming + cassandra 연동 (0)	2018.10.30

Posted by '김용환'

,

[spark] spark structed streaming 코드 + 카산드라 예시 (코드 펌)

scala 2018. 11. 5. 20:20

spark 2.x의 spark structured streaming 예시로 다음 코드를 참고하는 것이 좋다.

아래 코드는 카프카와 카산드라 연동 내용이다.

https://github.com/ansrivas/spark-structured-streaming/blob/master/src/main/scala/com/kafkaToSparkToCass/Main.scala

class SparkJob extends Serializable {

@transient lazy val logger = Logger.getLogger(this.getClass)

logger.setLevel(Level.INFO)

val sparkSession =

SparkSession.builder

.master("local[*]")

.appName("kafka2Spark2Cassandra")

.config("spark.cassandra.connection.host", "localhost")

.getOrCreate()

val connector = CassandraConnector.apply(sparkSession.sparkContext.getConf)

// Create keyspace and tables here, NOT in prod

connector.withSessionDo { session =>

Statements.createKeySpaceAndTable(session, true)

}

private def processRow(value: Commons.UserEvent) = {

connector.withSessionDo { session =>

session.execute(Statements.cql(value.user_id, value.time, value.event))

}

def runJob() = {

logger.info("Execution started with following configuration")

val cols = List("user_id", "time", "event")

import sparkSession.implicits._

val lines = sparkSession.readStream

.format("kafka")

.option("subscribe", "test.1")

.option("kafka.bootstrap.servers", "localhost:9092")

.option("startingOffsets", "earliest")

.load()

.selectExpr("CAST(value AS STRING)",

"CAST(topic as STRING)",

"CAST(partition as INTEGER)")

.as[(String, String, Integer)]

val df =

lines.map { line =>

val columns = line._1.split(";") // value being sent out as a comma separated value "userid_1;2015-05-01T00:00:00;some_value"

(columns(0), Commons.getTimeStamp(columns(1)), columns(2))

}.toDF(cols: _*)

df.printSchema()

// Run your business logic here

val ds = df.select($"user_id", $"time", $"event").as[Commons.UserEvent]

// This Foreach sink writer writes the output to cassandra.

import org.apache.spark.sql.ForeachWriter

val writer = new ForeachWriter[Commons.UserEvent] {

override def open(partitionId: Long, version: Long) = true

override def process(value: Commons.UserEvent) = {

processRow(value)

}

override def close(errorOrNull: Throwable) = {}

}

val query =

ds.writeStream.queryName("kafka2Spark2Cassandra").foreach(writer).start

query.awaitTermination()

sparkSession.stop()

}

저작자표시 비영리 동일조건

'scala' 카테고리의 다른 글

[spark] 백프레셔(Backpressure) (0)	2018.11.20
[spark] Spark Structed Streaming 코드 예시 (value , value.c, value.k2) (0)	2018.11.05
[spark, kafka] object Subscribe in package kafka010 cannot be accessed in package org.apache.spark.streaming.kafka010 , symbol apply is inaccessible from this place 에러 해결하기 (0)	2018.11.02
[spark] spark structured streaming + cassandra 연동 (0)	2018.10.30
[spark] StructType + Row value 를 함께 저장하는 예제 (0)	2018.10.29

Posted by '김용환'

,

[spark, kafka] object Subscribe in package kafka010 cannot be accessed in package org.apache.spark.streaming.kafka010 , symbol apply is inaccessible from this place 에러 해결하기

scala 2018. 11. 2. 22:43

Spark - Kafka 코드를 sbt로 빌드할 때 발생했다.

object Subscribe in package kafka010 cannot be accessed in package org.apache.spark.streaming.kafka010

[error] Subscribe[String, String](topics, kafkaParams, emptyMap))

IntelliJ IDEA 자동 컴파일할 때는 다음 에러가 발생한다.

symbol apply is inaccessible from this place

원인은 Subscribe 앞에 ConsumerStrategies 클래스를 두지 않아 저런 에러가 발생했다.

ConsumerStragies.Subscribe[String, String](topics, kafkaParams, emptyMap)) 로 변경하면 더 이상 컴파일 에러가 발생하지 않는다.

너무 클래스를 숨기는 것 보다 차라리 클래스를 드러내는 것도 좋다.

저작자표시 비영리 동일조건

'scala' 카테고리의 다른 글

[spark] Spark Structed Streaming 코드 예시 (value , value.c, value.k2) (0)	2018.11.05
[spark] spark structed streaming 코드 + 카산드라 예시 (코드 펌) (0)	2018.11.05
[spark] spark structured streaming + cassandra 연동 (0)	2018.10.30
[spark] StructType + Row value 를 함께 저장하는 예제 (0)	2018.10.29
Unable to find encoder for type stored in a Dataset. Primitive types (Int, String, etc) and Product types (case classes) are supported by importing spark.im plicits._ Support for serializing other types will be added in future releases. (0)	2018.10.29

Posted by '김용환'

,

[Hbase-Phoenix] phoenix.schema.isNamespaceMappingEnabled, Cannot create schema because config phoenix.schema.isNamespaceMappingEnabled for enabling name space mapping isn't enabled 에러 발생

hadoop 2018. 11. 1. 19:58

Phoenix에서 create schema을 실행하려면

phoenix/bin/hdfs-site.xml과 hbase/conf/hdfs-site.xml에 다음 속성을 추가해야 한다.

<name>phoenix.schema.isNamespaceMappingEnabled</name>

</property>

만약 설정되어 있지 않도록 sqline,py에서 다음 에러가 발생한다.

Cannot create schema because config phoenix.schema.isNamespaceMappingEnabled for enabling name space mapping isn't enabled \

저작자표시 비영리 동일조건

'hadoop' 카테고리의 다른 글

[hadoop] No lease on .. File does not exist. (0)	2018.11.30
[phoenix] 피닉스의 timestamp 타입 값을 현재시간으로 확인하기 (0)	2018.11.20
[hbase-phoenix] jdbc driver (0)	2018.11.01
[hive] json 필드 이름에 특수 문자가 포함시 쿼리 보내기 (1)	2018.04.30
keytab 파일 확인/cron 사용하기 (0)	2017.12.04

Posted by '김용환'

,

[hbase-phoenix] jdbc driver

hadoop 2018. 11. 1. 19:55

Apache Phoenix driver를 사용할 때 유의해야 할 부분이 있다.

zookeeper를 이용한 분산 hbase 위에 phoenix를 사용할 때와

standalone의 hbase 위에 phoenix를 사용할 때의 jdbc url은 다르다.

(https://phoenix.apache.org/faq.html)

1. Thick driver

zookeeper를 이용한 분산 hbase 위에 phoenix를 사용할 때를 thick driver라 한다.

스키마는 다음과 같고.. lib는 phoenix-4.14.0-Hbase-1.4-client.jar를 사용한다.

jdbc:phoenix:[comma-separated ZooKeeper Quorum [:port [:hbase root znode [:kerberos_principal [:path to kerberos keytab] ] ] ]

예)

jdbc:phoenix:localhost

jdbc:phoenix:zookeeper1.domain,zookeeper2.domain,zookeeper3.domain:2181:/hbase-1:phoenix@EXAMPLE.COM:/etc/security/keytabs/phoenix.keytab

2. Thin driver

standalone의 hbase 위에 phoenix를 사용할 때의 jdbc url은 thin driver라 한다.

스키마는 다음과 같고.. lib는 phoenix-4.14.0-Hbase-1.4-thin-client.jar를 사용한다.

(라이브러리 파일이 다르고..특별히 Dirver Class는 org.apache.phoenix.querserver.client.Driver임을 잘 기억해야 한다.)

jdbc:phoenix:thin:[key=value[;key=value...]]

예)

jdbc:phoenix:thin:url=http://localhost:8765

jdbc:phoenix:thin:url=http://queryserver.domain:8765;serialization=PROTOBUF;authentication=SPENGO;principal=phoenix@EXAMPLE.COM;keytab=/etc/security/keytabs/phoenix.keytab

주의할 점은 기본 phoenix query server를 실행했다면 serialization=PROTOBUF을 넣어줘야 한다!!

json을 사용하고 싶다면. hbase-site.xml에 phoenix.queryserver.serialization=JSON을 설정해야 한다.

저작자표시 비영리 동일조건

'hadoop' 카테고리의 다른 글

[phoenix] 피닉스의 timestamp 타입 값을 현재시간으로 확인하기 (0)	2018.11.20
[Hbase-Phoenix] phoenix.schema.isNamespaceMappingEnabled, Cannot create schema because config phoenix.schema.isNamespaceMappingEnabled for enabling name space mapping isn't enabled 에러 발생 (0)	2018.11.01
[hive] json 필드 이름에 특수 문자가 포함시 쿼리 보내기 (1)	2018.04.30
keytab 파일 확인/cron 사용하기 (0)	2017.12.04
[hadoop] data locality(데이터 지역성) (0)	2017.11.25

Posted by '김용환'

,

Squirrel SQL 설치 후 실행 이상시 참조할 내용

etc tools 2018. 10. 30. 18:08

Squirrel SQL 클라이트 툴에

https://acadgild.com/blog/squirrel-gui-phoenix

MACOS에서 Squirrel SQL을 설치했지만 실행이 되지 않는다. 아마도 path 이슈일 것 같다.

간단히 해결한 방법은 다음과 같다.

먼저 설치 jar로 설치하고 디폴트 설치 위치로 /Applications/SQuirreLSQL.app/에 두게 한다.

alias squirrel='/Applications/SQuirreLSQL.app/Contents/MacOS/squirrel-sql.sh'

mkdir -p /Applications/SQuirreLSQL.app/Contents/MacOS/lib/

cp /Applications/SQuirreLSQL.app/Contents/Resources/Java/lib/* /Applications/SQuirreLSQL.app/Contents/MacOS/lib/

cp /Applications/SQuirreLSQL.app/Contents/Resources/Java/squirrel-sql.jar /Applications/SQuirreLSQL.app/Contents/MacOS/

squirrel을 실행하면 클라이언트 툴이 실행된다.

저작자표시 비영리 동일조건

'etc tools' 카테고리의 다른 글

[git] clone의 mirror옵션 (0)	2018.12.31
[mac] alias code='open $@ -a "Visual Studio Code"' (0)	2018.11.22
git - pull request할 때 발생할 수 있는 업스트림 처리 (0)	2018.10.22
mac OS에서 분할 압축 (0)	2018.10.18
[윈도우] powershell을 admin권한으로 실행하기 (0)	2018.07.25

Posted by '김용환'

,

[spark] spark structured streaming + cassandra 연동

scala 2018. 10. 30. 16:48

spark readStream()으로 읽은 DataSet을 카산드라에 저장하는 예시 코드이다.

import com.datastax.driver.core.Session

import com.datastax.spark.connector.cql.CassandraConnector

import org.apache.spark.sql.ForeachWriter

val spark = ...

val ds = spark.readStream()

...

val connector = CassandraConnector.apply(spark.sparkContext.getConf)

val session = connector.openSession

def processRow(value: (String, String, String, String)) = {

connector.withSessionDo { session =>

session.execute(s"insert into test.log(ktag, ts, uuid, log) values(' ${value._1}', '${value._2}', '${value._3}', '${value._4}' )")

}

val writer = new ForeachWriter[(String, String, String, String)] {

override def open(partitionId: Long, version: Long) = true

override def process(value: (String, String, String, String)) = {

processRow(value)

}

override def close(errorOrNull: Throwable) = {

println(errorOrNull)

}

val query = ds.writeStream.queryName("test").foreach(writer).start

query.awaitTermination()

build.sbt에는 spark-cassandra-connector를 추가한다.

libraryDependencies += "com.datastax.spark" %% "spark-cassandra-connector" % "2.0.2"

저작자표시 비영리 동일조건

'scala' 카테고리의 다른 글

[spark] spark structed streaming 코드 + 카산드라 예시 (코드 펌) (0)	2018.11.05
[spark, kafka] object Subscribe in package kafka010 cannot be accessed in package org.apache.spark.streaming.kafka010 , symbol apply is inaccessible from this place 에러 해결하기 (0)	2018.11.02
[spark] StructType + Row value 를 함께 저장하는 예제 (0)	2018.10.29
Unable to find encoder for type stored in a Dataset. Primitive types (Int, String, etc) and Product types (case classes) are supported by importing spark.im plicits._ Support for serializing other types will be added in future releases. (0)	2018.10.29
[spark] - spark streaming의 누산기 예시 (0)	2018.10.25

Posted by '김용환'

,

'분류 전체보기'에 해당되는 글 4074건

flask에서 개발할 때 jsonify, json.dump 없이 json 응답 보내기

'python' 카테고리의 다른 글

okhttp3와 moshi 개발이 편하다..

'scribbling' 카테고리의 다른 글

python으로 해결하는 JSONP 파싱 예시

'python' 카테고리의 다른 글

[spark] Spark Structed Streaming 코드 예시 (value , value.c, value.k2)

'scala' 카테고리의 다른 글

[spark] spark structed streaming 코드 + 카산드라 예시 (코드 펌)

'scala' 카테고리의 다른 글

[spark, kafka] object Subscribe in package kafka010 cannot be accessed in package org.apache.spark.streaming.kafka010 , symbol apply is inaccessible from this place 에러 해결하기

'scala' 카테고리의 다른 글

[Hbase-Phoenix] phoenix.schema.isNamespaceMappingEnabled, Cannot create schema because config phoenix.schema.isNamespaceMappingEnabled for enabling name space mapping isn't enabled 에러 발생

'hadoop' 카테고리의 다른 글

[hbase-phoenix] jdbc driver

'hadoop' 카테고리의 다른 글

Squirrel SQL 설치 후 실행 이상시 참조할 내용

'etc tools' 카테고리의 다른 글

[spark] spark structured streaming + cassandra 연동

'scala' 카테고리의 다른 글

카테고리

태그목록

최근에 올라온 글

최근에 달린 댓글

최근에 받은 트랙백

글 보관함

달력

링크

티스토리툴바