리눅스 터미널에서 json 파일을 출력해볼 때 python -m json.tool 명령어를 자주 이용한다. indent 4칸 넣고 적절히 보기 좋게 출력해주기 때문이다. 그런데 한글이 포함된 json 파일은 출력이 깨진다.
예를 들어 아래와 같은 json 자료가 있다고 가정해보자.
{
"이름": "홍길동",
"생년월일": "1982-01-01",
"전화번호": "010-0000-0000"
}
python -m json.tool로 출력하면 아래와 같이 유니코드로 출력된다.
[root@centos7-01 ~]# cat kor1.json | python -m json.tool
{
"\uc0dd\ub144\uc6d4\uc77c": "1982-01-01",
"\uc774\ub984": "\ud64d\uae38\ub3d9",
"\uc804\ud654\ubc88\ud638": "010-0000-0000"
}
이걸 한글로 보이게 출력하려면
첫째로 printf 함수를 이용하는 방법이 있다. CentOS 7에서는 기본 bash의 함수도 가능하고, CentOS 6에서는 coreutils에 포함된 /usr/bin/printf를 이용하면 된다.
아무튼 아래와 같이 printf로 출력하면 한글이 정상적으로 표시된다.
[root@centos7-01 ~]# printf "$(cat kor1.json | python -m json.tool)"
{
"생년월일": "1982-01-01",
"이름": "홍길동",
"전화번호": "010-0000-0000"
}
그런데 이게 너무 불편하다... 원래 json.dumps에 ensure_ascii=False 옵션을 주면 한글 그대로 출력이 되는데 json.tool에는 해당 옵션이 들어가 있지 않다. 이를 확인해보자.
OS 버전이랑 환경에 따라 다른데 CentOS 7에서는 내장 Python 2.7의 json.tool 위치가 아래와 같다.
[root@centos7-01 ~]# python -c 'import json.tool;print(json.tool)'
<module 'json.tool' from '/usr/lib64/python2.7/json/tool.pyc'>
/usr/lib64/python2.7/json/tool.py 파일을 열어보면 아래와 같다.
r"""Command-line tool to validate and pretty-print JSON
Usage::
$ echo '{"json":"obj"}' | python -m json.tool
{
"json": "obj"
}
$ echo '{ 1.2:3.4}' | python -m json.tool
Expecting property name enclosed in double quotes: line 1 column 3 (char 2)
"""
import sys
import json
def main():
if len(sys.argv) == 1:
infile = sys.stdin
outfile = sys.stdout
elif len(sys.argv) == 2:
infile = open(sys.argv[1], 'rb')
outfile = sys.stdout
elif len(sys.argv) == 3:
infile = open(sys.argv[1], 'rb')
outfile = open(sys.argv[2], 'wb')
else:
raise SystemExit(sys.argv[0] + " [infile [outfile]]")
with infile:
try:
obj = json.load(infile)
except ValueError, e:
raise SystemExit(e)
with outfile:
json.dump(obj, outfile, sort_keys=True,
indent=4, separators=(',', ': '))
outfile.write('\n')
if __name__ == '__main__':
main()
이 파일을 수정해서 json.dump에 ensure_ascii=False 옵션을 넣어주면 어떨까? 당연히 넣어주면 잘 동작한다.
with outfile:
json.dump(obj, outfile, sort_keys=True,
indent=4, separators=(',', ': '), ensure_ascii=False)
outfile.write('\n')
[root@centos7-01 ~]# cat kor1.json | python -m json.tool
{
"생년월일": "1982-01-01",
"이름": "홍길동",
"전화번호": "010-0000-0000"
}
OS 내장 Python 2.7이라서 python-libs 패키지가 업데이트 되면 원복 될 것 같기는 하지만... 아무튼 이렇게 쓰는 방법도 있다는걸 공유해본다.