리눅스 터미널에서 json 파일을 출력해볼 때 python -m json.tool 명령어를 자주 이용한다. indent 4칸 넣고 적절히 보기 좋게 출력해주기 때문이다. 그런데 한글이 포함된 json 파일은 출력이 깨진다.


예를 들어 아래와 같은 json 자료가 있다고 가정해보자.


{
    "이름""홍길동",
    "생년월일""1982-01-01",
    "전화번호""010-0000-0000"
}


python -m json.tool로 출력하면 아래와 같이 유니코드로 출력된다.


[root@centos7-01 ~]# cat kor1.json | python -m json.tool
{
    "\uc0dd\ub144\uc6d4\uc77c""1982-01-01",
    "\uc774\ub984""\ud64d\uae38\ub3d9",
    "\uc804\ud654\ubc88\ud638""010-0000-0000"
}


이걸 한글로 보이게 출력하려면


첫째로 printf 함수를 이용하는 방법이 있다. CentOS 7에서는 기본 bash의 함수도 가능하고, CentOS 6에서는 coreutils에 포함된 /usr/bin/printf를 이용하면 된다.


아무튼 아래와 같이 printf로 출력하면 한글이 정상적으로 표시된다.


[root@centos7-01 ~]# printf "$(cat kor1.json | python -m json.tool)"
{
    "생년월일""1982-01-01",
    "이름""홍길동",
    "전화번호""010-0000-0000"
}


그런데 이게 너무 불편하다... 원래 json.dumps에 ensure_ascii=False 옵션을 주면 한글 그대로 출력이 되는데 json.tool에는 해당 옵션이 들어가 있지 않다. 이를 확인해보자.


OS 버전이랑 환경에 따라 다른데 CentOS 7에서는 내장 Python 2.7의 json.tool 위치가 아래와 같다.


[root@centos7-01 ~]# python -c 'import json.tool;print(json.tool)'
<module 'json.tool' from '/usr/lib64/python2.7/json/tool.pyc'>


/usr/lib64/python2.7/json/tool.py 파일을 열어보면 아래와 같다.


r"""Command-line tool to validate and pretty-print JSON

Usage::

    $ echo '{"json":"obj"}' | python -m json.tool
    {
        "json": "obj"
    }
    $ echo '{ 1.2:3.4}' | python -m json.tool
    Expecting property name enclosed in double quotes: line 1 column 3 (char 2)

"""
import sys
import json

def main():
    if len(sys.argv) == 1:
        infile = sys.stdin
        outfile = sys.stdout
    elif len(sys.argv) == 2:
        infile = open(sys.argv[1], 'rb')
        outfile = sys.stdout
    elif len(sys.argv) == 3:
        infile = open(sys.argv[1], 'rb')
        outfile = open(sys.argv[2], 'wb')
    else:
        raise SystemExit(sys.argv[0] + " [infile [outfile]]")
    with infile:
        try:
            obj = json.load(infile)
        except ValueError, e:
            raise SystemExit(e)
    with outfile:
        json.dump(obj, outfile, sort_keys=True,
                  indent=4separators=(','': '))
        outfile.write('\n')


if __name__ == '__main__':
    main()


이 파일을 수정해서 json.dump에 ensure_ascii=False 옵션을 넣어주면 어떨까? 당연히 넣어주면 잘 동작한다.


    with outfile:
        json.dump(obj, outfile, sort_keys=True,
                  indent=4separators=(','': '), ensure_ascii=False)
        outfile.write('\n')


[root@centos7-01 ~]# cat kor1.json | python -m json.tool
{
    "생년월일""1982-01-01",
    "이름""홍길동",
    "전화번호""010-0000-0000"
}


OS 내장 Python 2.7이라서 python-libs 패키지가 업데이트 되면 원복 될 것 같기는 하지만... 아무튼 이렇게 쓰는 방법도 있다는걸 공유해본다.