본문 바로가기
카테고리 없음

파이썬 - 문자 데이터 이해하기

by 자본주의위너 2022. 4. 6.
반응형

우리가 파이썬을 이용해 원하는 결과값을 도출하기 위해서는 기본 재료들이 필요합니다. 그 재료들을 데이터라고 부르는데, 이번 포스팅에서는 그 중에서도 문자 데이터에 대해서 이해해보도록 하겠습니다.

 

목차

 

데이터란

기본적으로 데이터란 나무위키에 따르면

1) 이론을 세우는 데 기초가 되는 사실. 또는 바탕이 되는 자료.

2) 관찰이나 실험, 조사로 얻은 사실이나 자료.

3) 컴퓨터가 처리할 수 있는 문자, 숫자, 소리, 그림 따위의 형태로 된 자료라고 합니다.

즉, 데이터는 가공되지 않는 자료라고 이해하는 게 맞는 거 같습니다. 우리 주변에서도 손쉽게 데이터의 존재를 알 수가 있습니다. 우리가 살고 있는 주소, 전화번호, 나이 이런 것들이 다 데이터입니다. 결국 프로그래밍이라는 것은 이런 데이터를 가공해서 내가 원하는 결과값을 얻는다고 볼 수 있습니다.

 

 

문자 데이터란

 문자 데이터는 말그래도 '문자'로 표현한 데이터입니다. 코딩에서는 문자데이터와 숫자데이터로 나눌 수가 있습니다. 나누는 가장 중요한 기준은 수리적인 계산을 할 수 있냐 없냐의 차이입니다. 똑같은 숫자 모양을 나타내더라도 숫자데이터는 연산이 가능하지만 문자 데이터가 되는 순간 연산기능이 없어져 버린다고 생각하시면 됩니다. 쉽게 생각할 수 있는 예시로는 핸드폰 전화번호를 예시로 들 수 있습니다. 010-1234-1234 이걸 숫자데이터로 본다면 10에서 마이너스 1,234를 해주고 또 다시 1,234를 해주는 구나라고 이해할 수도 있겠지만, 아무도 그렇게 보지는 않을 거 같습니다. 그냥 숫자 데이터 그 자체로 의미인 핸드폰 번호를 의미하는구나라고 이해할 것입니다.

 

 

문자 데이터의 특징

그럼 문자 데이터는 어떠한 특징이 있는지 살펴보도록 하겠습니다.

 

1. 문자 데이터를 표현하기 위해서는 무조건 문자 양쪽 끝에 따옴표를 작성해야 합니다.

print(무조건 따옴표) 
 
▶ 결과값
SyntaxError: invalid syntax  → 해당 오류가 무슨 내용인지 모를 때에는 구글 번역기를 이용하시면 편합니다.
 
'잘못된 구문'이라고 뜹니다. 파이썬 내부에서 사용할 수 없는 데이터라는 의미입니다.

2. 따옴표의 종류는 상관없습니다. 문자 데이터를 표현하고 싶을 때, 작은 따옴표 ( ' ' ) 든지 큰 따옴표 ( " " ) 든지 사용하시기만 하시면 됩니다. 단, 이거는 파이썬에서만 이렇고 다른 프로그래밍 언어에서는 다를 수 있으니 확인하시길 바랍니다.

 

3. 그런데 만약 문자 데이터 안에 따옴표를 표현하고 싶다면 어떻게 해야할까요?

그냥 작은 따옴표 표현하고 싶을 때는 큰 따옴표 사용하고, 큰 따옴표 표현하고 싶을 때는 작은따옴표 사용하면 되지 않을까요?라고 생각하실 수 있겠지만, 넵, 이렇게 표현하시면 됩니다.

단, 같은 따옴표를 사용해서 나타내고 싶을 때,

예를 들어, 오늘의 날씨는 '맑음'입니다.라는 문장을 작은따옴표( ' ' )를 사용해서 표현하고 싶다면, 어떻게 해야 할까요?

첫번째 문장은 작은 따옴표( ' ' )를 표현하기 위해서  큰 따옴표( " " )를 사용했습니다. 제대로 결과값이 도출되었습니다.

두번째 문장은 작은 따옴표( ' ' )를 표현하기 위해서 또 작은 따옴표( ' ' )를 사용한 경우로써, invalid syntax 오류가 떴습니다.

세번째 문장은 이스케이프 문자(\)를 사용해서 작은 따옴표( ' ' )를 표현한 방법입니다.

즉, 작은 따옴표를 2번써서 표현하고 싶을 떄는 이스케이프 문자라고 하여 enter키 위에 있는 \ | → 이 자판을 앞에 붙여주시면 됩니다. 이스케이프 문자의 의미는 escape 탈출한다는 의미로써 기존에 작은 따옴표( ' ' ), 큰 따옴표( " " )가 가지고 있는 문자데이터 변환의 역할을 던져버리고 그냥 그 자체의 문자 데이터로써 존재하겠다는 의미라고 합니다.

한가지 주의해주실 점이 있는데, 이스케이프 문자를 사용할 때는 \뒤에 공백이 항상 없어야 한다고 합니다.

 

추가적으로 이스케이프 문자 중에 알아야 할 하나의 코드가 있는데 그건 바로 줄바꿈코드 입니다.

데이터를 쓰다가 너무 길다싶으면 다음줄에 쓰고 싶을 때가 있잖아요? 바로 그때 사용하는 겁니다.

코드를 보시면 '줄' 다음에 '\n'을 사용해서 줄바꿈을 사용했고, 건너 뒤에 '\n'을 사용해서 또 줄바꿈을 사용했습니다.

그 결과

건너

뛰어

라는 값이 나오는 것을 볼 수 있습니다.

반응형

댓글