오늘은 데이터 타입에 대해 알아보자.
데이터 타입(줄여서 타입)은 값의 종류를 말한다. 자바스크립트의 모든 값은 데이터 타입을 갖는다.

자바스크립트는 7개의 데이터 타입을 제공하고 이는 원시 타입과 객체 타입으로 분류된다.

원시 타입(primitive type) : 변경할 수 없는 값

  • 숫자 타입: 정수와 실수 구분 없이 하나의 숫자 타입만 존재
  • 문자열 타입: 문자열
  • 불리언(boolean) 타입: 논리적 참(true)과 거짓(false)
  • undefined 타입: var 키워드로 선언된 변수에 암묵적으로 할당되는 값
  • null 타입: 값이 없다는 것을 의도적으로 명시할 때 사용하는 값
  • 심벌(symbol) 타입: ES6에서 추가된 7번째 타입

객체 타입(object/reference type): 객체, 함수, 배열 등 (변경할 수 있는 값)

원시타입에 속하는 6가지 타입과 객체 타입을 합해 총 7개 타입이 존재한다.

숫자 타입

C나 자바의 경우, 정수와 실수를 구분해서 숫자 타입을 제공하지만 자바스크립트는 하나의 숫자 타입만 존재한다.
자바스크립트는 모든 수를 실수 로 처리하며 정수만 표현하기 위한 데이터 타입은 존재하지 않는다.

1
2
3
4
// 모두 숫자 타입이며 실수로 처리된다.
var integer = 10; // 정수
var double = 10.12; // 실수
var negative = -20; // 음의 정수

자바스크립트는 모든 수를 실수로 처리하기 때문에 정수끼리 나눠도 결과값이 실수가 나올 수 있다.
C나 자바의 경우, 정수끼리 나눴을 때 결과값이 실수가 나올 수 없다.

1
2
3
4
// 숫자 타입은 모두 실수로 처리된다.
console.log(1 === 1.0); // true
console.log(4 / 2); // 2
console.log(3 / 2); // 1.5

숫자 타입은 추가적으로 세 가지 특별한 값들도 표현할 수 있다.

  • Infinity: 양의 무한대

  • -Infinity: 음의 무한대

  • NaN: 산술 연산 불가(not-a-number)
    자바스크립트는 대소문자를 구분하므로 Infinity의 i를 꼭 대문자로, NaN의 n을 꼭 대문자로 적어야 한다.

    1
    2
    3
    4
    // 숫자 타입의 세 가지 특별한 값
    console.log(10 / 0); // Infinity
    console.log(-10 / 0); //-Infinity
    console.log(1 * 'string'); // NaN

문자열 타입

문자열(string) 타입은 텍스트 데이터를 나타내는 데 사용한다.
문자열은 작은따옴표(‘’), 큰 따옴표(“”) 또는 백틱(``)으로 텍스트를 감싼다. 보통 작은 따옴표를 많이 사용한다.

1
2
3
4
5
6
7
8
// 문자열 타입
var string;
string = '문자열'; // 작은따옴표
string = "문자열"; // 큰따옴표
string = `문자열`; // 백틱(ES6)

string = '작은따옴표로 감싼 문자열 내의 "큰따옴표"는 문자열로 인식된다.';
string = "작은따옴표로 감싼 문자열 내의 '큰따옴표'는 문자열로 인식된다.";

다른 타입의 값과 달리 문자열을 따옴표로 감싸는 이유는 키워드나 식별자 같은 토큰과 구분하기 위해서다.
또, 따옴표로 문자열을 감싸지 않는다면 공백 문자도 포함시킬 수 없다.

C나 자바와 다르게 자바스크립트의 문자열은 원시 타입이며 변경 불가능한 값이다.
문자열이 생성되면 그 문자열을 변경할 수 없다.

템플릿 리터럴(ES6)

템플릿 리터럴은 백틱을 사용해 표현된다.
템플릿 리터럴은 멀티라인 문자열(공백문자 표현) , 표현식 삽입 , 태그드 템플릿 등 편리한 문자열 처리 기능을 제공한다.
템플릿 리터럴은 런타임에 일반 문자열로 변환되어 처리된다.

멀티라인 문자열

일반 문자열 내에서는 개행이 허용되지 않는다.

1
2
3
var str = 'Hello
world.';
// SyntaxError: Invalid or unexpected token

따라서 일반 문자열(작은따옴표나 큰따옴표를 사용한 문자열)내에서 공백을 표현하려면 백슬래스()로 시작하는 이스케이프 시퀀스를 사용해야 한다.

1
2
3
4
5
6
7
8
var template = '<ul>\n\t<li><a href="#">Home</a></li>\n</ul>';
console.log(template);

/*
<ul>
<li><a href="#">Home<a></li>
</ul>
*/

이스케이프 시퀀스를 사용한 방법은 가독성이 떨어진다.

템플릿 리터럴 내에서는 이스케이프 시퀀스를 사용하지 않고도 줄바꿈을 표현할 수 있고, 모든 공백도 있는 그대로 적용된다.

1
2
3
4
5
6
7
8
9
10
var template = `<ul>
<li><a href="#">Home</a></li>
</ul>`
console.log(template);

/*
<ul>
<li><a href="#">Home</a></li>
</ul>
*/

표현식 삽입

문자열은 문자열 연산자 +를 사용해 연결할 수 있다.
+연산자는 피연산자 중 하나 이상이 문자열일 경우 문자열 연결 연산자로 동작한다. 그 외의 경우는 덧셈 연산자로 동작한다.

일반 문자열의 문자열 연결

1
2
3
4
5
6
var first = "Jae-min";
var last = "Kim";

// ES5 : 문자열 연결
console.log('My name is ' + first + ' ' + last + '.');
// My name is Jae-min Kim.

템플릿 리터럴 내에서는 표현식 삽입을 통해 문자열을 삽입할 수 있다.
가독성이 좋고 간편하게 작성할 수 있다.

1
2
3
4
5
6
var first = "Jae-min";
var last = "Kim";

// ES6 : 표현식 삽입
console.log(`My name is $(first) $(last).`);
// My name is Jae-min Kim.

표현식 삽입은 반드시 템플릿 리터럴 내에서 사용해야 한다.
템플릿 리터럴이 아닌 일반 문자열에서의 표현식 삽입은 문자열로 취급된다.

불리언 타입

불리언 타입의 값은 논리적 참, 거짓을 나타내는 true와 false뿐이다.

1
2
3
4
5
var foo = true;
console.log(foo); // true

foo = false;
console.log(foo); // false

불리언 타입의 값은 조건문에서 자주 사용한다.

undefined 타입

undefined 타입의 값은 undefined가 유일하다.

1
2
var foo;
console.log(foo); //undefined

undefined는 개발자가 의도적으로 할당하기 위한 값이 아니라 자바스크립트 엔진이 변수를 초기화할 때 사용하는 값이다.
변수를 참조했을 때 undefined가 반환된다면 참조한 변수가 선언 이후 값이 할당된 적이 없는(초기화하지 않은) 변수라는 것을 알 수 있다.

undefined는 자바스크립트 엔진이 변수를 초기화할때 사용하므로 개발자가 의도적으로 변수에 할당하는 것은 권장하지 않는다.
변수에 값이 없다는 것을 명시하고 싶을 때, undefined를 할당하는 것이 아니라 null을 할당한다.

null 타입

null 타입의 값은 null이 유일하다.
프로그래밍 언어에서 null은 변수에 값이 없다는 것을 의도적으로 명시할 때 사용한다.

1
2
3
4
var foo = 'kim';
foo = null;
// 이전에 할당되어 있던 값에 대한 참조를 제거
// 유용해 보이진 않음, 변수의 스코프를 좁게 만들어 변수를 소멸시키는 편이 낫다.

symbol 타입

심벌은 ES6에서 추가된 7번째 타입으로 변경 불가능한 원시 타입의 값이다. 심벌 값은 다른 값과 중복되지 않는 유일무이한 값이다.
따라서 주로 이름이 충돌할 위험이 없는 객체의 유일한 프로퍼티 키를 만들기 위해 사용한다.

1
2
3
4
5
6
7
8
9
10
// 심벌 값 생성
var key = symbol('key');
console.log(typeof key); // symbol

// 객체 생성
var obj = {};

// 이름이 충돌할 위험이 없는 유일무이한 값인 심벌을 프로퍼티 키로 사용한다.
obj[key] = 'value';
console.log(obj[key]); // value

심벌에 대해서는 이후에 더 자세히 살펴보도록 하자.

객체 타입

자바스크립트는 객체 기반의 언어이며, 자바스크립트를 이루고 있는 거의 모든 것이 객체이다.
아직 객체에 대해 살펴보지 않았으므로 잠시 미뤄두고 다음 글에서 자세히 살펴보도록 하자.

데이터 타입의 필요성

지금까지 데이터 타입에 대해 설명해보았다.
그런데, 데이터 타입이 도대체 왜 필요한 것일까?

1. 데이터 타입에 의한 메모리 공간의 확보와 참조

값은 메모리에 저장하고 참조할 수 있어야 한다. 메모리에 값을 저장하려면 먼저 확보해야 할 메모리 공간의 크기를 결정해야 한다.
예를 들어, 다음과 같이 변수를 선언하고 숫자 값을 할당해 보자.

1
var score = 100;

이 코드가 실행되면 컴퓨터는 숫자 값 100을 저장하기 위해 메모리 공간을 확보한 후, 확보된 메모리에 숫자 값 100을 2진수로 저장한다.
여기서 자바스크립트 엔진이 확보해야할 메모리 공간의 크기는 데이터 타입에 따라 정해진다.
자바스크립트 엔진은 리터럴 100을 숫자 타입의 값으로 해석하고 100을 저장하기 위해 8바이트의 메모리 공간을 확보한다.

이번에는, 값을 참조할 때를 생각해보자.
값을 참조하려면 한 번에 읽어 들여야 하는 메모리 공간의 크기를 알아야 한다. score 변수의 경우, 8 바이트 단위로 읽어들이지 않으면 값이 훼손된다.
자바스크립트 엔진은 데이터 타입을 확인하고 한 번에 읽어들일 메모리 공간의 크기를 결정한다.
score는 숫자 타입이므로 8바이트 단위로 읽어들인다.

2. 데이터 타입에 의한 값의 해석

그런데 아직 문제가 있다. 메모리에서 읽어 들인 2진수를 어떻게 해석해야 하느냐다.
모든 값은 메모리에 2진수로 저장된다. 만약, 메모리에 0100 0001이란 값이 저장되었다고 치자.
이 값은 숫자로 해석하면 65이지만 문자로 해석하면 ‘A’이다.
이때도 자바스크립트 엔진은 데이터 타입을 확인한다. 앞선 예제의 score 변수는 숫자 타입이므로 읽어들인 2진수를 숫자로 해석한다.

데이터 타입이 필요한 이유 정리

  • 값을 저장할 때 확보해야 할 메모리 공간의 크기를 결정하기 위해
  • 값을 참조할 때 한 번에 읽어들여야 할 메모리 공간의 크기를 결정하기 위해
  • 메모리에서 읽어 들인 2진수를 어떻게 해석할지 결정하기 위해

동적 타이핑

C나 자바는 정적 타입 언어이다. 정적 타입 언어는 변수를 선언할 떄 변수에 할당할 수 있는 데이터 타입을 선언해야 한다.
정적 타입 언어는 변수의 타입을 변경할 수 없으며, 변수에 선언한 타입에 맞는 값만 할당할 수 있다.
정적 타입 언어는 컴파일 시점에 타입 체크(타입에 맞는 값 할당했는지 체크)를 수행하고 통과하지 못했다면 프로그램의 실행을 막는다.
(타입의 일관성 강제 => 안정적인 코드 구현, 에러 줄임)

자바스크립트는 정적 타입 언어와 달리 변수를 선언할 때 타입을 선언하지 않는다.
앞서 우리는 변수 선언 방법을 다뤘는데 변수 선언 방법은 var, let, const 뿐이었고 이것들의 타입은 정해져 있지 않았다.
자바스크립트의 변수에는 어떤 데이터 타입의 값이라도 자유롭게 할당할 수 있고 변경할 수 있다.

다시 말해, 자바스크립트 변수는 선언이 아닌 할당에 의해 타입이 결정된다.
그리고 타입은 재할당에 의해 동적으로 변할 수 있다.

이러한 특징을 동적 타이핑이라 한다.
이러한 언어들을 동적 타입 언어라고 하며 파이썬과 루비 등도 여기에 속한다.

동적 타입 언어에서의 변수

동적 타입 언어는 변수 값의 데이터 타입을 자유롭게 할당할 수 있다.
이런 방법은 편리할 수도 있지만 위험하다.
동적 타입 언어의 변수는 값을 확인하기 전에는 타입을 확신할 수 없기 때문이다.

따라서, 변수를 사용할 때는 주의사항이 있다.

  • 변수는 꼭 필요한 경우에 한해 제한적으로 사용한다.
    변수 개수가 많으면 오류가 발생할 확률도 높아진다. 필요한 만큼 최소한으로 유지

  • 변수의 유효 범위(스코프)는 최대한 좁게 만들어 변수의 부작용 억제

  • 전역 변수는 최대한 사용하지 않도록 한다.

  • 변수보다는 상수를 사용해 값의 변경을 억제한다.(const)

  • 변수 이름은 변수의 목적이나 의미를 파악할 수 있도록 네이밍한다.
    이는 식별자 이름도 마찬가지이다.