공부공부/JS 딥다이브

[js 딥다이브] 06장 데이터 타입

고생쨩 2023. 10. 16. 13:14
728x90

JS(ES6)는 7개의 데이터 타입을 제공하고, 7개의 데이터 타입은 원시 타입과 객체 타입으로 분류할 수 있다.

구분 데이터타입 표기 설명
원시타입 숫자 타입 number 숫자. 정수와 실수의 구분 없이 하나의 숫자 타입만 존재
문자열 타입 string 문자열
불리언 타입 boolean 논리적 참과 거짓
undefined 타입 undefined var 키워드로 선언된 변수에 암묵적으로 할당하는 값
null 타입 null 값이 없다는 것을 의도적으로 명시할때 사용하는 값
심벌 타입 symbol ES6에서 추가된 7번째 타입
객체 타입 object, funtion, array, map 객체, 함수, 배열 등

숫자 1과 문자열 '1’은 비슷해보이지만 전혀 다른 값임.
명확한 의도에 따라 타입을 정하고 쓰자.
-> 🤔 js 타입은 이해만 하고 넘어가고 ts를 쓰자

6.1 숫자 타입

js는 숫자 타입이 number 하나만 존재함.
ES 사양에 따르면 배정밀도 64비트 부동 소수점 형식을 따른다고 한다.
모든 수를 실수로 처리한단 이야기이며, 정수를 표현하기 위한 타입이 따로 없다는 이야기

배정밀도 64비트 부동 소수점 형식

고정 소수점 / 부동 소수점

  • 고정 소수점 방식으로는 1.23456789 ~ 12345678.9까지의 모든 숫자를 처리하기 위해 정수 부분 8 자리 + 소수 8 자리가 필요함. 하지만 부동 소수점 방식에선 가수 부분(1.23456789를 저장하는 곳)이 9자리, 지수(10의 제곱을 저장하는 자리) 1자리니까 총 10자리만 필요함.
  • 즉, 부동소수점이 더 적은 공간을 차지함

단정밀도 ~ 8배정밀도

// 모두 숫자 타입임
var interger = 10; // 정수
var double = 10.12; // 실수
var negative = -20; // 음의 정수

정수, 실수, 2진수, 8진수, 16진수 리터럴은 모두 메모리에 배정밀도 64비트 부동소수점 형식의 2진수로 저장됨.
JS는 2진수, 8진수, 16진수를 표현하기 위한 데이터 타입을 제공하지 않기 때문에 이들 값을 참조하면 모두 10진수로 해석됨.

var binary = 0b01000001; // 2진수
var octal = 0o101; // 8진수
var hex = 0x41; // 16진수

// 표기법만 다를 뿐 모두 같은 값
console.log(binary); // 65
console.log(octal); // 65
console.log(hex); // 65
console.log(binary === octal); // true
console.log(octal === hex); // true

JS의 숫자 타입은 정수만을 위한 타입이 없고 모든 수를 실수로 처리함. 이는 정수로 표시되더라고 사실은 실수라는 것을 의미. 따라서 정수로 표시되는 수끼리 나누더라고 실수가 나올 수 있음

// 숫자 타입은 모두 실수로 처리됨
console.log(1 === 1.0); // true
console.log(4 / 2); //2
console.log(3 / 2); // 1.5

숫자 타입은 추가적으로 세 가지 특별한 값도 표현

  • Infinity : 양의 무한대 😎 내꺼 하자
  • -Infinity : 음의 무한대
  • Nan : 산술 연산 불가 (not a number)
// 숫자 타입의 세 가지 특별한 값
console.log(10 / 0); // Infinity
console.log(10 / -0); // -Infinity
console.log(1 * 'String'); // NaN

6.2 문자열 타입

문자열 타입은 텍스트 데이터를 나타내는데 사용.
문자열은 0개 이상의 16비트 유니코드 문자(UTF-16)의 집합으로 전 세계 대부분의 문자를 표현할 수 있음.
문자열은 작은 따옴표 '', 큰 따옴표 "", 백틱 ``으로 텍스트를 감싼다. JS에서 가장 일반적인 표기법은 작은 따옴표를 사용하는 것.

// 문자열 타입
var string;
string = '문자열'; // 작은따옴표
string = "문자열"; // 큰따옴표
string = `문자열`; // 백틱(ES6)

string = '작은따옴표로 감싼 문자열 내의 "큰따옴표"는 문자열로 인식된다.';
string = "큰따옴표로 감싼 문자열 내의 '작은따옴표'는 문자열로 인식된다.";

따옴표로 감싸지 않으면 키워드나 식별자 같은 토큰으로 인식함.

-> 🤔 통일성을 위해 왠만하면 백틱(템플릿 리터럴)을 쓰는게 어떨지 싶다

6.3 템플릿 리터럴

ES6에서 도입된 문자열 표기법
멀티라인 문자열, 표현식 삽입, 태그드 템플릿등 편리한 문자열 처리 기능을 제공함.
런타임에 일반 문자열로 변환되어 처리됨.
템플릿 리터럴은 백틱 ``을 사용하여 표현함.

var template = `Template literal`;
console.log(template); // Template literal

6.3.1 멀티라인 문자열

일반 문자열 내에서는 줄바꿈이 허용되지 않는다.

var str = 'Hello
world';
// SyntacError

일반 문자열에서는 줄바꿈등의 공백을 표현하려면 백슬래시 \로 시작하는 이스케이프 시퀀스를 사용해야 한다.

이스케이프 시퀀스 의미
\0 Null
\b 백스페이스
\f 폼 피드. 프린터로 출력할 경우 다음 페이지의 시작 지점으로 이동한다.
\n 개행(LF). 다음 행으로 이동
\r 개행(CR). 커서를 처음으로 이동
\t 탭(수평)
\v 탭(수직)
\uXXXX 유니코드. 예를 들어 '\u0041’은 ‘A’, '\uD55C’는 ‘한’, '\u{1F600}'는 😀이다.
\' 작은 따옴표
\" 큰 따옴표
\\ 백슬래시

라인 피드와 캐리지 리턴
개행newline 문자는 텍스트의 한 줄이 끝남을 표시하는 문자 또는 문자열.

개행 문자에는 라인 피드와 캐리지 리턴이 있음. 과거 타자기에서 커서를 제어하는 방식에서 비롯된 것.
라인 피드(\n)는 커서를 정지한 상태에서 종이를 한 줄 올리는 것이고, 캐리지 리턴(\r)은 종이를 움직이지 않고 커서를 맨 앞줄로 이동하는 것.
초창기 컴퓨터는 출력을 프린터로 수행했는데, 이때 개행을 위해 라인 피드와 캐리지 리턴을 모두 사용했음. 즉, CRLF(\r\n)로 커서를 맨 앞으로 이동시키고 종이를 한 줄 올리는 방식으로 개행함.

현대의 컴퓨터 운영체제는 서로 다른 체계의 개행 방식을 사용함.
윈도우는 CR+LF(ASCII 코드 13번과 10번)로 새 줄을 나타내고 유닉스는 LF(ASCII 코드 10번)로 새 줄을 나타낸다. macOS에서는 버전 9까지 CR로 새 줄을 나타냈지만 버전 10부터 LF를 사용한다. 따라서 다른 운영체제에서 작성한 텍스트 파일은 서로 개행 문자를 인식하지 못한다. 다만 대부분의 텍스트 에디터는 운영체제에 맞게 개행 문자를 자동으로 변환해주므로 큰 문제는 없다.

자바스크립트에서 라인 피드와 캐리지 리턴은 모두 개행을 의미함. 하지만 캐리지 리턴(\r)으로 개행하는 경우는 거의 없고 일반적으로 라인 피드(\n)를 사용해 개행함.

ex) 줄바꿈과 들여쓰기가 적용된 HTML 문자열의 경우

var template = '<ul>\n\t<li><a href="#">Home</a></li>\n</ul>';
console.log(template);

출력결과

<ul>
 <li><a href="#">Home</a></li>
</ul>

일반 문자열과 달리 템플릿 리터럴 내에서는 이스케이프 시퀀스를 사용하지 않고도 줄바꿈이 허용되며, 모든 공백도 있는 그대로 적용됨.

var template = `<ul>
 <li><a href="#">Home</a></li>
</ul>`;
console.log(template);

출력결과

<ul>
 <li><a href="#">Home</a></li>
</ul>

6.3.2 표현식 삽입

문자열은 연산자 +를 사용해 연결할 수 있음. + 연산자는 피연산자 중 하나 이상이 문자열인 경우 문자열 연결 연산자로 동작함. 그외의 경우엔 덧셈 연산자로 동작

var first = 'Ung-mo';
var last = 'Lee';
// ES5: 문자열 연결
console.log('My name is ' + first + ' ' + last + '.'); // My name is Ung-mo Lee.

템플릿 리터럴 내에서는 표현식 삽입을 통해 간단히 문자열 삽입 가능

var first = 'Ung-mo';
var last = 'Lee';
// ES6: 표현식 삽입
console.log(`My name is ${first} ${last}.`); // My name is Ung-mo Lee.

표현식을 삽입하려면 ${}으로 포현식을 감쌈. 이때 표현식의 결과가 문자열이 아니더라도 문자열로 타입이 강제로 변환되어 삽입됨.

console.log(`1 + 2 = ${1 + 2}`); // 1 + 2 = 3

표현식은 반드시 템플릿 리터럴 내에서 사용해야함. 일반 문자열에서는 걍 문자열로 취급함.

console.log('1 + 2 = ${1 + 2}'); // 1 + 2 = ${1 + 2}

6.4 불리언 타입

불리언 타입의 값은 논리적 참, 거짓을 나타내는 true, false가 있음

var foo = true;
console.log(foo); // true
foo = false;
console.log(foo); // false

6.5 undefined 타입

undefined 타입의 값은 undefined가 유일함.
var 키워드로 선언한 변수는 암묵적으로 undefined로 초기화 됨.
변수 선언에 의해 확보된 메모리 공간을 처음 할당이 이뤄질때까지 빈 상태(대부분 비어있지 않고 쓰레기 값이 들어있음)로 두지 않고 JS엔진이 undefined로 초기화함.

var foo;
console.log(foo); // undefined

개발자가 의도적으로 변수에 undefined를 할당하지 말고 비우고 싶을땐 null을 사용할 것

선언과 정의
undefined를 직역하면 "정의되지 않음"이다. 일반적으로 정의란 개념은 어떤 대상을 명확하게 규정하는 것을 의미함. 자바스크립트의 undefined에서 말하는 정의란 변수에 값을 할당하여 변수의 실체를 명확히 하는 것을 말함.
다른 프로그래밍 언어에서는 선언과 정의를 엄격하게 구분해서 사용하는 경우가 있음. 예를 들어, C에서 선언과 정의는 “실제로 메모리 주소를 할당하는가”로 구분함. 단순히 컴파일러에게 식별자의 존재만 알리는 것은 선언이고, 실제로 컴파일러가 변수를 생성해서 식별자와 메모리 주소가 연결되면 정의로 구분함.
자바스크립트의 경우 변수를 선언하면 암묵적으로 정의가 이뤄지기 때문에 선언과 정의의 구분이 모호함.

ECMAScript 사양에서 변수는 '선언한다’라고 표현하고, 함수는 '정의한다’라고 표현한다.
고로 ES 사양에 맞춰 표현하도록 하자.

6.6 null 타입

null 타입의 값은 null이 유일함. 대소문자 주의
프로그래밍 언어에서 null은 변수에 값이 없다는 것을 의도적으로 명시할때 사용함.
변수에 null을 할당하는 것은 이전에 참조하던 값을 더이상 참조하지 않겠다는 의미. 이는 이전에 할당되어 있던 값에 대한 참조를 명시적으로 제거하는 것을 의미하며, JS엔진은 누구도 참조하지 않는 메모리 공간에 대해 가비지 콜렉션을 수행할 것.

var foo = 'Lee';
// 이전 참조를 제거. foo 변수는 더 이상 'Lee'를 참조하지 않음.
// null을 대입하기보단 변수의 scope를 좁게 만드는 편이 좋음.
foo = null;

함수가 유효한 값을 반환할 수 없는 경우 명시적으로 null을 반환하기도 함.
ex) document.querySelector 메서드는 조건에 부합하는 HTML 요소를 검색할 수 없는 경우 에러 대신 null을 반환함.

<!DOCTYPE html>
<html>
<body>
 <script>
 var element = document.querySelector('.myClass');
 // HTML 문서에 myClass 클래스를 갖는 요소가 없다면 null을 반환한다.
 console.log(element); // null
 </script>
</body>

6.7 심벌 타입

변경 불가능한 원시 타입의 값. 심벌 값은 다른 값과 중복되지 않는 유일무이한 값임.
주로 이름이 충돌할 위험이 없는 객체의 유일한 프로퍼티 키를 만들기 위해 사용함.
심벌 외의 원시값은 리터럴을 통해 생성하지만 심벌은 Symbol 함수를 호출해 생성함.

// 심벌 값 생성
var key = Symbol('key');
console.log(typeof key); // symbol
// 객체 생성
var obj = {};
// 이름이 충돌할 위험이 없는 유일무이한 값인 심벌을 프로퍼티 키로 사용한다.
obj[key] = 'value';
console.log(obj[key]); // value

상세 내용은 뒷장에서 다시 공부

6.8 객체 타입

JS를 이루고 있는 거의 모든 것이 객체. 이후 뒷장에서 다시 공부

6.9 데이터 타입의 필요성

6.9.1 데이터 타입에 의한 메모리 공간의 확보와 참조

  • 값은 메모리에 저장하고 참조할 수 있어야함.
  • 타입을 지정하여 메모리 공간의 크기를 정하면 낭비와 손실없이 값을 저장할 수 있음
  • 값을 참조할때 한번에 읽을 메모기 공간의 크기를 결정하기 위해서

6.9.2 데이터 타입에 의한 값의 해석

  • 메모리에서 읽어 드린 2진수를 어떻게 해석할지 결정하기 위해 타입이 필요함

6.10 동적 타이핑

  • 정적 타입 언어는 변수의 타입을 변경할 수 없음
  • JS는 동적 타입 언어로 변수의 타입을 변경할 수 있음
  • 동적 타입의 경우 의도치 않은 오류가 발생할 수 있음
  • 이를 방지하기 위해 변수보다는 상수 선언을 우선할 것
  • 그리고 왠만하면 TS를 쓸 것

소감

메모리에 대한 이야기가 계속해서 반복된다.
타입은 솔직히 기본 개념만 익히고 넘어가고 TS를 쓰는게 맞다고 생각.

이 포스팅은 쿠팡 파트너스 활동의 일환으로, 이에 따른 일정액의 수수료를 제공받습니다.