데이터와 정보의 차이
정보 처리(Information Processing) : 데이터에서 정보를 추출하는 과정 또는 방법
정보 시스템(Information System) : 조직 운영에 필요한 데이터를 수집해 저장해두었다가 필요할 때 유용한 정보를 만들어 주는 수단
데이터베이스의 정의와 특징
📍 데이터베이스의 정의
💡 데이터베이스(DB; DataBase)
: 특정 조직 내에서 여러 사용자가 공유하여 사용할 수 있도록 통합해서 저장한 운영 데이터의 집합
→ 정보 시스템 안에서 데이터를 저장하고 있다가 필요할 때 제공하는 역할을 담당
- 통합 데이터 : 최소의 중복과 통제 가능한 중복만 허용하는 데이터
- 공유 데이터 : 특정 조직의 여러 사용자가 함께 소유하고 이용할 수 있는 공용 데이터
- 저장 데이터 : 컴퓨터가 접근할 수 있는 매체에 저장된 데이터
- 운영 데이터 : 조직의 주요 기능을 수행하기 위해 지속적으로 꼭 필요한 데이터
📍 데이터베이스의 특징
- 실시간 접근 - 사용자의 데이터 요구에 실시간으로 응답
- 계속 변화 - 데이터의 계속적인 삽입, 삭제, 수정을 통해 현재의 정확한 데이터를 유지
- 동시 공유 - 서로 다른 데이터를 동시 사용할 뿐만 아니라 같은 데이터의 동시 사용도 지원
- 내용 기반 참조 - 데이터가 저장된 주소나 위치가 아닌 내용으로 참조
형태에 따른 데이터 분류
1. 정형 데이터 (structured data)
: 구조화된 데이터, 미리 정해진 구조에 따라 저장된 데이터
→ 데이터 구조에 대한 설명과 데이터 내용은 별도로 유지됨.
ex) 엑셀의 스프레드시트, 관계 데이터베이스의 테이블
2. 반정형 데이터 (semi-structured data)
: 구조에 따라 저장된 데이터이지만 데이터 내용 안에 구조에 대한 설명이 함께 존재
→ 구조를 파악하는 파싱(parsing) 과정이 필요
→ 보통 파일 형태로 저장
ex) 웹에서 데이터를 교환하기 위해 작성하는 HTML, XML, JSON 문서나 웹 로그, 센서 데이터 등
3. 비정형 데이터 (unstructured data)
: 정해진 구조가 없이 저장된 데이터
ex) 소셜 데이터의 텍스트, 영상, 이미지, 워드나 PDF 문서와 같은 멀티미디어 데이터
특성에 따른 데이터 분류
1. 범주형 데이터 (categorical data)
: 범주로 구분할 수 있는 값, 즉 종류를 나타내는 값을 가진 데이터
→ 크기 비교와 산술적인 연산이 가능하지 않아 질적 데이터라고도 함.
명목형 데이터 : 순서, 즉 서열이 없는 값을 가지는 데이터
ex) 성별, 혈액형, 학과명, 거주 지역 등
순서형 데이터 : 순서, 즉 서열이 있는 값을 가지는 데이터
ex) 학년, 학점, 회원 등급 등
2. 수치형 데이터 (numerical data)
: 크기 비교와 산술적인 연산이 가능한 숫자 값을 가진 데이터, 양적 데이터
이산형 데이터 : 개수를 셀 수 있는 띄엄띄엄 단절된 숫자 값을 가지는 데이터
ex) 고객 수, 판매량, 합격자 수 등
연속형 데이터 : 측정을 통해 얻어지는 연속으로 이어진 숫자 값을 가지는 데이터
ex) 키, 몸무게, 온도, 점수 등
🪄 정성적 데이터 vs. 정량적 데이터
정성적 데이터(qualitative data) - 좁은 의미로는 범주형 데이터. 사람의 주관적인 생각과 평가를 기술한 비정형 데이터.
정량적 데이터(quantitative data) - 좁은 의미로는 수치형 데이터. 객관적인 측정을 통해 수치나 도형, 기호 등으로 표현한 정형 데이터. → 정성적 데이터에 비해 저장 및 처리 측면에서 더 큰 비용이 드는 경우가 많음.
'⚡️ 전공수업 > 데이터베이스' 카테고리의 다른 글
데이터 모델링 (0) | 2025.05.19 |
---|---|
관계 데이터 연산 (0) | 2025.04.29 |
관계데이터 모델 (0) | 2025.04.29 |
데이터베이스 시스템(DBS) (0) | 2025.04.29 |
데이터베이스 관리 시스템(DBMS) (0) | 2025.04.29 |