2단원 데이터
02 디지털 데이터의 활용
1. 데이터 수집과 관리
문제 해결 과정
문제 상황 분석 - 데이터 수집 - 데이터 분석 - 분석 결과 적용
*** 데이터를 수집하기 전에 고려해야 할 것
문제를 효율적으로 해결하려며 ㄴ먼저 문제 상황을 정확히 분석해야 한다.
문제상황분석이란 초기상태, 현재 상태, 목표 상태, 충족시켜야 할 조건(요구사항)을 모두 확인하는 것을 의미한다.
*** 데이터를 수집하는 방법
인터넷 정보 검색, 문헌조사, 설문조사, 인터뷰, 실험
인터넷 검색
- 공공 데이터 포털
: 교육, 국토,금융, 복지 등 사회 현안과 관련된 다양한 데이터를 제공한다.
: 신뢰할 수 있고 정확도가 높은 데이터를 제공한다.
웹크롤링
: 웹 페이지 안에 있는 정보를 찾아 자동으로 전송하는 기술
수집 방법에 따른 자료 분류
양적 자료
: 통계를 통해 수치화된 자료
: 실험 및 관찰을 통한 측정, 객관식 설문조사 등
질적 자료
: 수치화되지 않은 문자나 영상, 음성으로 기록된 자료
: 인터뷰, 현장 방문, 서술형 설문조사 등
*** 검색 연산자
AND : 단어 모두를 포함할 때 사용 (예. 맛집 AND 동네명)
OR : 단어 중 하나 이상을 포함할 때 사용 (예. 예능 금요일 OR 일요일)
- : 뒤에 오는 단어를 제외할 때 사용 (예. 영화 추천 -액션)
* : 0개 이상의 문자 전체를 가리킴. 모드는 단어를 검색할 때 사용 (예. 서울*학교)
" " : 하나의 단어로 인식하여 정확한 구문으로 검색할 때 사용 (예. "5월 전시회")
데이터 관리
데이터 분류 및 정리
수집한 데이터는 목적에 맞게 필요한 것만 골라서 분류해야 한다.
데이터의 종류와 의미, 공통점 등 데이터의 의미나 형식에 따라 분류하고 저장할 수 있다.
*** 속성 : 데이터의 특성을 뜻하고, 의미를 가지면서 더 이상 쪼개지지 않는 데이터의 최소 단위다.
데이터 저장
데이터를 저장할 때는 파일의 내용을 유추할 수 있도록 제목을 구체적으로 지정하는 것이 좋다.
*** 날짜를 나타내는 형식에서 Y는 Year(연도), M은 Month(월), D는 Day(일)을 의미한다.
데이터 공유
다른 사람과 데이터를 공유할 때는 이메일, 메신저, 사회 관계망 서비스(SNS), 웹페이지 등을 활용하면 효과적이다.
*** 클라우드 컴퓨팅 서비스 : 인터넷을 통해 서버, 데이터베이스 등 컴퓨팅 자원을 사용할 수 있는 서비스
2. 데이터 구조화
데이터를 체계적으로 정리하는 것
데이터를 구조화하면 필요한 데이터를 손쉽게 알아낼 수 있다.
목록, 표, 다이어그램
데이터를 구조화하는 대표적인 방법
목록
데이터를 일정 기준에 맞추어 순서대로 나열한 형태다.
음식 조리법, 오늘의 할 일 목록, 버킷리스트 등
표
데이터를 가로와 세로라는 두 기준으로 나누어 표현한 형태다.
스프레드시트 소프트웨어(엑셀)를 사용하면 데이터의 추가, 삭제, 정렬, 계산 등이 편리하며 방대한 데이터를 손쉽게 관리할 수 있다.
계산서, 시간표 등
다이어그램
기호, 도형, 선, 색상 등을 사용하여 데이터의 관계, 과정 등을 한 눈에 파악하기 쉽도록 이미지로 나타낸 것이다.
계층형 다이어그램과 그래프형 다이어그램이 대표적이다.
계층형 다이어그램
데이터의 상하관계를 계층 구조로 표현한다.
토너먼트 대진표, 가계도
그래프형 다이어그램
데이터의 연결 상태를 점과 선으로 나타낸다.
지하철 노선도, 사회 관계망
3. 데이터 분석
데이터 분석이란 데이터가 가지고 있는 의미, 관계 등을 바탕으로 문제 해결의 방향을 결정하기 위한 도구이다.
*** 빅데이터 : 규모가 엄청나게 큰 정보를 의미하며, 일상생활과 인터넷 사용 등 다양한 활동에서 생성된다. 최근에는 빅데이터를 분석하여 가치 있는 정보를 찾아내는 능력이 중요해지고 있다.
데이터를 구조화하면 데이터 간 다양한 관계나 반복되는 패턴 등을 찾을 수 있다. 주로 시간의 흐름에 따른 데이터의 변화를 파악할 수 있는 막대그래프 형태로 나타낸다.

