728x90
반응형

데이터와 정보

1. 데이터의 유형

-정성적 데이터: 저장/검색/분석에 많은 비용이 소모 되는 언어, 문자 형태의 데이터

                             ex) 회사 매출이 증가함 등

-정형적 데이터: 정형화된 데이터로 수치, 도형, 기호 등의 형태를 가진 데이터

                            ex) 나이, 몸무게, 주가 등

2. 지식경영의 핵심 이슈

-암묵지

       # 의미: 학습과 경험을 통해 개인에게 체화되어 있지만 겉으로 드러나지 않는 지식

       # 특징: 사회적으로 중요하지만 공유되기 어려움

       # 상호작용: 공통화, 내면화

-형식지

       # 의미: 문서나 메뉴얼처럼 형상화된 지식

       # 특징: 전달과 공유가 용이함

       # 상호작용: 표출화, 연결화

3. DIKW 피라미드

-데이터(Data): 존재형식을 불문하고, 타 데이터와의 상관관계가 없는 가공하기 전의 순수한 수치나 기호를 의미

                               ex) A마트는 100원에, B마트는 200원에 연필을 판매한다.

-정보(Information): 데이터의 가공 및 상관관계간 이해를 통해 패턴을 인식하고 그 의미를 부여한 데이터

                               ex) A마트의 연필이 더 싸다.

-지식(Knowledge): 상호 연결된 정보 패턴을 이해하여 이를 토대로 예측한 결과물 

                               ex) 상대적으로 저렴한 A마트에서 연필을 사야겠다.

-지혜(Wisdom): 근본 원리에 대한 깊은 이해를 바탕으로 도출되는 창의적 아이디어

                               ex) A마트의 다른 상품들도 B마트보다 쌀 것이라고 판단한다.

 

데이터베이스 정의와 특징

 1. 데이터베이스 정의

-EU: 체계적이거나 조직적으로 정리되고 전자식 또는 기타 수단으로 개별적으로 접근할 수 있는 독립된 저작물, 데이터 또는 기타 소재의 수집물

-국내 저작권법: 소재를 체계적으로 배열 또는 구성한 편집물로 개별적으로 그 소재에 접근하거나 그 소재를 검색할 수 있도록 한 것

-국내 컴퓨터용어사전: 동시의 복수의 적용 업무를 지원할 수 있도록 복수 이용자의 요구에 대응해서 데이터를 받아들이고저장, 공급하기 위하여 일정한 구조에 따라서 편성된 데이터의 집합

2.데이터베이스 특징

-통합된 데이터(Integrated Data): 동일한 내용의 데이터가 중복되어 있지 않다는 것을 의미. 데이터 중복은 관리상의 복잡한 부작용을 초래

-저장된 데이터(Stored Data): 자기 디스크나 자기 테이프 등과 같이 컴퓨터가 접근할 수 있는 저장 매체에 저장되는 것을 의미. 데이터 베이스는 기본적으로 컴퓨터 기술을 바탕으로 한 것

-공용 데이터(Shared Data): 여러 사용자가 서로 다른 목적으로 데이터를 공동으로 이용한다는 것을 의미. 대용량화되고 구조가 복잡한 것이 보통

-변화되는 데이터(Changeable Data): 데이터베이스에 저장된 내용은 곧 데이터베이스의 현 시점에서의 상태를 나타냄. 다만 이 상태는 새로운 데이터의 삽입, 기존 데이터의 삭제, 갱신으로 항상 변화하면서도 항상 현재의 정확한 데이터를 유지해야 함.

 

빅데이터의 이해

1. 빅데이터의 정의

-관점에 따른 정의

       # Mckinsey(2011): 데이터 규모에 중점을 둔 정의 →  일반적인 데이터베이스 소프트웨어로 저장, 관리, 분석할 수 있는 범위를 초과하는 규모의 데이터

       # IDC(2011): 분석 비용 및 기술에 초점을 둔 정의    다양한 종류의 대규모 데이터로부터 저렴한 비용으로 가치를 추출하고, 데이터의 초고속 수집/발굴/분석을 지원하도록 고안된 차세대 기술 및 아키텍처

       # 가트너그룹(Gartner Group) 더그 래니(Doug Laney)의 3V

               ▶Volume: 데이터의 규모 측면

               ▶Variety: 데이터의 유형과 소스 측면

               ▶Velocity: 데이터의 수집과 처리 측면

-빅데이터 정의의 범주 및 효과

       # 데이터 변화

               ▶규모 (Volume)

               ▶형태 (Variety)

               ▶속도 (Velocity)

       # 기술 변화

               ▶데이터 처리, 저장, 분석기술 및 아키텍처

               ▶클라우드 컴퓨팅 활용

       # 인재, 조직 변화

               ▶Data Scientist 같은 새로운 인재 필요

               ▶데이터 중심 조직

2. 출현 배경과 변화

-산업계의 출현배경: 고객 데이터 축적, 보유를 통해 데이터에 숨어있는 가치를 발굴

-학계의 출현배경: 거대 데이터를 다루는 학문 분야가 늘어나면서 필요한 기술 아키텍처 및 통계 도구의 발전

-기술발전으로 인한 출현 배경: 관련기술(저장 기술, 인터넷 보급, 클라우드 컴퓨팅, 모바일 혁명)의 발달

3. 빅데이터에 거는 기대의 비유적 표현

-산업혁명의 석탄과 철: 제조업 뿐만 아니라 서비스 분야의 생산성을 획기적으로 끌어올려 사회/경제/문화/생활 전반에 혁명적 변화를 가져올 것으로 기대 됨

-21세기의 원유: 경제 성장에 필요한 정보를 제공함으로써 사업 전반의 생산성을 한 단계 향상시키고, 기존에 없던 새로운 범주의 산업을 만들어낼 것으로 전망됨

-렌즈: 렌즈를 통해 현미경이 생물학 발전에 미쳤던 영향만큼이나 데이터가 산업 발전에 영향을 미칠것으로 기대 됨

-플랫폼: '공동 활용의 목적으로 구축된 유무형의 구조물'로써의 다양한 서드파티  비즈니스에 활용되면서 플랫폼 역할을 할 것으로 전망됨 ex) 카카오톡, 페이스북 등

4. 빅데이터가 만들어 내는 본질적인 변화

-사전처리 → 사후처리

-표본조사 →전수조사

-질 → 양

-인과관계  상관관계

 

빅데이터의 가치와 영향 

1. 빅데이터의 가치 산정이 어려운 이유

-데이터 활용방식

-새로운 가치 창출

-분석기술 발전

2. 빅데이터의 영향

       # 기업

               ▶영향: 혁신, 경쟁력제고, 생산성향상

               ▶내용: 빅데이터를 활용해 소비자의 행동을 분석하고 시장 변동을 예측해 비즈니스 모델을 혁신하거나 신사업                                을 발굴한다.

       # 정부

               ▶영향: 환경 탐색, 상황분석, 미래대응

               ▶내용: 기상, 인구이동, 각종 통계, 법제 데이터 등을 수집해 사회 변화를 추정, 정보를 추출한다.

       # 개인

               ▶영향: 목적에 따른 활용

               ▶내용: 개인은 빅데이터를 서비스하는 기업의 출현으로 비용이 지속적으로 하락하여 정치인이나 대중 가수 등                                이 인지도 향상에 빅데이터를 활용 한다.

 

비즈니스 모델

1. 빅데이터 활용사례

       # 관점에 따른 정의

               ▶구글: 사용자의 로그 데이터를 활용한 검색엔진 개발. 기존 페이지랭크 알고리즘 혁신

               ▶월마트: 고객의 구매패턴을 분석해 상품 진열에 활용

       # 정부

               ▶실시간 교통정보 수집, 기후 정보, 소방 서비스 등을 위해 실시간 모니터링을 실시하여 국가 안전 확보에 활용

       # 개인

               ▶정치인: 선거 승리를 위해 사회관계망 분석을 활용해 유세 지역 선거

               ▶가수: 팬들의 음악 청취 기록을 분석해 공연 시 노래 순서 선정

2. 빅데이터 활용 기본 테크닉

-연관 규칙 학습, 군집분석, 유전 알고리즘, 기계학습, 회귀분석, 감정분석, 소셜네트워크분석(=사회관계망분석)

 

위기 요인과 통제방안

1. 위기 요인에 따른 통제 방안

       # 사생활 침해 → 동의에서 책임으로

       # 책임 원칙 훼손 → 결과 기반 책임 원칙 고수

       # 데이터 오용 알고리즘 접근 허용

 

미래의 빅데이터

1. 빅데이터 활용의 3요소

       # 데이터: 모든 것의 데이터 화(Datafication)

       # 기술: 진화하는 알고리즘, 인공지능

       # 인력: 데이터 사이언티스트, 알고리즈미스트

 

빅데이터 분석과 전략 인사이트

1. 빅데이터 회의론의 원인

       # 부정적 학습효과  과거의 고객관계관리(CRM): 공포 마케팅, 투자대비 효과 미흡

       # 부적정한 성공 사례 빅데이터가 필요 없는 분석사례, 기존 CRM의 분석 성과를 빅데이터 분석 성과로 과대 포장

==>단순히 빅데이터에 포커스를 두지 말고 , 분석을 통해 가치를 만드는 것에 집중해야 함

2. 일차원적인 분석 vs 전략 도출을 위한 가치 기반 분석

       # 산업별 분석 애플리케이션

               ▶금융 서비스: 신용점수 산정, 사기 탐지, 가격 책정, 프로그램 트레이딩, 클레임 분석, 고객 수익성분석

               ▶병원: 가격 책정, 고객 로열티, 수익 관리

               ▶에너지: 트레이딩, 공급, 수요 예측

               ▶정부: 사기 탐지, 사례관리, 범죄 방지, 수익 최적화

       # 전략 도출 가치 기반 분석

               ▶전략적 통찰력의 창출에 포커스 → 해당 사업에 중요한 기회를 발굴, 주요 경영진의 지원을 얻게됨

               ▶분석의 활용 범위를 더 넓고 전략적으로 변화 시키고, 전략적 인사이트를 주는 가치 기반의 분석 단계로 나아                      가야 함

 

전략 인사이트 도출을 위한 필요 역량

1. 데이터 사이언스의 의미

-데이터 사이언스란 데이터 공학, 수학, 통계학, 컴퓨터 공학, 시각화, 해커의 사고방식, 해당 분야의 전문 지식을 종합한 학문

2. 데이터 사이언스의 구성요소

-데이터 사이언스의 영역

       # 분석적 영역

       # 데이터 처리와 관련된 IT영역

       # 비즈니스 컨설팅 영역

-데이터 사이언티스트의 요구 역량

       # Hard Skill

               ▶빅데이터에 대한 이론적 지식

               ▶분석 기술에 대한 숙련

      # Soft Skill

               ▶통찰력 있는 분석

               ▶설득력 있는 전달

               ▶다분야 간 협력

3. 데이터 사이언스 : 과학과 인문의 교차로

-분석 기술보다 더 중요한 것은 소프트 스킬로 전략적 통찰을 주는 분석은 단순 통계 및 데이터 처리 능력보다 스토리텔링, 커뮤니케이션, 창의력, 열정, 직관력, 비판적 시각, 대화 능력 등의 인문학적 요소가 필요함

4. 전략적 통찰력과 인문학의 부활

-외부 환경적 측면에서 본 인문학의 열풍과 이유

      # 컨버전스 → 디비전스

               ▶내용: 단순 세계화에서 복잡한 세계화로의 변화

               ▶예시: 규모의 경제, 세계화, 표준화, 이성화 → 복잡한 세계, 다양성, 관계, 연결성, 창조성

      # 생산 → 서비스

               ▶내용: 비즈니스 중심이 제품생산에서 서비스로 이동

               ▶예시: 고장 나지 않는 제품의 생산 → 뛰어난 서비스로 응대

      # 생산 → 시장창조

               ▶내용: 공급자 중심의 기술경쟁에서 무형자산의 경쟁으로 변화

               ▶예시: 생산에 관련된 기술 중심, 기술 중심의 대규모 투자 → 현재 패러다임에 근거한 시장 창조

                                                                                                             현지 사회와 문화에 관한 지식

     

빅데이터 그리고 데이터 사이언스의 미래

1. 빅데이터의 시대

-빅데이터 분석은 선거결과에 결정적인 영향을 미칠 수도 있고, 기업들에게 비용절감, 시간 절약, 매출증대, 고객서비스 향상, 신규 비즈니스 창출, 내부 의사결정 지원 등에 있어 상당한 가치를 발휘하고 있음

2. 빅데이터 회의론을 넘어 가치 패러다임의 변화

      # 과거 - Digitalization

               ▶아날로그 세상을 어떻게 효과적으로 디지털화하는가가 과거의 가치 창출 원천

      # 현재 - Connection

               ▶디지털화 된 정보와 대상들은 서로 연결 시작

               ▶연결을 더 효과적이고 효율적으로 제공하는가가 성공요인

      # 미래 - Agency

               ▶복잡한 연결을 얼마나 효과적이고 믿을 수 있게 관리하는가의 이슈

3. 데이터 사이언스의 한계와 인문학

-데이터 사이언스의 한계

      # 분석과정에서는 가정 등 인간의 해석이 개입되는 단계를 반드시 거침

      # 분석결과가 의마하는 바는 사람에 따라 전혀 다른 해석과 결론을 내릴 수 있음

      # 아무리 정량적인 분석이라도 모든 분석은 가정에 근거함

-데이터 사이언스의 인문학

      # 인문학을 이용하여 빅데이터와 데이터 사이언스가 데이터에 묻혀 있는 잠재력을 풀어냄

      # 새로운 기회를 찾고, 누구도 보지 못한 창조의 밑그림을 그릴 수 있는 힘을 발휘하게 될 것

 

 

728x90
반응형

'Certificate > ADSP' 카테고리의 다른 글

[ADsP] 공부 - 3과목  (2) 2023.10.16
[ADsP] 공부 - 2과목  (0) 2023.10.16
[ADsP] 단답형 문제 정리 - 3과목  (1) 2023.10.15
[ADsP] 단답형 문제 정리 - 2과목  (0) 2023.10.14
[ADsP] 단답형 문제 정리 - 1과목  (0) 2023.10.14

+ Recent posts