빅데이터란 ? 빅데이터 뜻 분석 bio big data 3v 빅 데이터 정의



안녕하세요

오늘날 3차 산업혁명에 이어 4차 산업혁명 시대에 접어들었습니다.

관련하여 빅데이터 라는 단어가 대두되었는데요.

빅데이터란? 그 뜻과 정의가 도대체 무엇인지 궁금하신 분들을 위한 글을 작성할 계획입니다.

빅데이터 분석과 bio big data 3v에 대해서 알아보도록 하겠습니다.



빅데이터란 ? 정의

오늘날 정보통신 분야에서의 화두는 단연 빅데이터이다. 

빅데이터는 기존 데이터보다 너무 방대하여 기존의 방법이나 도구로 수집/저장/분석 등이 어려운 정형 및 비정형 데이터들을 의미한다. 

1분 동안 구글에서는 200만 건의 검색, 유튜브에서는 72시간의 비디오, twitter에서는 27만 건의 트윗이 생성된다. 

세계적인 컨설팅 기관인 매켄지(Mckinsey)는 빅데이터를 기존 데이터베이스 관리도구의 데이터 수집, 저장, 관리, 분석하는 역량을 넘어서는 규모로서 그 정의는 주관적이며 앞으로도 계속 변화될 것이라고 언급하고 있다.



빅데이터 분석 기술

빅데이터를 다루는 처리 프로세스로서 병렬 처리의 핵심은 분할 점령(Divide and Conquer)이다. 

즉 데이터를 독립된 형태로 나누고 이를 병렬적으로 처리하는 것을 말한다. 

빅데이터의 데이터 처리란 이렇게 문제를 여러 개의 작은 연산으로 나누고 이를 취합하여 하나의 결과로 만드는 것을 뜻한다. 

대용량의 데이터를 처리하는 기술 중 가장 널리 알려진 것은 아파치 하둡(Apache Hadoop)과 같은 Map-Reduce 방식의 분산 데이터 처리 프레임워크이다.



빅데이터란 ? 빅데이터 뜻 분석 bio big data 3v 빅 데이터 정의

big data 3v 뜻

빅데이터의 특징으로는 3v를 정의하는 크기(Volume), 속도(Velocity), 다양성(Variety)을 들 수 있다. 

크기는 일반적으로 수십 테라 바이트 혹은 수십 페타바이트 이상 규모의 데이터 속성을 의미한다.

빅데이터의 공통적 특징은 3V로 설명할 수 있다. 

3V는 데이터의 크기(Volume), 데이터의 속도(Velocity), 데이터의 다양성(variety)을 나타내며 이러한 세 가지 요소의 측면에서 빅데이터는 기존의 데이터베이스와 차별화된다. 

데이터 크기(Volume)는 단순 저장되는 물리적 데이터양을 나타내며 빅데이터의 가장 기본적인 특징이다. 데이터 속도(Velocity)는 데이터의 고도화된 실시간 처리를 뜻한다. 

이는 데이터가 생성되고, 저장되며, 시각화되는 과정이 얼마나 빠르게 이뤄져야 하는지에 대한 중요성을 나타낸다. 다양성(Variety)은 다양한 형태의 데이터를 포함하는 것을 뜻한다. 

정형 데이터뿐만 아니라 사진, 오디오, 비디오, 소셜 미디어 데이터, 로그 파일 등과 같은 비정형 데이터도 포함된다.



bio big data

살펴본 바와 같이 빅데이터는 어떠한 한 분야를 나타내거나 한 가지 특징을 개념으로 사용하기 어려운 측면이 있다. 

분석과 활용 과정에 필요한 사항을 설명할 수는 있겠지만 사용 분야마다 중요하게 생각하는 부분은 다를 수 있고, 필요 없는 것도 있을 수 있다. 

또한, 3V, 4V, 5V 등 시간이 지나면서 기존 빅데이터의 특징인 3V에 새로운 속성들이 추가되고 있는 추세이다. 이러한 점이 빅데이터의 정의를 어렵게 만들고 있다. 

앞으로도 빅데이터의 특징은 새롭게 추가될 것으로 보인다. 그러나 빅데이터의 가장 기본적인 속성인 3V는 변하지 않고 빅데이터의 대표적인 특징으로 남을 것이다.



이번 포스팅에서는 빅데이터란? 무엇인지 알아보았습니다.

빅데이터 뜻과 정의를 대략적으로 이해하시고 분석해보시는 것도 좋겠습니다.

더불어 bio big data 3v에 대해 알아보시면 더 좋을 것 같네요.


+ Recent posts