빅데이터 공통기반 플랫폼인 Petamap(페타맵) 솔루션
- - 정부 3.0과제와 고도화 과제인 Big Data 구축 방향에 맞춰, 공공데이터 개방형시스템과 연계 가능
- - 고객이 분석하고자 하는 다양한 목표시스템을 하나로 묶는 큐레이션 과정을 통해, 더욱 구체화된 맞춤형 분석 시스템으로 서비스 제공
목표시스템(구성도)
(2).png)
오픈소스 기반 빅데이터 플랫폼
- 수집 : Flume Ng , Sqoop
- 분석 : Spark, Hive, MapReduce, Mahout, R
- Crewler : 자체개발 Crawler Engine
- 분산 저장 : Hadoop FS, HBase
- 검색 : Elastic Search, Lucene
- 클러스터 관리 : Zookeeper
- - 정형/비정형 데이터셋 정의
- - 데이터 수집 방식 정의
- - Restful Open API 활용
- - 데이터 웨어 하우스 활용
- - 다양한 분석을 위한 데이터 마이닝, 텍스트 마이닝 활용
- - 시각화를 위한 툴 사용
빅데이터 분석 및 예측절차
