빅데이터 공통기반 플랫폼인 Petamap(페타맵) 솔루션
- - 정부 3.0과제와 고도화 과제인 Big Data 구축 방향에 맞춰, 공공데이터 개방형시스템과 연계 가능
- - 고객이 분석하고자 하는 다양한 목표시스템을 하나로 묶는 큐레이션 과정을 통해, 더욱 구체화된 맞춤형 분석 시스템으로 서비스 제공
주요기능

- - Cloud Core Engine 구성 기술
- - 융/복합 데이터 검색을 위한 인덱싱 기술 확장
- - 융/복합 데이터 수집을 위한 개별 구조 분석 및 각각의 Data Warehouse 구축 기술
- - User Service 플랫폼과의 데이터 연계를 위한 Data Mart 구축 기술
- - 다양한 데이터 마이닝 기법을 활용한 분석기술
- - Cloud Engine의 분석을 통한 시각화 서비스
[표] 빅데이터 처리를 위한 단계별 프로세스 정의
흐름 | 영역 | 개요 |
---|---|---|
소스 | 내부데이터 | Database, File Management System |
외부데이터 | File, Multimedia, Streaming | |
수집 | Crawling | SNS, 카페, 블로그, URL 등 수집 |
DB Link ETL(Extraction, Transformation, Loading) | 소스 데이터의 추출, 전송, 변환, 적재 | |
프로토콜(SNMP, Syslog) | 데이터셋 정의 후 전송 | |
Agent | 사전정의 생성 후 전송 | |
저장 | NoSQL Database | 비정형 데이터 관리 |
Storage | 빅데이터 저장 | |
Servers | 저렴하고 규격화된 서버 활용 | |
처리 | Mapreduce | 데이터 추출 |
Processing | 다중 업무처리 | |
분석 | NLP(Neuro Linguistic Programming) | 자연어처리 |
Machine Learning | 기계학습을 통해 데이터의 패턴발견 | |
Serialization | 데이터간의 순서화 | |
표현 | Visualization | 데이터를 도표나 그래픽적으로 표현 |
Acquisition | 데이터의 획득 및 재해석 |