
CONTACT
📞 010-2054-4243
📩 [email protected]
🌐 https://dont-make-excuses.tistory.com/18
🎮 https://coinking.site
TECH SKILLS
- Apache Spark
- Apache Kafka
- Apache Hadoop
- Python
- InfluxDB
- Grafana
- AWS Lambda
- Amazon S3
- Amazon DynamoDB
- Amazon Kinesis
I’VE ALSO USED…
- Java
- JS
- Spring
- MYSQL
- PostgreSQL
- HTML, CSS
유일한 | 데이터 엔지니어 (신입)
저는 제한된 환경에서 최적의 솔루션을 제시하는 문제 해결력이 뛰어난 데이터 엔지니어 입니다.
RaspberryPi 기반 클러스터를 구축하고 Apache Hadoop (YARN, HDFS)과 Apache Spark (Spark DataFrame)을 활용하여 22년치 한국 대기오염 데이터를 분석하였으며, 상용 PC의 Pandas와 데이터 분석 성능을 비교하는 연구를 진행하여 KCC 2024 학부생 최우수 논문을 수상하였습니다.
이 경험을 바탕로, 비트코인 모의투자 게임 개발 시 발생한 클라우드 서비스 비용 문제를 해결하기 위해 AWS EMR 대신 LattePanda SBC 기반 온프레미스 분산 병렬 컴퓨팅 환경을 구축하여 **서버 비용을 94% 절감(월 $139.10 → $7)**했습니다.
비용 최적화뿐만 아니라, 실시간 데이터 처리 성능을 극대화하기 위해 Kafka Streams consumer group의 **파티션을 1개 → 10개로 확장하여 분당 최대 5,000건 → 최대 30,000건(약 500% 향상)**의 Upbit 거래 데이터를 처리할 수 있도록 인프라를 구축했습니다.
인턴
학부 연구생 Ubicomp Lab (순천향대학교) 2022.06 - 2024.09
✅ 업무 및 연구 참여
- 강의 조교(TA): IoT Platform 강의 실습 지원 및 기술 교육
- 연구실 프로젝트: 연구실 자체 개발 미세먼지 측정 장치를 통해 PM-2.5, PM-10, O₃, NO₂, CO, SO₂, 온·습도 데이터를 수집하여 InfluxDB & Grafana를 활용한 시계열 데이터 시각화
- 정기적인 랩미팅 참여 및 연구 성과 발표
✅ 논문 및 연구 성과
- 논문 1저자: 사물인터넷 환경 저비용 대용량 데이터 분석 시나리오 설계 및 성능 비교
- 성과: KCC2024 학부생 부문 최우수 논문 수상
홈페이지: https://sites.google.com/view/ubicomplab/
논문
‘사물인터넷 환경 대용량 데이터 분석 시나리오 설계 및 성능 비교’ 1 저자 2024.06
✅ 연구 개요
- 저비용 대용량 데이터 분석 환경 구축: 라즈베리파이 기반 클러스터를 활용하여 Apache Hadoop (YARN, HDFS) 및 Apache Spark (DataFrame) 를 적용한 분산 데이터 분석 시스템 구축
- 클러스터 성능 비교: 라즈베리파이 기반 저비용 클러스터와 상용 컴퓨터 간 대용량 데이터 분석 작업 성능 비교
- 실제 사물인터넷 환경 데이터 활용: 22년치 한국 대기오염 (PM-2.5, PM-10, O₃, NO₂, CO, SO₂) 데이터를 활용하여 실험 진행
- 기술 스택: Apache Hadoop (YARN, HDFS), Apache Spark (DataFrame), Pandas, Grafana
- 한국정보과학회 주관 KCC2024 (한국컴퓨터종합학술대회) 학부생 부문 최우수 논문 수상 🏆
- 논문 링크: https://www.dbpia.co.kr/journal/articleDetail?nodeId=NODE11862340
프로젝트
비트코인 모의투자 게임 ‘코인예측왕’ 개발 2024.10 - 2025.01
✅ 프로젝트 개요: Upbit 거래소의 실시간 암호화폐 데이터를 활용하여 초보 투자자들이 낮은 투자 경험을 쌓을 수 있는 모의투자 게임 개발 및 런칭
담당 역할
✅ 데이터 파이프라인 설계 및 구축
- Upbit WebSocket API를 활용하여 실시간 암호화폐 데이터를 수집하고, Kafka Producer를 통해 분당 최대 30,000건의 데이터를 Kafka 클러스터로 스트리밍
- 지연시간 최소화와 비용 최적화를 감안하여 Kafka Streams와 AWS DynamoDB를 활용한 ELT(Extract, Load, Transform) 파이프라인 구축
✅ 유저 통계 및 투자 성향 분석
- AWS Kinesis 및 S3를 활용하여 클릭스트림(Clickstream) 데이터 수집 및 적재, Apache Spark DataFrame 기반 실시간 데이터 분석
- 유저 투자 패턴 및 잔고 변화 분석, 상위 10% 유저의 투자 성향 및 의사 결정 패턴 등 다양한 통계 도출
- AI 추천 시스템 성과 평가: AI 추천을 따른 유저들의 투자 성공률 및 수익률 분석을 통해 추천 알고리즘의 효과성 측정
✅ 서버리스 백엔드 아키텍처 구축
- AWS Lambda + API Gateway 기반의 서버리스 REST API 설계, 월 1달러 미만의 비용 최적화된 백엔드 시스템 구축
🎮 게임 링크: https://coinking.site
수상
- SW벤처스타트업 앱 경진대회 대상 - ‘천원의 아침밥’ 실시간 사용자 수 모니터링 앱
2024.11
- SW벤처스타트업 게임 경진대회 최우수상 - 비트코인 모의투자 게임 ‘코인예측왕’
2024.11
- SW융합대학 학술제 SW프로젝트 경진대회 장려상 - NFC를 이용한 OCR 기반 시각장애인 사물 인식 보조 서비스
2024.11
- SW벤처스타트업 아이디어 공모전 최우수상 - OCR, Open AI 자연어처리 기반 전세 사기 방지 앱
2024.10
- SW벤처스타트업 코딩경시 대회 우수상
2024.09
- KCC2024 학부생 논문경진대회 최우수상 - ‘사물인터넷 환경 대용량 데이터 분석 시나리오 설계 및 성능 비교’
2024.07
자격증
- ADSP
2024.11
- SQLD
2024.09
학력
- 서령고등학교 입학
2016.03
- 순천향대학교 사물인터넷학과 입학
2019.03
- 순천향대학교 사물인터넷학과 졸업
2025.02
대외 활동
- 벤처스타트업 아카데미 사업 성과공유 페스티벌 (주최-벤처기업협회)
2024.12
- 서퍼톤 (주최-중소벤처기업부)
2024.08
- GIST 해커톤 (주최-GIST)
2022.06