Skip to content
View ahaampo5's full-sized avatar

Block or report ahaampo5

Block user

Prevent this user from interacting with your repositories and sending you notifications. Learn more about blocking users.

You must be logged in to block users.

Maximum 250 characters. Please don’t include any personal information such as legal names or email addresses. Markdown is supported. This note will only be visible to you.
Report abuse

Contact GitHub support about this user’s behavior. Learn more about reporting abuse.

Report abuse
ahaampo5/README.md

🌿 AI Engineer

Kaggle

🔖 목차

👤 소개

안녕하세요! 저는 Kaggle Expert AI Engineer 김준철 입니다.
다양한 대회의 경험을 바탕으로 CV, NLP, Tabular 서비스 개발을 위한 데이터 전처리, 학습, 평가, 서빙 파이프라인 구축에 익숙하고 LLM, VLM, Agent 연구에 기여하고 있습니다.
또한, 다수의 RAG, Chatbot, Agent 프로젝트 경험이 있으며 지속적인 유지, 보수, 개선을 솔루션을 통해 대고객 서비스의 품질을 지향하고 있습니다.

📂 주요 프로젝트

1. Web Agent, Computer Use Agent R&D (4 개월, 2025.03 ~ 2025.05)

“설치형 통합 Agent 솔루션 개발”

  • Tools : LangGraph, MCP, Typescript, Electron
    • 설치형 Agent 솔루션 개발: LangGraph, Electron 기반 솔루션 개발
    • Agent Context Engineering 연구: Reasoning, Memory, Workflow 연구 및 최적 조합 연구
    • Multi-Agent System (MAS) 실험 진행: Tree, Graph, Supervisor, Sequential 성능 비교

2. General LLM & VLM Pipeline 구축 (6 개월, 2024.06 ~ 2024.11)

“LLM, VLM 데이터, 학습, 평가 파이프라인 개발”

  • Tools : Accelerate, FSDP, Jinja2, InternVL, LLaVA
    • 데이터 파이프라인: Jinja2 Prompt 관리, 번역, 질문, 문서, 캡션 생성 파이프라인 구축
    • LLM, VLM 학습: 0.6B~32B Full, LoRA Tuning, Multi-node Training 전체 관리

3. 우리은행 AI Banker (LLM 기반 대고객 챗봇 솔루션) (12 개월, 2023.07 ~ 2024.06)

“LLM 챗봇의 전체 데이터 관리, 모델 학습, 평가 총괄”

  • Tools : Deepspeed, vLLM, Rasa, JMeter
    • 데이터: 프롬프트/변수 관리, 데이터 생성 및 중복제거, Delexicalize/Lexicalize 파이프라인 구축
    • 도메인 특화 LLM 학습: 7B, 13B Full-Tuning, Partial Tuning(LoRA), RLHF(DPO, ORPO)
    • LLM 평가: 정확도 평가(NLU, NER, NLG, RAG tasks), 속도 평가(TPS, Latency)

4. 한국어 금융 LLM 개발 (8 개월, 2023.03 ~ 2023.10)

“7B LLM 경진대회 및 데이터 구축 프로젝트에 참여. 영어 부문 2등, 한글 부문 1등 달성”

  • Tools : LoRA, deduplicate-text-datasets
    • Huggingface LLM Leaderboard Challenge (7B): Model Mixing/Merging, Data Sampling
    • Upstage Ko-LLM Leaderboard Challenge (7B): 한국어 데이터 구축, DPO 학습

5. Multi-Modal RAG Chatbot (12개월, 2022.11 ~ 2023.04 / 2024.06 ~ 2024.12)

“데이터 구축 파이프라인 및 데모 개발을 기획하여 솔루션의 개발 관리”

  • Tools : Selenium, Huggingface
    • 데이터 크롤링 : 신용카드, 예금/적금, FAQ 데이터 구축 및 버전 관리
    • Retriever & Reader 모델링: bge, CLIP Embedding, Table QA, VQA 모델 개발

6. 우리은행 MyData AI 모델링 및 서비스 배포 (8 개월, 2022. 04 ~ 2022. 11)

“세 가지 AI 서비스 관리, DB 데이터 정제, ML 모델링 및 서비스 배포 담당”

  • Tools : OracleDB, Spark, Sklearn
    • AI Service: 72개 금융 DB를 바탕으로 Feature Engineering, ML 모델링, SQL 실시간 서비스 배포 서비스 개발
    • 고객사 의사소통: 서비스 요건 구체화, 결함 관리, 근거자료 준비

🛠️ 기술 스택

구분 항목
Language Python, SQL, TypeScript
Library/Framework DL: PyTorch, Huggingface, MCP, LangGraph
ML: scikit-learn, Spark
Data: Jinja, MySQL, OpenCV
Train: Deepspeed, FSDP, TRL
Serve: vLLM, SGLang
Dev Tools Dev Setting: Docker, Kubernetes, Git, VSCode
Backend: MySQL, Weaviate, JMeter
Frontend: Streamlit
Cloud/Infra AWS EC2, Azure, Naver Cloud

🏃‍♀️ History

- 2025.03~Now     • GenON (구 MNC) • Web/Computer Use Agent R&D • LangGraph·Electron 기반 솔루션 개발
- 2024.06~2025.01 • MNC • General LLM & VLM Pipeline 구축 • 데이터·학습·평가 파이프라인 개발
- 2023.07~2024.06 • MNC • 우리은행 AI Banker 챗봇 • 데이터 관리·LLM 학습(RLHF 포함)·평가 총괄
- 2023.03~2023.06 • MNC • 한국어 금융 LLM 개발 • 7B LLM 경진대회 1위·데이터 구축, DPO·LoRA 튜닝
- 2022.11~2023.03 • MNC • Multi-Modal RAG Chatbot • 크롤링·Prompt 설계·RAG 개발 관리
- 2022.04~2022.11 • MNC • 우리은행 MyData AI 모델링 • DB 정제·ML 모델링·서비스 배포
- 2021.07~2022.05 • YearDream • Algorithm, ML/CV/NLP 모델링 • 
- 2021.01~2021.06 • NAVER boostcamp • ML/CV 모델링 • Tabular/Object Detection, Segmentation, OCR

🏆 Competitions

Type Date Title Contents Host
Competition 2022.5~7 UW-Madison GI Tract Image Segmentation 3D Semantic Segmentation
은메달 50th out of 1367 teams
Kaggle
Competition 2022.2~4 Happy Whale Open Set Classification - Metric Learning
은메달 47th out of 1499 teams
Kaggle
Competition 2022.1~4 Ubiquant Market Prediction Market Prediction
동메달 177th out of 2893 teams
Kaggle
Competition 2021.12 옛한글 OCR AI OCR(Localization,Recognition)-Ancient Korean
대상
과학기술정보통신부
Competition 2021.12 NSML Small Object Detection Small Object Detection
대상 1rd out of 20 Teams
과학기술정보통신부
Competition 2021.7~8 DACON Camera Image Quality Improvement Camera Image Enhancement(Private)
동메달 3rd out of 228 Teams
LG AI Research
Competition 2021.5~6 boostcamp AI Tech Competition Math Formula Recognition
1st out of 12 Teams
NAVER CONNECT
Competition 2021.3 boostcamp AI Tech Competition Recycle Image Segmentation
2nd out of 24 Teams
NAVER CONNECT

✉️ Contact

Pinned Loading

  1. OCR_ancient_korean OCR_ancient_korean Public

    2021 옛한글 OCR 인공지능 학습데이터 해커톤

    Jupyter Notebook 1

  2. SOChallenge SOChallenge Public

    Forked from Lala-chick/SOChallenge

    Python