Train High, Infer Low - 머신러닝 학습과 서빙의 FP32, FP16, BF16, INT8 정밀도 선택
머신러닝 모델을 프로덕션에 배포할 때 가장 많이 고민하는 것 중 하나가 바로 수치 정밀도(Numerical Precision) 선택입니다. FP32로 학습한 모델을 FP16으로 서빙해도 될까? INT8 양자화는 언제 해야 할까? 이번 글에서는 정밀도 선택 전략을 정리했습니다.
TL;DR - 바쁜 분들을 위한 요약
"Train High, Infer Low" - 학습은 높은 정밀도로, 서빙은 낮은 정밀도로
상황추천 조합메모리 절감안정성/품질비고
LLM 학습/서빙FP32+BF16 Mixed 학습 → BF16 추론50%⭐⭐⭐⭐⭐가장 일반적인 선택, 넓은 범위(±3.4×10³⁸), 수치 안정성 우수
고성능 서빙FP32 학습 → BF16 추론50%⭐⭐⭐⭐⭐A100, H100 등 최신 GPU 권장
컴퓨터 비전 추론 (제한적)FP32 학습 → FP16 추론50%⭐⭐⭐⚠️ 오버플로우 위험 (범위 ±65K)
모바일/엣지 디바이스FP32 학습 → INT8 추론 (QAT)75%⭐⭐정확도 손실...
2026-01-06 09:00:00 |
44BITS
[뉴스] 앤트로픽, 클로드 모델 품질 저하 버그 수정 완료
앤트로픽이 2025년 8-9월 클로드 모델에서 발생한 품질 저하 버그 2건을 수정 완료했다고 발표했습니다. 소네트 4.0과 하이쿠 3.5 모델이 영향을 받았으며, 오푸스 4.1은 계속 모니터링 중입니다.
2025-09-09 09:00:00 |
44BITS
도커(Docker) 입문편 컨테이너 기초부터 서버 배포까지
도커(Docker)는 2013년 등장한 컨테이너 기반 가상화 도구입니다. 도커를 사용하면 컨테이너를 쉽게 관리할 수 있으며, 이미지를 만들어 외부 서버에 배포하는 것도 가능합니다. 이 글에서는 도커를 시작하는 하는 사람들을 대상으로 도커의 기본 기능에 대해서 소개하고, 도커 허브와 Fly.io을 사용해 직접 만든 이미지로 서버 애플리케이션을 배포하는 방법을 소개합니다.
2025-09-09 09:00:00 |
44BITS
구글 Gemini API 빌링 버그: 8월 하순부터 과다 청구 이슈 발생중
구글 Gemini API에서 8월 하순부터 과다 청구 이슈가 발생중입니다. 일부 사용자들은 실제로 사용하지 않은 이미지 생성 요청이 리퀘스트로 잡히고 비용이 청구되는 문제를 겪고 있습니다. 9월 현재도 지속중이니 각별한 주의가 필요합니다.
2025-09-04 09:00:00 |
44BITS
미니 PC로 서버 운영하기
클라우드와 온프레미스의 높은 월 비용을 줄이기 위해 미니 PC 기반 홈서버로 전환합니다. 저전력·저소음이면서도 충분한 성능을 제공해 여러 서비스를 안정적으로 운영하며, 구매 비용이 단기간에 상쇄되어 총소유비용을 낮춥니다.
2025-08-31 09:00:00 |
44BITS
미니 PC로 서버 운영하기
클라우드와 온프레미스의 높은 월 비용을 줄이기 위해 미니 PC 기반 홈서버로 전환합니다. 저전력·저소음이면서도 충분한 성능을 제공해 여러 서비스를 안정적으로 운영하며, 구매 비용이 단기간에 상쇄되어 총소유비용을 낮춥니다.
2025-08-31 09:00:00 |
44BITS
Kamal2에서 점검(maintenance) 모드 활용법
Kamal2의 점검 모드는 프록시 레이어가 요청을 가로채 서비스 대신 503 응답을 제공해 다운타임 작업을 안전하게 진행하게 합니다. 안내 문구와 커스텀 페이지를 적용해 사용자 경험을 관리할 수 있습니다.
2025-08-27 09:00:00 |
44BITS
Kamal2에서 점검(maintenance) 모드 활용법
Kamal2의 점검 모드는 프록시 레이어가 요청을 가로채 서비스 대신 503 응답을 제공해 다운타임 작업을 안전하게 진행하게 합니다. 안내 문구와 커스텀 페이지를 적용해 사용자 경험을 관리할 수 있습니다.
2025-08-27 09:00:00 |
44BITS
Kamal2에서 점검(maintenance) 모드 활용법
Kamal2의 점검 모드는 프록시 레이어가 요청을 가로채 서비스 대신 503 응답을 제공해 다운타임 작업을 안전하게 진행하게 합니다. 안내 문구와 커스텀 페이지를 적용해 사용자 경험을 관리할 수 있습니다.
2025-08-27 09:00:00 |
44BITS
Anthropic, 기업용 Claude Team/Enterprise에서 Claude Code 지원
Anthropic이 기업용 Team/Enterprise에서 Claude Code를 공식 지원합니다. 프리미엄 시트로 배포하고 조직 정책, 사용량 분석, 지출 상한을 제공해 거버넌스와 예산 통제를 강화하며, 표준 API 요금의 추가 사용으로 확장성을 보장합니다.
2025-08-25 09:00:00 |
44BITS
Anthropic, 기업용 Claude Team/Enterprise에서 Claude Code 지원
Anthropic이 기업용 Team/Enterprise에서 Claude Code를 공식 지원합니다. 프리미엄 시트로 배포하고 조직 정책, 사용량 분석, 지출 상한을 제공해 거버넌스와 예산 통제를 강화하며, 표준 API 요금의 추가 사용으로 확장성을 보장합니다.
2025-08-25 09:00:00 |
44BITS
Anthropic, 기업용 Claude Team/Enterprise에서 Claude Code 지원
Anthropic이 기업용 Team/Enterprise에서 Claude Code를 공식 지원합니다. 프리미엄 시트로 배포하고 조직 정책, 사용량 분석, 지출 상한을 제공해 거버넌스와 예산 통제를 강화하며, 표준 API 요금의 추가 사용으로 확장성을 보장합니다.
2025-08-25 09:00:00 |
44BITS
Django 4.1 릴리스와 주요 변경 사항
2022년 8월 3일에 Django 4.1이 출시되었습니다. 이 글에서는 Django 4.1에 추가된 기능과 바뀐 점을 알아보려 합니다. 릴리스 노트만으로 이해하기가 어려운 기능엔 설명을 조금 보태었습니다.
2022-08-08 09:00:00 |
44BITS
Django 4.1 릴리스와 주요 변경 사항
2022년 8월 3일에 Django 4.1이 출시되었습니다. 이 글에서는 Django 4.1에 추가된 기능과 바뀐 점을 알아보려 합니다. 릴리스 노트만으로 이해하기가 어려운 기능엔 설명을 조금 보태었습니다.
2022-08-08 09:00:00 |
44BITS
도커 컨테이너 5분 만에 무료로 배포하기(feat. fly.io)
fly.io가 제공하는 환경에 도커 컨테이너를 배포해봅니다. 첫 배포까지 5분 정도면 충분하고, 이후 업데이트에는 10초가 채 걸리지 않을 거예요. 게다가 무료 티어 성능도 꽤 좋아요!
2022-08-01 09:00:00 |
44BITS
도커 컨테이너 5분 만에 무료로 배포하기(feat. fly.io)
fly.io가 제공하는 환경에 도커 컨테이너를 배포해봅니다. 첫 배포까지 5분 정도면 충분하고, 이후 업데이트에는 10초가 채 걸리지 않을 거예요. 게다가 무료 티어 성능도 꽤 좋아요!
2022-08-01 09:00:00 |
44BITS
Django 4.0 릴리스와 주요 변경 사항
2021년 12월 7일에 Django 4.0가 출시되었습니다. 이 글에서는 Django 4.0에 추가된 기능과 바뀐 점을 알아보려 합니다. 릴리스 노트만으로 이해하기가 어려운 기능엔 설명을 조금 보태었습니다.
2021-12-31 09:00:00 |
44BITS
Django 4.0 릴리스와 주요 변경 사항
2021년 12월 7일에 Django 4.0가 출시되었습니다. 이 글에서는 Django 4.0에 추가된 기능과 바뀐 점을 알아보려 합니다. 릴리스 노트만으로 이해하기가 어려운 기능엔 설명을 조금 보태었습니다.
2021-12-31 09:00:00 |
44BITS