pile·
AI / ML·데보션 (SK)데보션 (SK)·

EfficientDet-Lite0 모델을 활용한 실시간 객체 탐지 (Raspberry Pi 5)

문제라즈베리파이 5 같은 엣지 디바이스에서 객체 탐지 모델을 실시간으로 돌리려면, 풀스펙 딥러닝 모델은 너무 무거워 추론 속도·메모리·전력 모두에서 제약이 생긴다.
접근TensorFlow Lite용 EfficientDet-Lite0(COCO 80 클래스) 모델을 PiCamera2와 함께 라즈베리파이 5에 올렸다. 32bit float 가중치를 8bit uint8로 양자화해 모델 크기를 약 1/4로 줄였고, TFLite Interpreter가 전처리 시 입력 타입 변환을 자동 처리한다. 카메라 프레임을 받아 추론 → 박스/라벨 오버레이 → FPS 계측까지 한 루프로 묶고, confidence threshold(기본 0.5)도 조절할 수 있게 했다.
결과라이브 카메라 피드에서 실시간 객체 탐지가 동작했고, FPS가 화면에 함께 출력돼 성능을 즉시 확인할 수 있었다. 양자화 + 경량 모델 조합으로 엣지 디바이스에서 COCO 80 클래스 탐지를 실용 수준으로 돌리는 레퍼런스가 만들어졌다.
데보션 (SK)
데보션 (SK) 블로그
원문은 여기서 이어서 읽을 수 있어요
원문 읽기
읽음 (0)

이 글과 비슷한

  1. AI / ML·인프랩 (인프런)인프런 (인프랩)·

    학습 에이전트 — AI 두뇌 구축하기

    인프런이 강의 학습 에이전트를 구축하며 겪은 기술 스택 선정, 컨텍스트·도구 설계, LLM-as-a-Judge 품질 개선, 비용 최적화 전략을 다룬다. LLM SSE 스트리밍 처리를 위해 Spring MVC + Virtual Thread + Spring AI를 선택하고, 명시적 프롬프트 캐싱으로 입력 토큰을 90% 절감하는 과정까지 실전 경험이 담겨 있다.

    #ai-agent#llm#llm-as-a-judge+2
  2. AI / ML·vercel-blogVercel Blog·

    AI Gateway에서 실시간 음성 에이전트 구축하기

    Vercel AI Gateway가 음성·오디오 기능을 정식 지원한다. 실시간 대화 음성(Realtime Voice), 텍스트→음성(TTS), 음성→텍스트(STT) 세 가지를 기존 텍스트/이미지 모델과 동일한 라우팅·인증·모니터링 체계 위에서 사용할 수 있다. OpenAI gpt-realtime-2·Whisper와 xAI Grok 오디오 모델을 지원하며, AI SDK 7 베타로 제공된다.

    #llm-app#ai-sdk#realtime-voice+2
  3. AI / ML·dropbox-techDropbox Tech·

    DSPy로 AI 평가를 더 나은 응답으로 전환하기 — Dropbox Dash Chat 사례

    Dropbox가 Dash Chat 에이전트의 응답 품질을 높이기 위해 DSPy 최적화 프레임워크를 도입한 과정을 다룬다. 인간 레이블로 LLM 평가자(judge)를 보정하고, 보정된 judge로 에이전트의 시스템 프롬프트를 자동 최적화하는 두 단계 전략으로 불완전 답변 26% 감소와 토큰 사용 5.4% 절감을 달성했다.

    #ai-agent#llm-evaluation#dspy+2