본문으로 건너뛰기

비용 절감을 위한 Tip!

카페24 LLM Router를 사용하면서 비용을 더 효율적으로 관리할 수 있는 4가지 방법을 안내해 드립니다. 각 기능은 별도 설정 없이 자동으로 적용되거나, 콘솔에서 간단히 켜기만 하면 사용할 수 있습니다.

1. 실패 호출은 과금되지 않습니다 (ZCI)

AI가 답변에 실패해도 별도 요금은 청구되지 않습니다. ZCI(Zero Completion Insurance)라는 정책이 자동으로 적용되어, 다음 경우에는 크레딧이 차감되지 않습니다.

  • AI가 답변을 한 글자도 못 만들고 끝난 경우
  • 오류로 인해 응답이 실패한 경우
  • 여러 모델을 차례로 시도(폴백)했는데 모두 실패한 경우
  • 중간에 실패한 시도들 — 최종적으로 성공한 모델 비용만 차감

별도로 신청하거나 설정할 필요 없이 모든 계정에 자동 적용되니, 안심하고 사용하시면 됩니다.

2. 반복 질문은 캐시로 비용 절감

같은 질문을 자주 받는 챗봇을 만든다면, 시맨틱 캐시 기능을 활용해 비용을 절감할 수 있습니다. 콘솔의 API 키 관리에서 캐시를 켜두면, 의미가 비슷한 질문에 이전 답변을 재사용해서 추가 비용 없이 응답합니다.

  • 유사도 임계값을 조정해 어디까지를 "비슷한 질문"으로 볼지 정할 수 있습니다 (권장값 0.90).
  • 요청 길이 5,000자 이하인 경우에만 저장·사용되며, TTL은 24시간입니다.

FAQ 챗봇, 상품 안내 챗봇 등 비슷한 질문이 반복되는 서비스에 특히 효과가 큽니다.

3. 예산 알림과 키 한도

예산을 넘어 쓰지 않도록 알림을 받을 수 있습니다. 콘솔 계정 설정 → 알림 설정에서 다음 알림을 켤 수 있습니다 (기본값 모두 ON).

  • 크레딧 잔액 부족 알림 — 설정한 금액(예: ₩100,000) 이하로 떨어지면 알려드림
  • 자동 충전 실패 알림 — 자동 결제가 실패했을 때
  • 에러 응답 알림 — 모든 폴백이 실패하여 최종 에러가 반환됐을 때

또한 API 키마다 크레딧 한도를 정해두면 (예: 이 키는 월 ₩10,000까지만), 한도를 넘기지 않도록 자동으로 막아줍니다.

4. 보유 중인 외부 키로 BYOK 활용

이미 가입한 OpenAI·Anthropic·Google 등의 키가 있다면, BYOK(Bring Your Own Key)라는 기능을 통해 본인이 보유한 키를 등록해 사용할 수 있습니다. 이 경우 모델 호출 비용은 카페24 크레딧이 아니라 본인의 Provider 계정으로 직접 청구됩니다.

편리한 라우터 UI(여러 모델 비교·로그·대시보드)는 그대로 쓰면서, 비용은 직접 통제하고 싶을 때 유용합니다.

BYOK 호출은 월 1만 건까지는 추가 수수료가 없으며, 1만 건을 초과한 호출부터는 모델 토큰 가격의 3%가 수수료로 부과됩니다.