본문으로 건너뛰기
Ztract

Ztract를 소개합니다 — 그리고 우리가 만들고 있는 것

컴퓨터가 충분히 읽어낼 수 있는 문서에서 사람들이 데이터를 다시 타이핑하는 모습을 계속 지켜보다가, 그래서 Ztract를 시작했습니다. 지금 출시한 것, 아직 넣지 않은 것에 대한 이야기입니다.

Ztract 팀 3 min read
  • intro
종이 영수증과 송장이 잔뜩 쌓인 책상과 열려 있는 노트북 — 문서 추출 제품을 만들게 만드는 바로 그런 더미입니다.

매입 담당 직원이 공급처 이름, 날짜, 라인 아이템을 스프레드시트에 하나하나 입력하는 모습을 본 적이 있으시다면, 우리가 왜 Ztract를 만들었는지 이미 아시는 셈입니다. 그런 문서를 읽어내는 기술은 몇 년 전부터 충분히 좋은 수준이었습니다. 빠진 것은 엔지니어가 아닌 사람도 오후 한 나절이면 실제로 세팅할 수 있는 도구 — 그리고 청구서를 깜짝 비용으로 덮어버리지 않는 공급자였습니다.

지난주에 Ztract의 첫 번째 버전을 출시했습니다. 그 안에 무엇이 들어 있는지, 무엇이 들어 있지 않은지, 다음으로 무엇을 만들고 있는지를 정리해 보았습니다.

오늘 박스 안에 들어 있는 것

문서를 업로드합니다 — PDF, Office 파일, 이미지, 스캔본, 휴대폰 사진. 추출하고 싶은 필드는 세 가지 방식으로 정의할 수 있습니다.

  • 송장, 영수증, 계약서, 신분증, 이력서, 검사 보고서, 통관 서류 등에 대해 준비된 스키마 중 하나를 고릅니다.
  • 일상 언어로 필드를 설명합니다: “각 송장에서 송장 번호, 공급처, 합계, 그리고 품목 설명·수량·단가가 포함된 라인 아이템을 추출.”
  • 샘플 문서 한 장을 끌어다 놓고 엔진이 거기서 스키마를 추론하게 합니다 — 어떤 필드가 있는지 한 건을 보기 전까지는 모를 때 유용합니다.

그러면 구조화된 JSON, CSV, Excel이 돌아오며, 추출된 모든 값은 원본 문서상의 위치에 고정됩니다. 잘못된 부분이 있으면 한 번의 클릭으로 고치면 됩니다. 그 부분에는 비용을 청구하지 않습니다 — 페이지를 차감하는 것은 추출 시점이지, 그 이후의 수정 작업이 아닙니다.

아직 박스 안에 들어 있지 않은 것

우리는 대시보드 중심입니다. 아직 HTTP API도, Webhook도, Zapier 커넥터도 없습니다. 이 모든 것은 로드맵에 있으며, 출시되면 별도로 글을 쓰겠습니다. 다중 좌석 팀 워크스페이스도 로드맵에 있습니다 — 현재 Ztract 계정은 모두 단일 사용자입니다.

영업팀은 없습니다. 받은편지함도 하나 — support@ztract.com — 그 뒤에 있는 팀도 하나입니다. 볼륨 가격, 엔터프라이즈 계약, 우리가 만들고 있지 않은 기능에 대해 이야기하고 싶으시다면, 이 주소로 보내주세요.

가격, 짧게

일회성 페이지 패키지를 구매합니다. 그 페이지를 다음 12개월 동안 사용합니다. 어떤 것도 반복되지 않고, 어떤 것도 갱신되지 않습니다. 사용하지 않으셨다면 청구되는 것도 없습니다. 신규 계정에는 30페이지 무료가 자동으로 적립되어, 신용카드 없이 시험해보실 수 있습니다.

“14일 무료 후 구독에 가두는” 모델은 운영하지 않습니다. 가격은 가격 페이지에 평범한 숫자로 적혀 있으며, 가장 작은 패키지는 $20 미만에서 시작합니다.

데이터에 대한 한 마디

업로드하신 문서로 모델을 학습시키지 않습니다. 우리 자체 엔진도 그렇고, 우리가 거쳐 가는 서드파티 LLM도 그렇습니다. 우리가 사용하는 상용 API(OpenAI, Anthropic, Google)는 API로 제출된 데이터에 대한 학습을 금지하며, 우리는 그 약속에 의존합니다. 문서를 삭제하시면 — 활성 저장소에서는 즉시, 백업에서는 14일 이내에 — 삭제됩니다.

정식 형태로 보고 싶으시다면, 개인정보 처리방침데이터 처리 계약에 모든 내용이 자세히 적혀 있습니다.

우리가 정말로 듣고 싶은 피드백

세 가지입니다. 도움이 되는 순서대로 적었습니다.

  1. 잘못 처리한 문서. 우리가 다뤄야 할 레이아웃인데 값이 누락되거나 잘못 배치된 채로 돌아왔다면, 정말로 한 번 보고 싶습니다. (필요하다면 익명화한) 샘플을 이메일로 보내주시면 파고들겠습니다.
  2. 스키마 설계 흐름. 엔지니어가 아닌 분에게도 스키마 만들기가 당연하게 느껴지도록 무척 공들였습니다. 헷갈리는 지점이 있었다면 알려주세요.
  3. 본격적인 볼륨으로 쓰기에 부족한 것이 무엇인지. 모든 것을 만들 수는 없지만, 그 간격을 직접 듣는 편이 추측하는 것보다 낫습니다.

어느 쪽이든 — 한번 써봐 주셔서 감사합니다. 앞으로 더 많은 것이 다가옵니다.

← Back to all posts