Ztract를 소개합니다 — 그리고 우리가 만들고 있는 것
컴퓨터가 충분히 읽어낼 수 있는 문서에서 사람들이 데이터를 다시 타이핑하는 모습을 계속 지켜보다가, 그래서 Ztract를 시작했습니다. 지금 출시한 것, 아직 넣지 않은 것에 대한 이야기입니다.
- intro
매입 담당 직원이 공급처 이름, 날짜, 라인 아이템을 스프레드시트에 하나하나 입력하는 모습을 본 적이 있으시다면, 우리가 왜 Ztract를 만들었는지 이미 아시는 셈입니다. 그런 문서를 읽어내는 기술은 몇 년 전부터 충분히 좋은 수준이었습니다. 빠진 것은 엔지니어가 아닌 사람도 오후 한 나절이면 실제로 세팅할 수 있는 도구 — 그리고 청구서를 깜짝 비용으로 덮어버리지 않는 공급자였습니다.
지난주에 Ztract의 첫 번째 버전을 출시했습니다. 그 안에 무엇이 들어 있는지, 무엇이 들어 있지 않은지, 다음으로 무엇을 만들고 있는지를 정리해 보았습니다.
오늘 박스 안에 들어 있는 것
문서를 업로드합니다 — PDF, Office 파일, 이미지, 스캔본, 휴대폰 사진. 추출하고 싶은 필드는 세 가지 방식으로 정의할 수 있습니다.
- 송장, 영수증, 계약서, 신분증, 이력서, 검사 보고서, 통관 서류 등에 대해 준비된 스키마 중 하나를 고릅니다.
- 일상 언어로 필드를 설명합니다: “각 송장에서 송장 번호, 공급처, 합계, 그리고 품목 설명·수량·단가가 포함된 라인 아이템을 추출.”
- 샘플 문서 한 장을 끌어다 놓고 엔진이 거기서 스키마를 추론하게 합니다 — 어떤 필드가 있는지 한 건을 보기 전까지는 모를 때 유용합니다.
그러면 구조화된 JSON, CSV, Excel이 돌아오며, 추출된 모든 값은 원본 문서상의 위치에 고정됩니다. 잘못된 부분이 있으면 한 번의 클릭으로 고치면 됩니다. 그 부분에는 비용을 청구하지 않습니다 — 페이지를 차감하는 것은 추출 시점이지, 그 이후의 수정 작업이 아닙니다.
아직 박스 안에 들어 있지 않은 것
우리는 대시보드 중심입니다. 아직 HTTP API도, Webhook도, Zapier 커넥터도 없습니다. 이 모든 것은 로드맵에 있으며, 출시되면 별도로 글을 쓰겠습니다. 다중 좌석 팀 워크스페이스도 로드맵에 있습니다 — 현재 Ztract 계정은 모두 단일 사용자입니다.
영업팀은 없습니다. 받은편지함도 하나 — support@ztract.com — 그 뒤에 있는 팀도 하나입니다. 볼륨 가격, 엔터프라이즈 계약, 우리가 만들고 있지 않은 기능에 대해 이야기하고 싶으시다면, 이 주소로 보내주세요.
가격, 짧게
일회성 페이지 패키지를 구매합니다. 그 페이지를 다음 12개월 동안 사용합니다. 어떤 것도 반복되지 않고, 어떤 것도 갱신되지 않습니다. 사용하지 않으셨다면 청구되는 것도 없습니다. 신규 계정에는 30페이지 무료가 자동으로 적립되어, 신용카드 없이 시험해보실 수 있습니다.
“14일 무료 후 구독에 가두는” 모델은 운영하지 않습니다. 가격은 가격 페이지에 평범한 숫자로 적혀 있으며, 가장 작은 패키지는 $20 미만에서 시작합니다.
데이터에 대한 한 마디
업로드하신 문서로 모델을 학습시키지 않습니다. 우리 자체 엔진도 그렇고, 우리가 거쳐 가는 서드파티 LLM도 그렇습니다. 우리가 사용하는 상용 API(OpenAI, Anthropic, Google)는 API로 제출된 데이터에 대한 학습을 금지하며, 우리는 그 약속에 의존합니다. 문서를 삭제하시면 — 활성 저장소에서는 즉시, 백업에서는 14일 이내에 — 삭제됩니다.
정식 형태로 보고 싶으시다면, 개인정보 처리방침과 데이터 처리 계약에 모든 내용이 자세히 적혀 있습니다.
우리가 정말로 듣고 싶은 피드백
세 가지입니다. 도움이 되는 순서대로 적었습니다.
- 잘못 처리한 문서. 우리가 다뤄야 할 레이아웃인데 값이 누락되거나 잘못 배치된 채로 돌아왔다면, 정말로 한 번 보고 싶습니다. (필요하다면 익명화한) 샘플을 이메일로 보내주시면 파고들겠습니다.
- 스키마 설계 흐름. 엔지니어가 아닌 분에게도 스키마 만들기가 당연하게 느껴지도록 무척 공들였습니다. 헷갈리는 지점이 있었다면 알려주세요.
- 본격적인 볼륨으로 쓰기에 부족한 것이 무엇인지. 모든 것을 만들 수는 없지만, 그 간격을 직접 듣는 편이 추측하는 것보다 낫습니다.
어느 쪽이든 — 한번 써봐 주셔서 감사합니다. 앞으로 더 많은 것이 다가옵니다.