본문으로 건너뛰기
Ztract

데이터 내보내기

세 가지 형식, 두 가지 단위. 다운스트림 도구가 기대하는 형식을 골라 그대로 떨어뜨리시면 됩니다.

업데이트:

세 가지 형식

Ztract는 추출된 데이터를 세 가지 형식으로 내보냅니다. 다운스트림 도구가 그대로 읽을 수 있는 형식을 선택하세요.

JSON

구조화된 형태입니다. JSON은 스키마의 전체 형태를 — 중첩된 객체, 객체 배열, 문자열 배열을 — 엔진이 반환한 그대로 보존합니다. 다음과 같은 경우에 JSON을 사용하세요.

  • 스크립트나 워크플로를 통해 다른 시스템으로 데이터를 흘려보낼 때.
  • 다운스트림 도구가 JSON을 기본적으로 읽을 때(요즘 대부분의 앱이 그렇습니다).
  • 중첩이 중요할 때(계약서의 당사자들, 공급처 계약의 결제 조건, 라인별 세금이 포함된 라인 아이템).

CSV

평탄한 형태입니다. CSV는 스칼라 필드에 대해 문서당 한 행이며, 라인 아이템이 있을 때는 별도의 CSV로 출력됩니다. 다음과 같은 경우에 CSV를 사용하세요.

  • 데이터베이스, BI 도구, 또는 평탄한 테이블을 기대하는 무언가에 적재할 때.
  • 명령줄 도구(awk / cut / csvkit)에서 작업할 때.
  • 구분자를 만지작거리지 않고도 어떤 스프레드시트에서든 올바르게 열리는 형식이 필요할 때.

중첩된 필드는 점으로 연결된 경로(예: parties_involved.party_1_name) 로 평탄화됩니다.

Excel

스프레드시트 형태입니다. Excel 내보내기는 스키마에 배열이 있을 때 여러 시트를 사용합니다 — 문서 수준 스칼라 필드에 대해 하나의 시트, 각 배열(라인 아이템, 거래 등)당 하나의 시트. 헤더는 사람이 읽기 좋게 표시됩니다. 다음과 같은 경우에 Excel을 사용하세요.

  • 받는 사람이 비기술 사용자라 파일을 직접 열어볼 때.
  • 추출된 데이터를 다른 사람에게 보내기 전에 수식과 결합해야 할 때.

어디에서 내보내는지

프로젝트를 열고 추출 데이터 탭으로 전환한 뒤 내보내기를 클릭하세요. 형식을 고르고, 필요하다면 파싱 날짜 범위로 좁히고, 확인하시면 됩니다. 내보내기는 프로젝트 단위입니다 — 파일에는 날짜 필터에 해당하는 그 프로젝트의 모든 파싱된 문서가 들어갑니다.

내보내기는 어떻게 만들어지는지

내보내기는 직접 다운로드가 아니라 백그라운드 작업으로 실행됩니다. 내보내기를 클릭하면, 작업은 프로젝트의 내보내기 기록 탭에 세 가지 상태 중 하나로 나타납니다.

  • 대기 중 — 워커가 작업을 가져가기를 기다리는 중입니다.
  • 처리 중 — 파일을 빌드하고 있습니다.
  • 준비 완료 — 완료되었습니다. 클릭해서 다운로드하세요.

대시보드가 큐를 자동으로 폴링하므로 새로 고치실 필요가 없습니다. 작은 프로젝트라면 파일은 보통 몇 초 안에 준비되고, 문서가 수천 개인 프로젝트라면 몇 분이 걸릴 수 있습니다. 대시보드를 닫았다가 나중에 다시 오셔도 됩니다 — 파일은 프로젝트를 삭제하기 전까지 계속 이용할 수 있습니다.

각 형식에 무엇이 담기는지

  • JSON: 문서 객체의 배열, 각 객체가 스키마와 일치합니다 — 중첩된 객체, 객체 배열, 문자열 배열은 그대로 보존됩니다.
  • CSV: 파싱된 문서마다 한 행(페이지 단위 모드에서는 파싱된 페이지마다 한 행)인 평탄한 레이아웃. 중첩된 필드는 점 경로로 표현됩니다.
  • Excel: CSV와 동일한 평탄한 형태의 워크북 하나로, 바로 열어볼 수 있도록 서식이 맞춰져 있습니다.

모든 내보내기는 가장 최근 수정 사항을 반영합니다 — 나란히 보기 뷰어에서 어떤 값을 수정하셨다면, 내보내기는 자동으로 수정된 값을 사용합니다(수정은 원본 추출 위에 오버레이로 저장되며, 엔진을 다시 돌리지 않습니다).

검토와 내보내기를 반복하기

자주 쓰이는 흐름입니다.

  1. 1차 추출(엔진).
  2. 신뢰도 표시가 된 필드를 살펴보고, 필요하면 수정합니다.
  3. 내보내기를 실행하고, 파일을 사용합니다.
  4. 빠뜨린 값을 발견하셨나요? 수정하세요. 다시 내보내기 하세요. 무료입니다 — 엔진 재실행은 페이지를 소모하지만, 새 내보내기 작업은 그렇지 않습니다.

API 내보내기

HTTP API를 통한 프로그래밍 방식 내보내기는 로드맵에 있습니다. 오늘날 모든 내보내기는 대시보드를 통해 이루어집니다. API 접근이 병목이고 출시되는 즉시 안내받고 싶으시다면 [support@ztract.com](mailto:support@ztract.com?subject=API early access) 으로 이메일을 보내주세요.

← 전체 문서로 돌아가기