데이터 내보내기
세 가지 형식, 두 가지 단위. 다운스트림 도구가 기대하는 형식을 골라 그대로 떨어뜨리시면 됩니다.
업데이트:
세 가지 형식
Ztract는 추출된 데이터를 세 가지 형식으로 내보냅니다. 다운스트림 도구가 그대로 읽을 수 있는 형식을 선택하세요.
JSON
구조화된 형태입니다. JSON은 스키마의 전체 형태를 — 중첩된 객체, 객체 배열, 문자열 배열을 — 엔진이 반환한 그대로 보존합니다. 다음과 같은 경우에 JSON을 사용하세요.
- 스크립트나 워크플로를 통해 다른 시스템으로 데이터를 흘려보낼 때.
- 다운스트림 도구가 JSON을 기본적으로 읽을 때(요즘 대부분의 앱이 그렇습니다).
- 중첩이 중요할 때(계약서의 당사자들, 공급처 계약의 결제 조건, 라인별 세금이 포함된 라인 아이템).
CSV
평탄한 형태입니다. CSV는 스칼라 필드에 대해 문서당 한 행이며, 라인 아이템이 있을 때는 별도의 CSV로 출력됩니다. 다음과 같은 경우에 CSV를 사용하세요.
- 데이터베이스, BI 도구, 또는 평탄한 테이블을 기대하는 무언가에 적재할 때.
- 명령줄 도구(
awk/cut/csvkit)에서 작업할 때. - 구분자를 만지작거리지 않고도 어떤 스프레드시트에서든 올바르게 열리는 형식이 필요할 때.
중첩된 필드는 점으로 연결된 경로(예: parties_involved.party_1_name)
로 평탄화됩니다.
Excel
스프레드시트 형태입니다. Excel 내보내기는 스키마에 배열이 있을 때 여러 시트를 사용합니다 — 문서 수준 스칼라 필드에 대해 하나의 시트, 각 배열(라인 아이템, 거래 등)당 하나의 시트. 헤더는 사람이 읽기 좋게 표시됩니다. 다음과 같은 경우에 Excel을 사용하세요.
- 받는 사람이 비기술 사용자라 파일을 직접 열어볼 때.
- 추출된 데이터를 다른 사람에게 보내기 전에 수식과 결합해야 할 때.
어디에서 내보내는지
프로젝트를 열고 추출 데이터 탭으로 전환한 뒤 내보내기를 클릭하세요. 형식을 고르고, 필요하다면 파싱 날짜 범위로 좁히고, 확인하시면 됩니다. 내보내기는 프로젝트 단위입니다 — 파일에는 날짜 필터에 해당하는 그 프로젝트의 모든 파싱된 문서가 들어갑니다.
내보내기는 어떻게 만들어지는지
내보내기는 직접 다운로드가 아니라 백그라운드 작업으로 실행됩니다. 내보내기를 클릭하면, 작업은 프로젝트의 내보내기 기록 탭에 세 가지 상태 중 하나로 나타납니다.
- 대기 중 — 워커가 작업을 가져가기를 기다리는 중입니다.
- 처리 중 — 파일을 빌드하고 있습니다.
- 준비 완료 — 완료되었습니다. 클릭해서 다운로드하세요.
대시보드가 큐를 자동으로 폴링하므로 새로 고치실 필요가 없습니다. 작은 프로젝트라면 파일은 보통 몇 초 안에 준비되고, 문서가 수천 개인 프로젝트라면 몇 분이 걸릴 수 있습니다. 대시보드를 닫았다가 나중에 다시 오셔도 됩니다 — 파일은 프로젝트를 삭제하기 전까지 계속 이용할 수 있습니다.
각 형식에 무엇이 담기는지
- JSON: 문서 객체의 배열, 각 객체가 스키마와 일치합니다 — 중첩된 객체, 객체 배열, 문자열 배열은 그대로 보존됩니다.
- CSV: 파싱된 문서마다 한 행(페이지 단위 모드에서는 파싱된 페이지마다 한 행)인 평탄한 레이아웃. 중첩된 필드는 점 경로로 표현됩니다.
- Excel: CSV와 동일한 평탄한 형태의 워크북 하나로, 바로 열어볼 수 있도록 서식이 맞춰져 있습니다.
모든 내보내기는 가장 최근 수정 사항을 반영합니다 — 나란히 보기 뷰어에서 어떤 값을 수정하셨다면, 내보내기는 자동으로 수정된 값을 사용합니다(수정은 원본 추출 위에 오버레이로 저장되며, 엔진을 다시 돌리지 않습니다).
검토와 내보내기를 반복하기
자주 쓰이는 흐름입니다.
- 1차 추출(엔진).
- 신뢰도 표시가 된 필드를 살펴보고, 필요하면 수정합니다.
- 내보내기를 실행하고, 파일을 사용합니다.
- 빠뜨린 값을 발견하셨나요? 수정하세요. 다시 내보내기 하세요. 무료입니다 — 엔진 재실행은 페이지를 소모하지만, 새 내보내기 작업은 그렇지 않습니다.
API 내보내기
HTTP API를 통한 프로그래밍 방식 내보내기는 로드맵에 있습니다. 오늘날 모든 내보내기는 대시보드를 통해 이루어집니다. API 접근이 병목이고 출시되는 즉시 안내받고 싶으시다면 [support@ztract.com](mailto:support@ztract.com?subject=API early access) 으로 이메일을 보내주세요.