本文へスキップ
Ztract

はじめに

アカウントを作成し、スキーマを定義し、ドキュメントをアップロードすれば、構造化データが返ってきます。5 分以内、開発者は不要です。

更新日:

はじめる前に

インストールするものは何もありません — Ztract は app.ztract.com でブラウザ上で完結します。CLI も SDK もなく、以下の手順で API を組み込む必要もありません。API については正式提供時に専用ページでご案内します。必要なのは、データを 抽出したいドキュメント — PDF、Word ファイル、Excel シート、スキャン、 スマホ写真 — とメールアドレスだけです。

ステップ 1 — アカウントを作成する

app.ztract.com にアクセスしてください。 メールアドレスを入力すると、ワンタイム認証コードをお送りします — 覚えておく パスワードも、別のサインアップフォームも、クレジットカードも必要ありません。 (Google をお使いですか?Continue with Google がメール欄のすぐ下にあります。) ログインすると、アカウントに 30 ページ無料分 が自動で付与されます。 これをエンジンで自由に試していただいて構いません。勝手にプランへ移行させたり、 営業メールでお知らせしたりすることはありません。

Ztract アカウントを作成

ステップ 2 — 最初のプロジェクトを作成する

Ztract の プロジェクト は、同じスキーマを共有する関連ドキュメントの まとまりです。多くのチームは、ドキュメントの種類ごとに 1 プロジェクト — 「仕入先請求書」「経費領収書」「顧客契約書」 — を用意し、加えて 単発の書類用に 1 プロジェクトを持っています。作成できるプロジェクト数に 上限はありません。

ダッシュボードから 「新規プロジェクト」 をクリックし、名前を付け、 開始用のスキーマを選択してください(スキーマの意味は次のステップで 説明します)。

プロジェクトを作成

ステップ 3 — スキーマを定義する

スキーマ とは、各ドキュメントから Ztract に取り出してほしいフィールドの 一覧です。請求書なら、請求書番号、仕入先、日付、合計、明細行のテーブルなど。 領収書なら、店舗、日付、商品。パスポートなら、氏名、書類番号、有効期限です。

定義方法は 3 通りあります。

  • テンプレートから選ぶ。 請求書、領収書、契約書、身分証など、一般的な ドキュメントタイプ向けのテンプレートを用意しています。1 つクリックし、 チームの用語に合わせてフィールド名を変えたり削除したりして、保存します。
  • 自然な英語で説明する。 たとえば 「各請求書から、請求書番号、仕入先、 合計、品目・数量・単価を含む明細行を抽出して」 のように一文で書きます。 エンジンがその説明からスキーマを下書きし、あとは確認・微調整するだけです。
  • サンプルドキュメントを投げ込む。 実物を見るまでどんなフィールドが あるか分からない場合は、サンプルを 1 つアップロードしてください。エンジンが 読み取り、適切なフィールド名、型、ネスト構造を備えたスキーマを提案します。 あとはそこから調整します。

スキーマの設計 の記事で、どの方法がどんな場面に 最も向くかを詳しく解説しています。

スキーマを設計

ステップ 4 — ドキュメントをアップロードする

スキーマを保存したら、プロジェクトの 「ドキュメント」 タブに移動して、 ファイルを 1 つまたは複数ドラッグしてください。Ztract は PDF、Word (.doc / .docx)、Excel(.xls / .xlsx)、PowerPoint (.ppt / .pptx)、HTML(.mhtml を含む)、TXT、CSV、RTF、OFD、 さらに JPG、PNG、WebP、TIFF、BMP の画像を受け付けます — 1 ファイル最大 500 MB です。サイズ上限、一括アップロード、ファイルが失敗したときの 挙動について詳しくは、ドキュメントのアップロード の記事をご覧ください。

ダッシュボードはファイルが届いた順に処理を進め、進捗をリアルタイムで 表示します。1 ページの書類なら通常数秒で完了します。50 ページの契約書は もう少しかかります。

ステップ 5 — レビューと修正

ドキュメントが完了したら、並列ビューアー で開いてください。元の ドキュメントが左側に、抽出されたすべてのフィールドが右側に表示されます。 フィールドをクリックすると、元書類の対応箇所がハイライトされます。 元書類の任意の領域をクリックすると、対応するフィールドが右側でスクロール されて表示されます。

エンジンが自信を持てなかったフィールドには、信頼度スコアで印が付きます。 誤った値を直すには、クリックして正しい値を入力し、保存するだけです。 修正は即座に反映され、再実行の料金はかかりません。次のエクスポートからは 修正後の値が使われます。詳しくは レビューと修正 をご覧ください。

レビューと修正

ステップ 6 — エクスポート

データが確認できたら、プロジェクトの 「抽出データ」 タブを開いて 「エクスポート」 をクリックします。Excel、CSV、JSON のいずれかを選び、 必要なら解析日範囲で絞り込み、確定します。エクスポートはバックグラウンドで 実行され、準備が整ったら 「エクスポート」 タブからダウンロードできます。 JSON は完全なネスト構造(当事者、明細行など)を保持します。CSV と Excel は 明細行を別の行またはシートに展開します。お好みのツール — Sheets、Excel、 会計ソフト、データウェアハウス — でファイルを開けば、それで完了です。

データをエクスポート

初日に知っておくと便利なこと

  • ダッシュボードはあなたの言語に対応します。 既定は英語ですが、 右上のアバターメニューから 中文、日本語、한국어、Français、Deutsch、 Español、Português に切り替えられます。スキーマテンプレートも それぞれの言語にローカライズされます。
  • 残りページ数はナビゲーションに表示されます。 右上のアンバー色の 「Top up」バッジは、現在のページ残高をリアルタイムで表示し、残りが 少なくなると暖色寄りに変わります。クリックするとパッケージ選択画面に ジャンプします。
  • 再抽出にはページが再度消費されます。 ビューアーでフィールドを編集 するのは無料ですが、同じドキュメントに対してエンジンを再実行する場合 (スキーマを変更した、元書類を直した、もう一度きれいに通したいなど)、 通常のページ単価でページが差し引かれます。 レビューと修正 をご覧ください。

次のステップ

30 ページの無料分を使い切ったら、ページパッケージを購入できます — 一括 購入で、12 か月有効、サブスクリプションはありません。仕組みの詳細は 請求、パッケージ、返金 をご覧ください。ご質問があれば、 support@ztract.com までメールしてください。 窓口は 1 つ、チームも 1 つで、営業日 1 日以内に返信します。

← すべてのドキュメントへ戻る