プロダクトの利便性を高める機械学習活用事例~高精度なAI-OCR開発の取り組み~

PROFILE

田代 克浩

技術推進課 テックリード

数社のAIベンチャーでテックリードを務め、画像、自然言語、数値データ等の多様なデータを扱うプロジェクトを多数経験。モデル作成だけでなく、システムへの組み込みまでを担当し、導入に導いてきた実績を持つ。2021年に1人目のAIエンジニアとして当社に入社し、AI導入による顧客価値向上に取り組んでいる。

ラクスでの機械学習の活用事例をご紹介します。

当社が提供する経費精算プロダクト「楽楽精算」には、領収書を撮影すると日付、金額、取引先、事業者登録番号といった項目を読み取り、表示させるAI-OCR(Optical Character Recognition/Reader、光学的文字認識)が利用されています。楽楽精算をご利用いただくお客様も順調に増えており、読み取り精度のさらなる向上を目指しAI-OCRのエンジン開発プロジェクトがスタートしました。

まずはラクス社内のデータを利用し、小さく試す

領収書を読み取るためには、領収書に一般的に記載されている項目をシステムが認識する必要があります。これらを精度高く読み取るためには、大量の領収書データからパターンを学習する必要があります。

そこで、ラクス社内の領収書約9,000枚のデータを用いてPoCを実施しました。ここでは用途別(物品購入、交通費、宿泊)、手書き、税率、異なる日時フォーマット、文字のカスレ、傾き、折れ曲がりなど、さまざまな条件に対応できるかを検証しました。

その結果、一定の精度が確認できたため、本格的に開発を開始することになりました。

本格的な開発開始

機能開発の前に楽楽精算事業部、インフラ開発部の協力を得て、さらに領収書のデータを収集・抽出しました。セキュリティが確保された部屋でアノテーションを行い、膨大なデータから1年かけて教師データを作成していきました。

リリース

何度かの検証を経て十分な精度とコストパフォーマンスが得られたため、正式リリースとなりました。機械学習システムは一度のリリースで完結するものではなく、今後も継続的なアップデートや改善が必要です。
ユーザの現場での利用状況やフィードバックに基づき、より良いサービスにしていきたいと考えています。

Back to list