プレスリリース

日本語に特化したAI文書画像解析エンジン「YomiToku」を提供するMLism株式会社と業務提携を開始

2025/2/13

AI文書画像解析エンジン×新規事業開発支援サービスで多様なAI活用ニーズをサポート

 事業共創カンパニーである株式会社Relic(本社:東京都渋谷区、代表取締役CEO:北嶋 貴朗、以下「Relic」)とMLism 株式会社(本社:千葉県柏市、代表取締役:⽊之下 滉⼤郎、以下「MLism」)は業務提携を開始し、Relicが、AI-OCRツール「YomiToku」の販売パートナーに就任したことをお知らせします。
 「YomiToku」は日本語文書の解析に特化したAIによる文書画像解析エンジンで、PDFやカメラで撮影した文書画像から、文字情報や図表を高精度に認識・抽出・変換することが可能です。
 本提携により、Relicが提供するAI/LLMを活用した新規事業開発支援サービスに加え、「YomiToku」の販売・サポートも提供できることで、多様なAI活用ニーズに応えてまいります。

■日本語文書の解析に特化したAIによる文書画像解析エンジン「YomiToku」の概要

 「YomiToku」は日本語文書画像解析に特化したPythonパッケージです。​独自に構築した日本語特化AIで文書画像を解析し、文書内の文字の文字起こし、図やグラフの検出、表を認識し、これまで難しかった画像内の情報を抽出し、解析を高精度に​実現します。お客様の環境のサーバーに組み込み可能であり、機密性の高い情報をお客様の自社環境内で解析可能です。

<文書解析の例>

出典:「広報誌 令和 6 年 7 月号」:(総務省) を加工して作成

<特徴>

1. 独自開発のAIモデルを搭載

YomiTokuには、MLismが独自に構築したデータセットを用いて学習した4種類のAIモデルが搭載されています。これにより、日本語の文書に対して高精度な文字起こしとレイアウト解析を実現します。

2. 複雑なレイアウトにも対応

文字数の多い文書や細かい文字を含む文書、さらには縦書きの文書に対しても、高精度な認識が可能です。

3. 文書レイアウト解析機能

文書画像のレイアウト解析AIを活用し、文書に含まれる図表、画像、段落などの構成要素の位置を正確に特定します。また、表の構造解析AIにより、従来の画像処理では困難だったセル結合が含まれる表やセルの区切り罫線がない表に対しても、表構造を適切に認識し、出力することが可能です。

4. 豊富なエクスポート機能

解析した文書データは、HTML、Markdown、CSV、JSON形式で出力できます。また、抽出した画像やグラフを個別のファイルとして保存することも可能です。

5. サーバー組み込み型で高いセキュリティを確保

YomiTokuは、サーバー組み込み型のパッケージとして提供されます。これにより、個人情報や機密情報を含む文書画像を、外部ネットワークを介さずに自社サーバー内でセキュアかつ効率的に解析することが可能です。クラウド、オンプレミス、閉域ネットワーク環境のいずれにも対応し、軽量なモデルを採用しているため、CPUサーバーでも動作します。

詳細は下記よりお問い合わせください。

■参考:RelicのAI/LLMに関する取り組み

・AI/LLMを活用した新規事業開発やDXをビジネス/技術開発の両面から支援する専門組織「AI Transformation Group」を新設

・AI/LLMを活用した新規事業やプロダクト開発を支援するソリューション「AI Transformation Studio」https://prtimes.jp/main/html/rd/p/000000307.000016318.html

・先端テクノロジー研究開発専門組織を発足https://prtimes.jp/main/html/rd/p/000000202.000016318.html

■MLism 株式会社 会社概要

会社名:MLism 株式会社  
代表者:代表取締役 ⽊之下 滉⼤郎
本社所在地:千葉県柏市若柴178番地4 柏の葉キャンパス148街区2 ショップ&オフィス棟6F 
設立:2024年12月
事業内容:アルゴリズムの研究・開発およびライセンスの販売、提供
コーポレートサイト:https://www.mlism.com/